リンゴとミカンを比べるな

投資信託などの評価に際して、或いは、ファンドマネージャーの腕を評価するに当たって、過去の運用パフォーマンスを見ることがしばしば行われる。

その有効性については後で改めて論じるが、現実に運用された結果が対象であるだけに、投資家にとって、過去のパフォーマンス評価は、関心もあれば相当の説得力も持つデータのようだ。

しかし、残念なことに、パフォーマンス評価はしばしば間違った(論理的に正しくないという意味で)方法で行われることが多い。たとえば、「シャープ・レシオ」で一律にファンドの優劣を比較することなどがその典型例だ。

書名は挙げないが、筆者は、他のファンドに勝つ投資信託を選ぶ方法を教えるとの触れ込みの本を見たら、シャープ・レシオでファンドを比較することを勧めていて、大いに驚いたことがある。

パフォーマンス評価に関する誤解の多くは、パフォーマンス評価が、過去の何をどのような意味で評価しようとしているのかに関する「理屈」が正しく理解されていないことに起因すると思われる。

本稿では、パフォーマンス評価に関する最低限の基礎知識をコンパクトにまとめることを目指すことにする。

パフォーマンス評価で大切な心得を三つあげるとすると、

  1. 裁量の対象が同じものを比べる
  2. 運用期間中に取った「リスク」を考慮して評価する
  3. 結果をそのまま将来にあてはめない

の三点だろう。

第一番目の心得は、俗に「リンゴはリンゴと、ミカンはミカンと比べよ」などと表現される原則だ。

例を挙げて簡単にいうと、たとえば同じ期間であっても、日本株のファンドと、米国株のファンドを直接的に運用利回りで比較してはいけないということだ。どちらの利回りも12%だったとして、市場平均でみて日本株のパフォーマンスが5%、米国株では10%だとすれば、日本株ファンドの運用者の方が「良くやっている」といえる可能性が大きいことはお分かりいただけるだろう。厳密には、同じ日本株100%のファンドでも、運用の目的や最初に定められた運用ルールが異なると、異なるファンドのパフォーマンスを直接的に比較することはフェアではない(この事情は、ファンドマネージャーをやってみると実感を伴って良く分かる)。

運用に詳しくない第三者が比較する場合であっても、せめて、運用対象とする資産カテゴリーは同じものどうしを比べないと、運用者が可哀相だ。

「シャープ・レシオ」は役に立たない

二番目のリスクを考慮せよという原則は、以下のような例を考えると分かりやすいのではないか。

共に日本株の運用だが、たまたま一銘柄に投資していたA氏と数百銘柄に分散投資しているファンドマネージャーB氏が一年間運用して、A氏の運用利回りが15%、B氏が13%の場合、A氏の方が運用の腕がいいと言っていいだろうか。

仮に日本株の市場平均のパフォーマンスが10%だとすると、二人とも幸運であることは確かだが、A氏はおそらく平均的には10数%の勝ち負けがあってもおかしくないリスクを取って市場平均に5%勝ったのに対して、B氏は市場平均に対する平均的な勝ち負けが2~3%に収まるようなリスクの中で3%勝ったのかも知れない。この場合、B氏の方が運用の腕はいい(あくまでもパフォーマンス評価の典型的な仮定の中でだが)といえる公算が大きいだろう。

運用パフォーマンスに関して、プロのファンドマネージャーは、「幸運な素人にはとてもかなわない」という感想を抱くが、これは、上記のような事情によるものだ。

運用のリスクをパフォーマンス評価に反映させる尺度として有名なものには、以下のようなものがある。

  • 「シャープ・レシオ」 = (ファンドのリターン - リスクフリー金利) / (ファンド全体のリスク)
  • 「インフォメーション・レシオ」 = (ファンドのリターン - ベンチマークのリターン) / (ファンドのベンチマークに対する相対的なリスク)
  • 「トレイナーの尺度」 = (ファンドのリターン) - (ファンドのベータ値) × (マーケットのリターン)

の三つが頻繁に使われるパフォーマンス評価の尺度だ。

ファンドマネージャーの立場から見ると、ベンチマークに対して取ったリスク一単位当たりに稼いだ追加的なリターンで評価される、インフォメーション・レシオが概ね最も納得的な指標だろう。但しこの場合、株式運用でいうと、キャッシュポジションを持ったり、先物を買い立てしたりといった、ベンチマークのリスクの大小によるベンチマークに対する相対リスクも、銘柄選択等による相対リスクも同等に許容することになるので、評価を使用する側(ファンドマネージャーを雇う側)では注意が必要だ。

シャープ・レシオは、これをインフォメーション・レシオの文脈で解釈すると「キャッシュ・ポートフォリオ」をベンチマークとするインフォメーション・レシオに相当する。シャープ・レシオで評価される場合、ファンドマネージャーが全く何の制約もなく運用できるなら一応はフェアだといえるかも知れないが、「日本株とキャッシュで」、「内外の株式と債券を半々くらいに」、「内外の株式を中心に」といった運用資金に期待される性格や制約が少しでもあると、ファンドマネージャーにとってフェアではないし、評価の尺度としても正確ではない。

トレイナーの尺度は、たとえば、複数の運用者を使う年金基金が、ポートフォリオ全体のベータ値を全体として管理している場合に、個々のファンドマネージャーの貢献を評価する上で便利だといえる。但し、現実には、ベータ値そのものが安定したものではないので、実用性の上では疑問が残る。

運用者が実際に裁量を持って動かしている部分のリスク当たりの追加リターン獲得効率を評価しなければ意味が無いので、シャープ・レシオが意味を持つのは、かなり特殊な運用の場合であることがお分かりいただけるだろう。

運用資産のカテゴリー別にシャープ・レシオで測るのも、ましてカテゴリーを越えてシャープ・レシオで比べるのも、不正確だ。また、シャープ・レシオでの評価が直接役に立つのは、一つのファンドに運用を丸投げするような状況となるが、そもそも投資家がこうした状態にとどまっていることが問題だろう。

シャープ・レシオは、概ねファンドの評価には使えない。敢えていえば、自分の運用を評価する時に参考に計算してみるという程度の使い道しかない。

評価の期間

一口に「ベンチマークに対して年率2%勝った」と言っても、どれくらいリスクを取っていたのかと共に、それが何年間の運用パフォーマンスなのかを問題にするのが当然だろう。

一年だけ2%勝った、というよりも、10年間を通じて平均2%勝った、というケースの方を、信頼度が高そうに感じるのが自然な感じ方にちがいない。

細かな計算は省略するが、インフォメーション・レシオで見たパフォーマンス評価の信頼性は、評価期間の平方根に比例する。

ベンチマークに対する相対的なリスクが4%でベンチマークに対して(平均)年率2%勝った場合、それが4年間のパフォーマンスであれば試験の偏差値でいうと「60」くらいの効率性だし、これを偏差値「70」に持っていくためには16年間の評価期間において平均年率2%勝つことが必要になる。

以下で述べるような、評価者にとって「都合のいい前提」を仮定したとしても、運用実績に対するパフォーマンス評価の信頼性を確保するには随分長い期間が必要だし、期間が長くなること自体が「都合のいい前提」を揺るがすことに注意が必要だ。

パフォーマンス評価の論理

インフォメーション・レシオのようなリスク調整を行った評価尺度を使って運用実績を評価しようとする行為は、(全てを網羅するわけではないが)概ね次のような仮定と論理に基づいている。

「運用者のスキルは時間が経っても安定しているとして、運用期間中に確率的に起こり得るパフォーマンスと比較して、この運用者のパフォーマンスはどれくらい(プラスに)偏っているだろうか。それは、確率的に考えて、どれくらい異例な事態だろうか。非常に異例と評価できる結果なら、この運用者には(プラスの)スキルがあって、だとすれば、今後、この運用者を使うことに意味がある(にちがいない)…。」

厳密に考えると、後から測ったリスクを、運用者が事前に分かっていたリスクと同じだと仮定することなど、まだまだ暗黙の好都合な仮定はあるが、過去のパフォーマンスを評価して、それによって今後に使う運用者やファンドを選ぼうとする際の潜在的な理屈は以上のようなものだ。

現実には、これだけ都合良く仮定しても、評価データの期間が不足することが多いし、ベンチマークも厳密に定義できない場合が多い。

それに、仮に、「偏差値70」といえるくらいの良いパフォーマンスが観測されたとしても、困ったことに、これは、このパフォーマンスが全く偶然の産物であっても、100人中2人強は存在してもおかしくない、ということなのだ。

そして、何よりも、ファンドマネージャーのスキルの有効性は安定していない。実績パフォーマンスに対する評価は、丁寧に、且つもっともらしく行ったとしても、その有効性には大いに疑問符が付く。

もっとも、論理的に整合整合性が取れていない評価は、役に立たない上に、恰好も悪いから、止めておく方がいい。

結論として、「運用の世界にあって、将来は、過去の単純な延長線上にはない」と申し上げておこう。