Kalshiの初の研究報告が発表:CPIを予測する際、集団の知恵がウォール街の知恵者たちをどのように打ち負かすか
2025-12-24 14:04:33
この記事は: Kalshi Research
編訳|Odaily 星球日报 Azuma
編者の言葉:主要な予測市場プラットフォームである Kalshi は、昨日、予測市場に関連するテーマに興味を持つ学者や研究者に Kalshi の内部データを提供することを目的とした新しい研究レポートコラム「Kalshi Research」を発表しました。このコラムの最初の研究報告書が公開されました。原文のタイトルは《 Kalshi はインフレ予測においてウォール街を上回る》(Beyond Consensus: Prediction Markets and the Forecasting of Inflation Shocks)です。
以下は、Odaily 星球日报による翻訳です。

概要
重要な経済統計データが発表される前の週には、大手金融機関のアナリストや上級経済学者が予想数値を提示します。これらの予測がまとめられると「コンセンサス予想」と呼ばれ、市場の変化を洞察し、ポジションを調整するための重要な参考と見なされています。
本研究報告では、コンセンサス予想と Kalshi 予測市場の暗黙の価格設定(以下、時折「市場予測」と略します)が、同じコアマクロ経済信号である前年比全体インフレ率(YOY CPI)の実際の数値を予測する際のパフォーマンスを比較しました。

主なポイント
- 全体的な正確性が優位:すべての市場環境(通常の環境とショック環境を含む)において、Kalshi の予測の平均絶対誤差(MAE)はコンセンサス予想よりも 40.1% 低い。
- 「ショック Alpha」:重大なショックが発生した場合(0.2 パーセントを超える)、1 週間前の予測ウィンドウ内で Kalshi の予測はコンセンサス予想の MAE よりも 50% 低く、データ発表の前日には MAE がさらに 60% に拡大する。中程度のショックが発生した場合(0.1 - 0.2 パーセントの間)、1 週間前の予測ウィンドウ内で Kalshi の予測は「コンセンサス予想」の MAE よりも 50% 低く、データ発表の前日には 56.2% に拡大する。
- 予測信号:市場予測とコンセンサス予想の偏差が 0.1 パーセントを超えると、ショックが発生する確率は約 81.2% であり、データ発表の前日には約 82.4% に上昇する。市場予測とコンセンサス予想が一致しない場合、75% のケースで市場予測がより正確である。
背景
マクロ経済予測者は内在的な課題に直面しています:最も重要な予測の瞬間、つまり市場が混乱し、政策が転換し、構造的な断裂が発生する時こそ、歴史的なモデルが最も失敗しやすい段階です。金融市場の参加者は、重要な経済データが発表される数日前にコンセンサス予測を発表し、専門家の意見を市場の期待としてまとめます。しかし、これらのコンセンサスの見解は価値があるものの、しばしば類似の方法論的アプローチと情報源を共有しています。
機関投資家、リスク管理者、政策立案者にとって、予測の正確性に関する利害関係は非対称です。争いのない時期には、少し良い予測は限られた価値しか提供できませんが、市場が混乱している時期には、ボラティリティが急上昇し、相関関係が崩壊し、歴史的関係が失効する際に、より優れた正確性が顕著な Alpha リターンをもたらし、下落を制限します。
したがって、市場の変動時におけるパラメータの挙動特性を理解することが重要です。私たちは、主要なマクロ経済指標である前年比全体インフレ率(YOY CPI)に焦点を当てます。これは将来の金利決定の核心的な参考指標であり、経済の健康状態を測る重要な信号でもあります。
私たちは、公式データが発表される前の複数の時間ウィンドウにおける予測の正確性を比較・評価しました。私たちの核心的な発見は、いわゆる「ショック Alpha」が実際に存在するということです。つまり、尾部イベントにおいて、市場に基づく予測はコンセンサス基準に対して追加の予測精度を実現できます。この超過パフォーマンスは純粋な学術的意義だけでなく、予測誤差が最高の経済コストを持つ重要な瞬間において、信号の質を大幅に向上させることを意味します。この文脈において、実際に重要な問題は、予測市場が「常に正しい」かどうかではなく、彼らが伝統的な意思決定フレームワークに組み込む価値のある差別化された信号を提供しているかどうかです。
方法論
データ
私たちは、Kalshi プラットフォーム上の予測市場トレーダーの日々の暗黙の予測値を分析しました。これは、次の 3 つの時間点をカバーしています:データ発表の 1 週間前(コンセンサス予想の発表タイミングに一致)、発表の前日、発表当日の午前。使用される各市場は(またはかつては)実際に取引可能な運用市場であり、異なる流動性レベルでの実際の資金ポジションを反映しています。コンセンサス予想については、機関レベルの YoY CPI コンセンサス予測を収集しました。これらの予測は通常、米国労働統計局の公式データ発表の約 1 週間前に発表されます。
サンプル期間は 2023 年 2 月から 2025 年中期までで、25 か月以上の CPI 発表サイクルをカバーし、さまざまなマクロ経済環境を横断しています。
ショック分類
私たちは、歴史的水準に対する「予想外の幅」に基づいてイベントを 3 つのカテゴリに分類しました。「ショック」は、コンセンサス予想と実際の発表データとの絶対的な差として定義されます:
- 正常イベント:YOY CPI の予測誤差が 0.1 パーセント未満;
- 中程度のショック:YOY CPI の予測誤差が 0.1 から 0.2 パーセントの間;
- 重大なショック:YOY CPI の予測誤差が 0.2 パーセントを超える。
この分類方法により、予測の優位性が予測の難易度の変化に伴って系統的な差異を示すかどうかを検証できます。
パフォーマンス指標
予測のパフォーマンスを評価するために、以下の指標を使用しました:
- 平均絶対誤差(MAE):主要な正確性指標で、予測値と実際の値との間の絶対的な差の平均値を計算します。
- 勝率:コンセンサス予想と市場予測の間の差が 0.1 パーセント(小数点以下 1 位に四捨五入)に達した場合、どちらの予測が最終的な実際の結果に近いかを記録します。
- 予測時間スパン分析:発表の 1 週間前から発表日までの市場評価の正確性がどのように進化するかを追跡し、情報を持続的に取り入れることによる価値を明らかにします。
結果:CPI 予測パフォーマンス
全体的な正確性が優位
すべての市場環境において、市場に基づく CPI 予測はコンセンサス予測に対して、平均絶対誤差(MAE)が 40.1% 低いです。すべての時間スパンにおいて、市場に基づく CPI 予測の MAE はコンセンサス予想よりも 40.1%(1 週間前)から 42.3%(前日)低いです。
さらに、コンセンサス予想と市場の暗黙の値に不一致がある場合、Kalshi の市場に基づく予測は統計的に有意な勝率を示し、範囲は 1 週間前の 75.0% から発表当日の 81.2% までです。コンセンサス予想と同じになるケース(小数点以下 1 位に精度を持たせた場合)を含めると、市場に基づく予測は 1 週間前に約 85% のケースでコンセンサスと同等またはそれ以上のパフォーマンスを示します。
このような高い方向性の正確性は、市場予測とコンセンサス予想に不一致がある場合、その不一致自体が「ショックイベントが発生する可能性があるかどうか」に対して重要な情報価値を持つことを示しています。
「ショック Alpha」が実際に存在
予測の正確性の差は、ショックイベントの期間中に特に顕著に現れます。中程度のショックイベントでは、発表タイミングが一致する場合、市場予測の MAE はコンセンサス予想よりも 50% 低く、データ発表の前日にはこの優位性が 56.2% 以上に拡大します。重大なショックイベントでは、発表タイミングが一致する場合、市場予測の MAE もコンセンサス予想よりも 50% 低く、データ発表の前日には 60% 以上に達します。一方、ショックが発生しない正常環境では、市場予測とコンセンサス予想のパフォーマンスはほぼ同等です。
ショックイベントのサンプル数は少ないものの(これは「ショックが非常に予測困難な」世界では合理的です)、全体的なパターンは非常に明確です:予測環境が最も困難な時に、市場の情報集約の優位性が最も価値を持つのです。
しかし、重要なのは、Kalshi の予測がショック期間中に優れているだけでなく、市場予測とコンセンサス予想の間の不一致自体がショックが発生する信号である可能性があることです。不一致がある場合、市場予測はコンセンサス予想に対して 75% の勝率を示します(比較可能な時間ウィンドウ内)。さらに、閾値分析は、マーケットとコンセンサスの偏差が 0.1 パーセントを超えると、ショックが発生する確率が約 81.2% に達し、データ発表の前日にはこの確率が約 84.2% に上昇することを示しています。
この実践的な意味を持つ差異は、予測市場がコンセンサス予想と並ぶ競争的な予測ツールとして機能するだけでなく、予測の不確実性に関する「メタ信号」として、マーケットとコンセンサスの不一致を潜在的な予期しない結果の早期指標として定量化できることを示しています。
派生的な議論
明らかな疑問が浮かび上がります:なぜショック期間中に市場予測がコンセンサス予測を上回るのか?私たちはこの現象を説明するために、3 つの相互補完的なメカニズムを提案します。
市場参加者の異質性と「群衆の知恵」
伝統的なコンセンサス予想は複数の機関の見解を統合していますが、しばしば類似の方法論的仮定と情報源を共有しています。計量経済モデル、ウォール街の研究レポート、政府データの発表は、高度に重複した共通の知識基盤を構成しています。
それに対して、予測市場は異なる情報基盤を持つ参加者のポジションを集約しています。これには、専有モデル、業界の洞察、代替データソース、経験に基づく直感的判断が含まれます。この参加者の多様性は「群衆の知恵」理論に基づいており、参加者が関連情報を持ち、その予測誤差が完全に相関していない場合、多様な情報源からの独立した予測を集約することで、より優れた推定結果が得られることを示しています。
マクロ環境が「状態切替」を行う際、この情報の多様性の価値は特に際立ちます。散発的で局所的な情報を持つ個人が市場で相互作用し、その情報の断片が組み合わさることで、集団的な信号が形成されます。
参加者のインセンティブ構造の違い
機関レベルのコンセンサス予測者は、複雑な組織と評判の体系に置かれており、この体系は「純粋に予測の正確性を追求する」目標から系統的に逸脱します。職業予測者が直面する職業リスクは非対称な利益構造を形成し、予測の大きな誤りは著しい評判コストを生む一方で、特に同業のコンセンサスから大きく逸脱して得られた正確性は、必ずしも比例した職業的報酬を得られるわけではありません。
この非対称性は「群集行動」を引き起こし、予測者は自分の予測をコンセンサス値の近くに集める傾向があります。これは、彼らのプライベート情報やモデルの出力が異なる結果を示唆していても同様です。その理由は、職業体系において「孤立して間違える」コストが「孤立して正しい」利益よりも高いことが多いためです。
これに対して、予測市場の参加者が直面するインセンティブメカニズムは、予測の正確性と経済的結果との直接的な整合を実現しています。予測が正確であれば利益が得られ、予測が間違っていれば損失が生じます。この体系では、評判要因はほとんど存在せず、市場コンセンサスからの逸脱の唯一のコストは経済的損失であり、それは予測が正しいかどうかに完全に依存します。この構造は予測の正確性に対してより強い選択圧をかけ、コンセンサス予測の誤りを系統的に識別できる参加者は資本を蓄積し、より大きなポジションサイズで市場における影響力を強化します。一方、機械的にコンセンサスに従う参加者は、コンセンサスが誤りであることが証明された場合に持続的に損失を被ります。
不確実性が著しく上昇する時期には、機関予測者が専門家のコンセンサスから逸脱する職業コストが最高点に達するため、このインセンティブ構造の分化が最も顕著であり、経済的に最も重要です。
情報集約の効率
注目すべき経験的事実は、データ発表の 1 週間前でも、これはコンセンサス予想の発表の典型的な時間ウィンドウと一致しますが、市場予測は依然として顕著な正確性の優位性を示すことです。これは、市場の優位性が予測市場参加者が通常言及される「情報取得の速度の優位性」からのみ生じるわけではないことを示しています。
逆に、市場予測は、あまりにも分散していたり、業界特有であったり、あまりにも曖昧であったために、正式に伝統的な計量経済予測フレームワークに組み込むことが難しい情報の断片をより効率的に集約している可能性があります。予測市場の相対的な優位性は、公共情報に早く接触することではなく、同じ時間スケール内で異質な情報をより効果的に統合できることにあるかもしれません。これは、アンケート調査に基づくコンセンサスメカニズムが同じ時間ウィンドウを持っていても、これらの情報を効率的に処理するのが難しいことが多いからです。
限界と注意事項
私たちの研究結果には重要な制限があります。全体のサンプルが約 30 か月しかカバーしておらず、重大なショックイベントは定義上非常に稀であるため、大きな尾部イベントに対する統計的な有効性は依然として限られています。より長い時間系列は将来の推論能力を強化しますが、現在の結果は市場予測の優位性と信号の差異を強く示唆しています。
結論
私たちは、予測市場が専門家のコンセンサス予想に対して、系統的かつ経済的に重要な優れたパフォーマンスを示すことを記録しました。特に予測の正確性が最も重要なショックイベントの期間中においてです。市場に基づく CPI 予測の全体的な誤差は約 40% 低く、重大な構造的変化の期間中には、その誤差が約 60% 低下することがあります。
これらの発見に基づいて、今後の研究の方向性が特に重要になります。1 つは、より大きなサンプルサイズと多様なマクロ経済指標を通じて、「ショック Alpha」イベント自体がボラティリティや予測の不一致指標によって予測できるかどうかを研究することです。2 つ目は、予測市場がどの流動性の閾値を超えると、伝統的な予測方法を安定的に上回ることができるかを調査することです。3 つ目は、予測市場の予測値と高頻度取引金融ツールに内在する予測値との関係です。
コンセンサス予測が強い相関性のあるモデル仮定と共有情報セットに大きく依存する環境において、予測市場は代替的な情報集約メカニズムを提供し、状態切替をより早くキャッチし、異質な情報をより効率的に処理することができます。構造的な不確実性と尾部イベントの頻度が増加する経済環境で意思決定を行う主体にとって、「ショック Alpha」は予測能力の漸進的な改善を示すだけでなく、堅牢なリスク管理基盤の基本的な構成要素となるべきです。
関連プロジェクト
最新の速報
ChainCatcher
2025-12-25 09:11:41
ChainCatcher
2025-12-25 08:59:47
ChainCatcher
2025-12-25 08:41:43
ChainCatcher
2025-12-25 08:27:56
ChainCatcher
2025-12-25 08:26:54












