ビジネスBDの募集をしています。ぜひ私たちに参加してください! 【詳細を見る】
API RootDataアプリをダウンロードする

Founders Fund、Pantera と Franklin Templeton が Sentient の「Arena」に参加し、企業向け AI インテリジェンスのストレステストを実施しました。

2月 27, 2026 22:37:19

に共有します

過去2年間、企業はAIエージェントを実際のワークフローに導入することを加速してきました:カスタマーサービス、バックエンドオペレーション、金融やコンプライアンスなど、高度な意思決定を必要とするプロセスに至るまで。これらのシステムが実際のビジネスにますます組み込まれるにつれて、新たな問題が浮上しています:エージェントは情報を検索できますが、作業が「汚れた」もの、多段階、または高リスクになると、安定した、説明可能で再現可能な推論プロセスを提供するのが難しいことが多いのです。

本日、オープンソースAIラボのSentientは、Arenaを正式に発表しました------これは、リアルタイムで生産レベルの使用が可能な環境で、世界中の数千人のAI開発者を対象に、さまざまな企業の最も難しい推論問題に対するストレステストと競技的な反復を行うためのものです。Arenaの初期段階の最初の参加者には、Founders Fund、Pantera、そして資産管理規模が1.5兆ドルを超えるFranklin Templeton(フランクリン・テンプルトン)が含まれており------これは、機関が「オンライン展開前にAIエージェントを構造的に評価すること」に対して早期かつ明確な関心を示しているという信号を発信しています。

「企業がAIエージェントを研究、運営、顧客向けのワークフローに適用する際、問題はこれらのシステムが十分に強力かどうかではなく……実際のワークフローで信頼できるかどうかです。」とFranklin Templeton Digital Assets(フランクリン・テンプルトンデジタル資産)のマネージングパートナー、Julian Loveは述べています。Loveは、Arenaのような構造化された環境が、業界が「潜在的なアイデア」と「実際に生産に使用できる能力」を区別するのに役立つと付け加えました。

Sentientの共同創設者Himanshu Tyagiは次のように述べています。「AIエージェントは企業内で単なる実験ではなくなり、顧客、資金、運営結果に影響を与える重要なプロセスに入っています。この変化は評価基準を変えます。システムがデモで素晴らしく見えるだけでは不十分です。企業は、製造環境で失敗のコストが高く、信頼が非常に脆弱なときに、エージェントが安定して推論できるかどうかを知る必要があります。企業は比較可能性、再現性、そして基盤となるモデルやツールスタックに依存せず、長期的に信頼性の向上を追跡できる方法を必要としています。」

Arenaは企業のワークフローの実際の混乱をシミュレートします:情報が不完全で、文脈が長く、指示があいまいで、情報源が相互に矛盾しています。Arenaは、エージェントが「正しい答え」を出すかどうかを評価するだけでなく、エンジニアリングチームが失敗の原因を特定し、長期的に改善が有効かどうかを検証できるように、完全な推論トレース(reasoning trace)を記録します。

これは、モデル間、技術スタック間の推論評価に対して中立的でベンダーに依存しないベンチマーク(vendor-agnostic benchmark)を提供します。Arenaはデモパフォーマンスではなく、生産レベルのパフォーマンスを強調し、高リスクシナリオに適用可能な検証可能なエージェント能力を形成し、企業はこれらの能力を自社のプライベートデータや内部ツールに移行することができます。

最初の挑戦では、Arenaに参加する開発者は企業レベルの基本的な課題に焦点を当てます:文書推論(document reasoning)。AIエージェントは複雑で非構造化データに対して推論と計算を行う必要があります------この種の作業は金融分析、根本原因調査、投資メモ作成、カスタマーサービスなどのシナリオの基盤を支えています。

初期段階の他の参加者には、alphaXiv、Fireworks、OpenHands、OpenRouterなどが含まれています;Arenaがタスク、業界、モデルの統合を拡大するにつれて、さらに多くの参加者が加わることが期待されています。

最近の調査もArenaが解決しようとしているギャップを浮き彫りにしています:85%の企業が「エージェント企業(agentic enterprises)」になりたいと考えており、約4分の3が自治エージェントを展開する計画を立てていますが、成熟したガバナンス体系を持つ企業は4分の1にも満たない;多くの企業がパイロットを大規模な生産展開に拡大するのが難しいと感じています。企業は平均して約十数のエージェントを運用しており、通常はそれぞれ孤立したシナリオに分散しています;多くの企業は、より良いオーケストレーションと協調能力がなければ、エージェントを増やすことは複雑さを増し、価値が逆に下がるだけだと考えています。

「OpenHandsでは、開発者がエージェントを使用して実際の実用的な問題を解決することを常にサポートしたいと考えています。」とOpenHandsのチーフサイエンティスト兼共同創設者Graham Neubigは述べています。「私たちは、参加者がこれらの複雑な課題に取り組むためにOpenHands Software Agent SDKを使用することをサポートできることを嬉しく思います。」

OpenRouterの共同創設者兼CEO、Alex Atallahは次のように述べています。「ArenaはオープンソースAIを前進させるためのプログラムであり、研究者が公開環境で競争し、反復し、革新することを可能にします。私たちはSentientとの協力を深め、実験をより早く、より簡単にスケールさせるためのインフラを提供することを楽しみにしています。」

Arenaは世界中で開始され、数千人のAI開発者に第一期の限定隊列への参加を呼びかけ、2026年3月からサンフランシスコでオフラインイベントを開催します。

Sentient Labsについて

Sentient Labsは、オープンソースAIの発展を推進することに専念する先進的な技術研究および製品組織です。Sentient Foundationの下にあるイノベーションエンジンとして、Sentient LabsはAI推論、整合性、エージェント協力などの分野で最前線の研究を行っています。Sentientは、ROMAなどの高性能フレームワークやDobbyなどのオープンソースモデルの核心的な研究開発者です。Sentientの使命は、オープンソースAIを「実験」から「必需品」へと進化させることです。強力で組み合わせ可能なエージェントシステムを構築するためのインフラを提供することで、Sentientは開発者がオープンソースツールを商業化し、企業レベルの可用性を達成できるようにします。Sentientは、オープンソースが世界の重要なミッションAI運用のデフォルト基準となることを目指しています。

最近の資金調達

もっと見る
-- 2月 26
$4M 2月 26
$30M 2月 26

最近のトークン発行

もっと見る
2月 27
2月 26
2月 26

𝕏 最新の注目

もっと見る