Google DeepMindのAI共同数学者は何ができるツールですか？

数学者が未解決問題に取り組むのを支援するエージェント型のAIシステムです。コーディネーターエージェントが研究を複数の並列タスクに分解し、サブエージェントがコードの記述・文献検索・証明の試行を分担します。Gemini 3.1を基盤としています。

FrontierMathの48%というスコアはどれくらいすごいのですか？

FrontierMathは長年AIを苦しめてきた研究レベルの数学ベンチマークです。基盤モデルであるGemini 3.1 Proの素のスコアが19%だったのに対し、エージェント型システムは48%を記録し、スコアを2倍以上に引き上げてリーダーボード首位に立ちました。

このAI共同数学者は一般ユーザーも使えますか？料金は？

2026年5月時点では研究成果を示す論文として発表された段階であり、一般提供の料金や利用条件は明らかにされていません。最新の提供状況や価格は公式サイトで確認することをおすすめします。

AIは数学者の仕事を奪ってしまうのでしょうか？

今回の事例では、システムが一度却下した出力の中から人間の専門家が巧妙な証明戦略を見つけ、難問を解決しました。AIが人間を置き換えるのではなく、トップの研究者の作業を加速させる協働の形を示していると考えられます。

OpenAI CodexのComputer Use機能とは何ですか？

MacやWindows上で、Codexがアプリのクリック操作まで自動で行う機能です。プラグインを有効化しフルアクセス権限に切り替えることで、Webページのデバッグや、Photoshopの書き出し、ファイル名の一括変更などの定型作業を任せられます。

RAVENはどのように系外惑星を発見したのですか？

英ウォーリック大学のAIシステムRAVENが、NASAのTESS衛星が4年間で観測した220万個の恒星のデータを解析しました。検出・選別・確認を一気通貫で処理し、100個超の惑星を確認、2,000個以上の候補も新たに見つけています。

今回のAIニュースで日本企業が注目すべきポイントは？

最新モデルを導入するだけでなく、複数のエージェントに役割を分担させ互いにレビューさせる「設計力」が成果を左右する点です。また既存データをAIで再分析するアプローチは、新規投資を抑えつつ価値を生む方法として参考になると予想されます。

Google DeepMindのAI数学者が数学難問に挑む【2026年最新】

2026年5月28日2026年6月10日

2026年5月、Google DeepMindが「AI共同数学者（AI co-mathematician）」に関する論文を公開し、研究レベルの数学問題を集めたベンチマークで新記録を達成しました。注目すべきは、その設計思想がAIのコーディング戦略から借りてきたものだという点です。「モデルに答えを尋ねる」のではなく、「エージェントのチームに作業場を与える」──この発想の転換が、AIによる科学研究のあり方を大きく変えようとしています。

本記事では、The Rundown AIが伝えた2026年5月の主要トピックを整理し、それぞれが技術的になぜ重要なのか、そして日本のビジネスパーソンや開発者にとってどのような示唆があるのかを、わかりやすく解説します。

Google DeepMindの「AI共同数学者」とは何か

Google DeepMindが発表したAI共同数学者は、最新モデル「Gemini 3.1」を基盤としたエージェント型システムです。数学者が未解決問題に取り組むのを支援することを目的に設計されており、研究レベルの数学ベンチマークで新たな最高スコアを記録しました。

公式の発表によると、このシステムは複数のエージェントが協調して動作する仕組みになっています。具体的には、まず「コーディネーターエージェント」が研究テーマを複数の並列ワークストリームに分解します。そしてそれぞれのワークストリームに配置されたサブエージェントが、コードを書いたり、関連文献を検索したり、証明を試みたりと役割を分担して進めるのです。

すでに具体的な成果も生まれています。オックスフォード大学のMarc Lackenby氏は、このシステムが一度は内部レビューで却下した出力の中に「本当に、本当に巧妙な証明戦略」を見つけ出し、それをヒントに群論の難問集「コーロフカ・ノート（Kourovka Notebook）」の未解決問題を解決したと報告されています。

なぜ「答え」ではなく「チーム」なのか──技術的背景

このシステムの最大の特徴は、Anthropic社の「Claude Code」のようなAIコーディング環境をモデルにしている点です。従来のように単一のモデルに一発で答えを出させるのではなく、エージェントのチーム編成と、組み込まれたレビューサイクルを数学研究に持ち込みました。

ソフトウェア開発の世界では、複数のエージェントが分業し、互いの成果をレビューし合う「エージェント型パイプライン」が成果を上げてきました。Google DeepMindは、この成功パターンを数学という抽象度の高い領域に応用したわけです。コードを書く、文献を探す、証明を試みるという作業を分散させることで、一つのモデルの能力の限界を超えた探索が可能になると考えられます。

興味深いのは、Lackenby氏の発見が「却下された出力」から生まれた点です。システム自身のレビュアーが不採用と判断したアイデアの中に、人間の専門家が価値を見いだした──これは、AIが人間を「置き換える」のではなく、人間の思考を「加速させる」協働の形を象徴しています。

FrontierMathで48%──数字が示すインパクト

具体的な数字を見てみましょう。このシステムは、Epoch AIが運営する数学ベンチマーク「FrontierMath」の最難関区分であるTier 4で、48%というスコアを記録し、リーダーボードのトップに立ちました。

この48%という数字の意味は、比較対象を見ると鮮明になります。基盤モデルであるGemini 3.1 Proの素のスコアは19%でした。つまり、エージェント型のパイプラインを組むことで、同じ基盤モデルのスコアを2倍以上に引き上げたことになります。FrontierMathは、長年にわたってAIを苦しめてきた難問揃いのベンチマークであり、ここでの大幅な向上は、モデルそのものの改良だけでなく「使い方の設計」が成果を左右することを示しています。

研究者や大学院生にとっては、未解決問題へのアプローチを補助する強力なパートナーとなり得ます。また、創薬や材料科学など、高度な数理的探索を必要とする業界にとっても、応用の可能性が広がると予想されます。

OpenAI Codexで手作業を自動化する

同じ号でThe Rundown AIが取り上げたのが、OpenAIの「Codex」を使った手作業の自動化です。MacおよびWindows上で「Computer Use（コンピュータ操作）」機能を使うことで、繰り返しの面倒な作業をCodexにクリック操作ごと任せられると紹介されています。

手順はシンプルです。Codexを開き、プラグインメニューから「Computer Use」プラグインを有効化して新しいタスクを開始します。次に権限メニューを開き、デフォルト権限から「フルアクセス」に切り替え、実際の作業を指示します。たとえば「Chromeを開いて、開発中のWebページ http://localhost:3000/ のバグを再現し、原因を考えて教えて。確信が持てなければ変更前に確認して」といった指示が可能です。

さらに、ローカルアプリの操作も自動化できる点が実務的です。Photoshopの書き出し、Adobe Premiereのクリーンアップ、ファイル名の一括変更など、定型的なワークフローを任せられます。デザイナーや動画編集者、事務作業の多いオフィスワーカーにとって、地味だが時間を奪われていた作業を肩代わりしてくれる存在になりそうです。

AIがNASAデータから100個超の新系外惑星を発見

天文学の分野でも大きな成果が報告されました。英ウォーリック大学の天文学者チームは、「RAVEN」と呼ばれるAIシステムを使い、100個を超える系外惑星を確認したと発表しました。

RAVENは、NASAのTESS（トランジット系外惑星探索衛星）が4年間にわたって観測した、220万個の恒星のデータを解析しました。検出・選別・確認という一連のプロセスを一気通貫で処理する設計で、シミュレーションされた惑星と誤検出シグナルの両方で訓練されており、本物の発見だけをふるい分けます。

成果の中には、これまで一度も発見されていなかった31個の系外惑星に加え、恒星をわずか1日未満で公転する奇妙な天体も含まれていました。さらに、ネプチューンサイズの惑星が本来なら生き残れないほど恒星に近い「ネプチューン砂漠（Neptunian Desert）」と呼ばれる領域でも、数百個の惑星が見つかっています。注目すべきは、新しいハードウェアではなく、よりスマートなAIだけで、従来システムの10倍の精度を実現した点です。データの中にすでに眠っていた知見を、AIが掘り起こしたのです。

その他の注目ニュース

このほかにも、2026年5月のAI業界では複数の動きがありました。

Isomorphic Labs（Google傘下）が、創薬設計エンジン拡張のため20億ドル超の資金調達を進めていると報じられました。特定タスクでAlphaFold 3を大きく上回る性能だとしています。
Baiduが新基盤モデル「ERNIE 5.1」をリリース。ArenaのSearch Leaderboardで4位にランクインし、ライバルモデルの6%のコストで訓練できたと主張しています。
OpenRouterが「Pareto Code」を公開。ユーザーが設定した品質基準を上回る範囲で、最も安価なコーディングAIを自動選択する無料のルーティング層です。
ギリシャが、AIが個人の自由に資することを求める保護条項を憲法に盛り込む提案を行いました。

まとめ──2026年5月のAIトレンドと今後の動向

今回のトピックを貫くキーワードは「エージェント化」と「既存リソースの再発見」です。Google DeepMindのAI共同数学者は、コーディングで成功したエージェント型の分業をそのまま数学研究に持ち込み、Gemini 3.1 Proの19%を48%へと押し上げました。RAVENは、新しい望遠鏡ではなく賢いAIだけで、既存のNASAデータから100個超の惑星を掘り起こしました。

これらに共通するのは、「単一の万能モデル」よりも「役割を分担し、レビューし合うエージェントの設計」が成果を左右するという潮流です。日本企業や開発者にとっても、最新モデルを導入するだけでなく、それをどう組み合わせ、どう作業を分解するかという「設計力」が今後の競争力を左右すると考えられます。Codexのような身近な自動化ツールから、まず小さく試してみることをおすすめします。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

この記事を書いた人

abyssnexy

Google DeepMindのAI数学者が数学難問に挑む【2026年最新】

Google DeepMindの「AI共同数学者」とは何か

なぜ「答え」ではなく「チーム」なのか──技術的背景

FrontierMathで48%──数字が示すインパクト

OpenAI Codexで手作業を自動化する

AIがNASAデータから100個超の新系外惑星を発見

その他の注目ニュース

まとめ──2026年5月のAIトレンドと今後の動向

この記事を書いた人

コメント

コメントするコメントをキャンセル

Google DeepMindのAI数学者が数学難問に挑む【2026年最新】

Google DeepMindの「AI共同数学者」とは何か

なぜ「答え」ではなく「チーム」なのか──技術的背景

FrontierMathで48%──数字が示すインパクト

OpenAI Codexで手作業を自動化する

AIがNASAデータから100個超の新系外惑星を発見

その他の注目ニュース

まとめ──2026年5月のAIトレンドと今後の動向

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル