2026年5月、AI業界は数学の世界で大きな転換点を迎えました。前週にOpenAIが「80年来の数学難題をAIが解いた」と発表して話題をさらったばかりですが、今回はGoogle DeepMindがそれを大きく上回る成果を静かに公表しました。情報源であるニュースレター「The Rundown AI」によると、Googleのシステムは未解決の数学問題を9つも自律的に解決したと報じられています。
本記事では、この「Google対OpenAI」の数学ブレイクスルーを中心に、Claude Mythosによる大規模な脆弱性発見、そして自分専用のAI秘書を作る方法まで、2026年5月25日号の注目トピックを日本のビジネスパーソン・開発者向けに分かりやすく整理します。技術の裏側と、日本企業にとっての示唆を一緒に見ていきましょう。
Google DeepMindのAIが未解決の数学問題9つを解決

今回最も注目を集めたのは、Google DeepMindの「AlphaProof Nexus」というAIシステムです。これは機械で検証可能な数学的証明を生成するAIで、報道によると9つの未解決のErdős問題(エルデシュ問題)を解いたとされています。Erdős問題は数学界で最も難しい未解決問題の一群として知られており、その中には56年間解かれていなかった問題が2つ含まれていたと伝えられています。
注目すべきは、その実現タイミングです。OpenAIが自社のErdős問題に関する成果を発表したわずか1日後に、Googleがこの成果を公表しました。前週にOpenAIが80年来のErdős予想を反証したと報じられた直後だったことから、「OpenAIの1つに対してGoogleは9つ」という対比が大きな話題となりました。
技術的背景:なぜ「形式検証」が鍵なのか
The Rundownの解説によると、AlphaProof Nexusの仕組みの核心は、大規模言語モデル(LLM)と「Lean」と呼ばれる証明支援系(proof assistant)を組み合わせた点にあります。組み合わせ論やグラフ理論にまたがる9つの問題に対して、機械検証済みの証明を生成したと報じられています。
このシステムの流れはシンプルです。AIが証明を生成し、それをLeanで検証し、検証に通るまで繰り返す——という反復プロセスです。人間が「なんとなく正しそう」と判断するのではなく、形式的に正しさが保証される点が従来との大きな違いだと考えられます。さらに、整数列オンライン百科事典(OEIS)に登録された44の未解決予想も証明したと伝えられています。
コストと限界
もう一つ驚くべき点は、コストの低さです。報道によれば、各問題の解決にかかった費用は1問あたり数百ドル程度だったとされています。最先端の数学研究が、これほど低コストで進む可能性を示した点は大きな意味を持つと考えられます。
一方で限界も明らかになっています。エージェントの簡易版でも同等の結果を出せたものの、コストはより高くつき、また新しい数学的構成(construction)を必要とする問題は依然として解けなかったと報じられています。AIが「既存の道具を組み合わせて解く」段階から「まったく新しい道具を生み出す」段階へ進むには、まだ壁があるということです。
業界への影響と日本企業への示唆
The Rundownは「数十年間解かれなかった問題でのGoogleの進展は、AIがいかに速く独自の解決へと向かっているか、そして形式検証がゲームを変えることを示している」と評しています。時間をかけて、研究者が機械の速度で新しい発見をする手助けになると予想されます。
日本企業にとっての示唆は、研究開発(R&D)の生産性です。創薬・材料科学・金融工学など、数学的に検証可能な仮説を大量に試す必要がある分野では、こうした「生成→検証→反復」型のAIが研究スピードを引き上げる可能性があります。重要なのは、AIの出力をそのまま信じるのではなく、形式検証のように正しさを機械的に確かめる仕組みを併せて設計する視点だと考えられます。
Claude Mythosが1ヶ月で1万件超の重大脆弱性を発見

セキュリティ分野でも大きな動きがありました。Anthropicは「Project Glasswing(プロジェクト・グラスウィング)」の最初の成果を公開し、Claude Mythos Previewとその約50のパートナーが、わずか1ヶ月で1万件を超える高・重大深刻度の脆弱性を発見したと発表しました。
具体的な数字も報じられています。Cloudflare単独で2,000件のバグを発見し、その誤検知率は人間のテスターよりも優れていたとされています。また、Mozillaは Firefox 150 で271件の脆弱性を発見・修正しました。Anthropicが1,000件以上のオープンソースプロジェクトをスキャンした際には、Mythosが6,202件を高・重大と判定し、独立した精査の後でも62%(約3,900件)がそのまま脆弱性として確認されたと伝えられています。
興味深いのは、脆弱性のフラグ付けにとどまらない応用例です。あるパートナー銀行は、Mythosを使って150万ドルの不正送金を検知・阻止したと報じられています。今後、Glasswingは米国および同盟国の政府を含む追加パートナーへと拡大し、Mythosクラスのモデルの一般提供が続く予定とされています。
Anthropicは「悪用を防ぐ十分な安全策を持つ企業はまだ存在しない」として、Mythosを限定提供にとどめていると説明しています。OpenAIがサイバー系モデルを強化し、中国勢も追い上げる中で、同等以上のAIが登場するのは時間の問題だと考えられます。その時、世界がどれだけ速くパッチを当てられるかが本当の試金石になる、というのがThe Rundownの見立てです。日本企業のセキュリティ担当者にとっても、攻撃側・防御側の双方でAI活用が前提になる時代への備えが急務だと言えます。
一日を計画してくれる「AI秘書」を自作する方法

今回のニュースレターには、実務にすぐ役立つ実践ガイドも掲載されています。テーマは「あなたの一日を計画するAI秘書を作る」というものです。The Rundownによると、Codex または Claude Code を使って、毎朝Slack・Gmail・カレンダーをチェックし、散らかった情報を優先順位付きのToDoリストに変えるAIタスクマスターを構築できるとされています。
手順の要点は次の通りです。
- フォルダを作成し、その中でClaude Codeを開き、Slack・Gmail・カレンダーを毎日確認して優先度を高→低で並べ、日付・ステータスのチェックボックス付きで「MonoNote.md」の先頭にまとめるスキルを作るよう依頼する
- 「MonoNote.md」と「task-rules.md」をエージェントに作成させ、タスクごとの優先度ルールを task-rules.md に追記させる
- スキルを実行し、リストを確認する。今日の日付・グループ化されたタスク・ソースリンク・終日使えるチェックボックスが並ぶ
- 初回実行後、自動化を作成させる。前日のフィードバックを見直し、繰り越されたタスクをロールオーバーし、ルールを更新して新しいリストを生成する
さらにPro Tipとして、タスクリストを走査して繰り返し発生するタスクを見つけ、「どれをAIで自動化できるか」を提案する週次監査スキルを作る方法も紹介されています。これは個人開発者や中小企業の経営者が、自分の業務フローをAIで整える第一歩として非常に実用的だと考えられます。
こうしたエージェント型ワークフローを本格的に学びたい開発者向けには、Google for Startupsが提供するエージェント型AIの実践トレーニングプログラムも紹介されています。気になる方は公式情報を確認してみてください。
▶ 最新AIニュースを毎朝メールで受け取る(無料・クレジットカード不要)
その他の注目トピック:価格破壊と新モデル

The Rundownの「Quick Hits」では、コスト面のニュースが目立ちました。
- DeepSeek V4-Pro:DeepSeekはV4-Proの価格を恒久的に75%引き下げ、入力100万トークンあたり0.435ドル、出力100万トークンあたり0.87ドルとしました。クローズドソースの競合を大きく下回る水準だと報じられています。
- Gemini 3.5 Flash:Googleの新しいFlashモデルで、半額で4倍高速とされています。
- Perplexity Bumblebee:macOSとLinux向けのスキャナーをオープンソース化。サプライチェーン・インシデント時に、危険なパッケージや拡張機能、AIツールの設定をチェックできます。
- NVIDIA NV-Generate-MR-Brain:合成的な3D脳MRIデータを生成する基盤モデルをリリース。
これらに共通するのは「高性能化」と「低価格化」が同時に進んでいる点です。特にAPI利用料の継続的な下落は、日本のスタートアップや個人開発者がAIをプロダクトに組み込むハードルを下げる追い風になると予想されます。
まとめ:AIは「検証可能な成果」を出す段階へ
2026年5月25日号の最大の注目ポイントは、やはりGoogle DeepMindのAlphaProof Nexusによる数学ブレイクスルーです。これまでAIの能力は「もっともらしい文章を生成する」ことに偏りがちでしたが、今回の成果は形式的に検証可能な、本物の数学的成果をAIが生み出せることを示しました。Claude Mythosによる脆弱性発見も含め、2026年のAIは「生成」から「生成+検証」へと軸足を移しつつあると考えられます。
今後の動向として、(1)新しい数学的構成を要する問題へのAIの挑戦、(2)Mythosクラスのセキュリティモデルの一般提供、(3)API価格のさらなる下落、の3点が焦点になると予想されます。日本のビジネスパーソンにとっては、AIを「文章作成の道具」と捉えるだけでなく、「検証可能な成果を高速に生み出すパートナー」として業務に組み込む発想が、これからの競争力を左右すると言えるでしょう。最新動向を継続的に追いながら、自分の業務にどう活かせるかを考えていきましょう。

コメント