Biomni:スタンフォード発・ 汎用バイオメディカルAI エージェントの実力と可能性 Science Aid Portal

Biomni:スタンフォード発・汎用バイオメディカルAIエージェントの実力と可能性


Biomni:スタンフォード発・汎用バイオメディカルAIエージェントの実力と可能性

研究現場に広がるBiomniへの関心

2025年6月にスタンフォード大学から発表された「Biomni」が、国内の研究現場でも注目を集めています。筆者の周りでも、大手製薬企業や創薬スタートアップの研究者から「試しに使ってみた」という声がちらほら聞こえてきます。GitHubでソースコードが公開されたのが7月9日ですから、わずか4ヶ月でこれだけの関心を集めているのは、やはり研究者たちが日々直面している「情報処理の複雑さ」への切実なニーズがあるからでしょう。

現代の生物医学研究では、研究者は日常的に複数のツールやデータベースを使い分けています。PubMedでの文献検索、UniProtでのタンパク質情報確認、ChEMBLでの化合物活性データ取得、KEGGでのパスウェイ解析——これらを横断的に扱い、統合的な知見を導き出すことは、経験豊富な研究者でも多大な時間と労力を要します。

Biomniが提案するのは、この複雑な情報処理を「汎用AIエージェント」で自動化するという野心的なアプローチです。しかし、その真の革新性は単なる自動化ではなく、生物学的課題を巧妙に「コード生成・実行問題」に変換した設計思想にあります。

統合的エージェント環境という革新的設計

Biomniの最も注目すべき点は、流行りの「マルチエージェント型」ではなく、あえて「単一の汎用エージェント」を選択したことです。多くのAIシステムが専門特化型エージェントを複数組み合わせる方向に進む中、なぜスタンフォードのチームは逆の道を選んだのでしょうか。

答えは「ツール数の増加による精度低下問題」への対処にあります。従来のアプローチでは、扱うツールが増えるほどエージェントの判断精度が低下し、誤った選択や実行エラーが増加する傾向がありました。Biomniはこの問題を、生物学的な問いを「コード生成・実行」という単一のフレームワークに落とし込むことで解決しています。

Biomniは2つの主要なコンポーネントで構成されています:統合的エージェント環境である「Biomni-E1」と、その環境上で動作する汎用エージェント「Biomni-A1」です。それぞれが異なる役割を担い、協調して複雑な生物医学タスクを処理します。

Biomni-E1:エージェント環境の基盤

Biomni-E1は、エージェントの相互作用のための生物医学アクション空間を定義する基盤環境です。この環境に含めるツールを選定するために、事前に生物学文献リポジトリの25の分野にまたがる論文からデータベースやツールを選定しています。その結果、Biomni-E1には150の専門的な生物医学ツール、105のソフトウェアパッケージ、59のデータベースが統合されています。

Biomni-A1:CodeActフレームワークの実装

Biomni-A1(汎用エージェント)は、CodeActという近年注目を浴びているフレームワークを採用しています(新進気鋭のAIエージェントサービスManusでも採用されていると言われています)。

CodeActとは、LLM(大言語モデル)が直接実行可能なプログラムを生成するアプローチです。従来のエージェントがテキストやJSONを出力してシステムが解釈・実行していたのに対し、CodeActではLLMが生成したコードそのものを実行します。これにより、複雑な制御フロー(if文やfor文)やデータ処理を一度に表現したり、データベースから取得した結果を科学計算ライブラリで分析して結果を出力することできます。さらに、実行時にエラーが発生しても、LLMがエラーメッセージを読んで自動的にコードを修正する機能も備えています。

エージェントに複数のツールを利用させる場合、ツール間のデータのやりとりやデータ型の整形はLLMの推論能力に依存しており、それが精度低下の一因になっていました。CodeActはそのような課題をソフトウェア開発的な視点で解決したものになります。

実証された性能と現実的な評価

Biomniの性能は、複数のベンチマークで検証されています:

ベンチマーク結果

  • Humanity’s Last Exam(HLE):生物学14分野から抜粋した52問で汎用LLMを上回る性能を達成
  • LAB-Bench(ライフサイエンス実務):特にDbQA(データベース問答)とSeqQA(配列解析)で高性能を示す

これらの標準的なベンチマークで科学的能力を定量評価したことに加え、研究チームは独自により現場の課題に近い8つの実世界タスクも作成し、評価を行いました。これには以下が含まれます:

  • 変異体優先順位付けとGWAS因果遺伝子検出(遺伝学・ゲノミクス)
  • 摂動スクリーン設計(機能ゲノミクス、免疫学)
  • 患者遺伝子優先順位付け、希少疾患診断(臨床ゲノミクス)
  • ドラッグリポジショニング(薬理学)
  • マイクロバイオーム疾患-分類群バイオインフォマティクス解析(微生物学)
  • シングルセルRNA-seq細胞アノテーション(シングルセル生物学)

これらの多様なシナリオにおいて、従来手法を上回る性能を示しました。

実験成功率に関する定量評価の課題

一方で、現実的な課題も指摘しておく必要があります。論文では、AIが提案した実験プロトコルを基に人間の研究者が実際に実験を行い、有用な結果が得られたと述べられています。しかし、何件の提案のうち何件が実際に有用だったのか、具体的な成功率については言及されていません。

もし人間の専門家と同等の精度であれば、その定量的な比較結果をアピールするはずです。この点が明示されていないことから、現段階では提案の成功率はチャンスレート(偶然の確率)と同程度である可能性も考慮する必要があります。

この認識は重要です。AIエージェントを過度に理想化せず、現実的な期待値を持って活用することが、実用的な成果につながります。

実用的な応用シナリオ

Biomniの応用可能性は幅広く、以下のようなシナリオで特に効果を発揮します:

1. 複合データの統合解析

ウェアラブルデバイスからの生体データ、オミクス解析結果、臨床試験データなど、異種のデータソースを統合して包括的な知見を導き出すタスクで威力を発揮します。従来は各専門家が個別に解析していたデータを、Biomniが横断的に処理し、見落とされがちな相関関係を発見できる可能性があります。

2. データベース横断検索

KEGG、Reactome、BioCycなど複数のパスウェイデータベースを同時に検索し、特定のタンパク質や化合物に関する包括的な情報を収集。研究者が手動で行えば数日かかる作業を、数時間で完了できます。

3. 文献情報の自動統合

PubMedから関連論文を収集し、その内容を解析して、研究トピックに関する最新の知見をまとめたレポートを自動生成。特に、新しい研究分野に参入する際のキャッチアップに有効です。

4. 実験設計の効率化

過去の論文やプロトコルデータベースから類似実験を検索し、最適な実験条件を提案。試行錯誤の時間を大幅に短縮できます。

Science Aid × 京都大学:Biomniカスタマイズの取り組み

Science Aid株式会社と京都大学医学研究科奥野研究室は、Biomniの技術を基盤として、創薬研究に特化したAIエージェントの開発を進めています。

プロジェクトの狙い

このプロジェクトでは、標的タンパク質に関わる膨大なデータベースや文献情報を横断的に解析し、以下の機能を実現することを目指しています:

  • 標的機能関係情報レポートの自動生成:UniProt、ChEMBL、PDBなどから標的タンパク質の包括的な情報を収集・整理
  • 立体構造を基盤とした解析レポート:AlphaFold DBと実験構造データを統合した構造解析
  • 創薬計算における戦略提案:過去の成功事例と失敗事例を学習し、最適なアプローチを提案

「一気通貫」支援の実現

従来、研究者の手作業に依存していた標的サイトの情報収集から戦略立案までのプロセスを、AIエージェントが一気通貫で支援します。これにより、創薬研究のスピードアップとコスト削減を同時に実現することが期待されています。

重要なのは、このカスタマイズが単なるツールの追加ではなく、創薬研究のワークフローに最適化された設計になっている点です。Science Aidの強みは、生成AI登場前からライフサイエンス領域に従事してきた経験と、再現性・透明性・ガバナンスを重視した現場主義的アプローチにあります。

📺 ウェビナーアーカイブで実例を確認

Biomniのカスタマイズ事例について、より詳しく知りたい方へ

Science Aidが実際にどのようにBiomniをカスタマイズし、研究現場で活用しているか、具体的な事例をウェビナーでご紹介しています。デモンストレーションを交えながら、AIエージェントが研究をどう変革するかを解説しました。

Biomni デモンストレーション - AIエージェントで変わる研究業務

視聴は無料です。フォーム入力後、すぐにアーカイブ動画をご覧いただけます。

今後の展望:AIエージェントの進化方向

Biomniが示すAIエージェントの進化には、いくつかの重要な示唆があります。

ツール記述の拡充による精度向上

現在のBiomniのPubMed検索ツールは非常にシンプルな実装(pymedライブラリのラッパー)です。これをより詳細なツール記述に拡充することで、検索精度の大幅な向上が期待できます。例えば、検索条件の細かな指定、結果のフィルタリング、関連度スコアリングなどの機能を追加することで、より研究者のニーズに合った検索が可能になるでしょう。

カスタムエージェント開発の可能性

Biomniのオープンソース化(Apache-2.0ライセンス)により、各研究機関や企業が独自のニーズに合わせたカスタマイズが可能になっています。特に以下のような領域でのカスタマイズが有望です:

  • 特定疾患領域への特化:がん、神経変性疾患、感染症など、特定の疾患に関する知識とツールを強化
  • 社内データベースとの統合:企業固有の研究データや知見を組み込んだプライベートエージェント
  • 規制対応の自動化:薬事申請に必要な文書作成や規制要件チェックの自動化

AIと人間の協調による研究加速

最も重要なのは、AIエージェントを「研究者の置き換え」ではなく「研究者の増強」として位置づけることです。Biomniのような汎用エージェントは、情報収集や初期解析といった時間のかかる作業を自動化し、研究者がより創造的で価値の高い活動に集中できる環境を作り出します。

おわりに:AI for Science時代の研究戦略

Biomniは、AI for Scienceの現在地を示す重要なマイルストーンです。多様なツールを統合的に扱える汎用エージェントの登場は、研究のあり方を根本的に変える可能性を秘めています。

しかし同時に、「定量的評価の欠如」という現実も直視する必要があります。AIエージェントは万能ではなく、適切な期待値管理と継続的な改善が不可欠です。

Science Aidでは、Biomniのような最新技術を基盤としながら、実用性と信頼性を重視したAIエージェント開発を進めています。研究現場の課題を深く理解し、真に価値のあるソリューションを提供することが、AI for Science時代の成功の鍵となるでしょう。

AIエージェント開発にご興味のある方は、ぜひコンタクトページよりお気軽にご相談ください。貴社の研究課題に最適なソリューションを一緒に探っていきましょう。

参考文献・リンク


Contact

Science Aidは、研究を中心とした幅広い領域をAIによって支援します。システム開発やコンサルティング、共同研究、セミナーのご依頼などお気軽にご相談ください