元Google CEOエリック・シュミット氏: 人工知能は科学研究のやり方をどう変えるか

作者: エリック シュミット

出典: MIT テクノロジーレビュー

画像の出典: Unbounded AI ツールによって生成

今年も異常気象の夏が到来し、前例のない熱波、山火事、洪水が世界中の国を襲っている。このような異常気象を正確に予測するという課題に対処するために、半導体大手エヌビディアは、人工知能を活用した地球全体の「デジタルツイン」を構築しています。

Earth-2 と呼ばれるデジタル ツインは、FourCastNet の予測を使用します。 FourCastNet は、数十テラバイトの地球システム データを使用して、今後 2 週間の天気を現在の予測方法よりも迅速かつ正確に予測する人工知能モデルです。

一般的な天気予報システムは、1 週間先の予測を約 50 件生成できます。また、FourCastNet は何千もの可能性を予測し、まれではあるが致命的な災害リスクを正確に捉え、脆弱な人々に準備と避難のための貴重な時間を与えることができます。

長く待ち望まれていた気候モデリングの革命はまだ始まりにすぎません。人工知能の出現により、科学はさらに刺激的なものになろうとしていますが、ある意味では認識が難しくなります。この変化の影響は研究室をはるかに超えて、私たち全員に影響を与えるでしょう。

健全な規制と AI の革新的な使用に対する適切なサポートによって、科学の最も差し迫った問題に対処するための適切な戦略を採用すれば、AI は科学のプロセスを書き換えることができます。 AI を利用したツールが、私たちを無分別で時間のかかる労働から解放するだけでなく、創造的な発明や発見に導き、それがなければ達成するには数十年かかるであろう画期的な進歩を促す未来を私たちは築くことができます。

ここ数カ月間、人工知能は大規模言語モデル (LLM) とほぼ同義語になりましたが、科学の分野では、さらに大きな影響を与える可能性のあるさまざまなモデル アーキテクチャが数多く存在します。過去 10 年間の科学の進歩の多くは、特定の問題に焦点を当てた小規模な「古典的」モデルを通じて行われてきました。これらのモデルは大幅な改善につながりました。最近では、クロスドメインの知識と生成 AI を組み込み始めた大規模な深層学習モデルにより、可能な範囲が拡大しました。

たとえば、マクマスター大学とマサチューセッツ工科大学の科学者たちは、AI モデルを使用して、世界保健機関が入院患者にとって世界で最も危険な抗生物質耐性菌の 1 つであるとしている病原体と戦うための抗生物質を特定しました。さらに、Google の DeepMind モデルは核融合反応におけるプラズマを制御できるため、クリーン エネルギー革命に近づくことができます。またヘルスケア分野では、米国食品医薬品局は人工知能を使用する 523 台のデバイスを承認しており、そのうち 75% は放射線科で使用されています。

科学の再考

基本的に、小学校で学んだ科学プロセスは変わりません。背景調査を実施し、仮説を特定し、実験で検証し、収集したデータを分析して、結論を導き出します。しかし、人工知能はこれらのコンポーネントの将来の外観に革命を起こす可能性を秘めています。

AI は、一部の科学者が文献調査を行う方法をすでに変え始めています。 PaperQA や Elicit などのツールは、LLM を利用して記事データベースをスキャンし、引用を含む既存の文献の簡潔かつ正確な要約を作成します。

文献レビューが完了すると、科学者は検証する仮説を立てます。 LLM の中核的な仕事は、文内の次の単語を、完全な文と段落に至るまで予測することです。この手法により、LLM は科学の階層構造に固有の規模に対処するのに特に適しており、物理学や生物学における次の大きな発見を予測できるようになります。

AI は、仮想の検索ネットをより速く拡大したり、検索ネットを縮小したりすることもできます。したがって、AI ツールは、より有望な新薬候補を示唆するモデルなど、より強力な仮説を立てるのに役立ちます。現在、シミュレーションは数年前に比べて桁違いに高速に実行されるため、科学者は実際の実験を行う前に、シミュレーションでより多くの設計オプションを試すことができます。

たとえば、カリフォルニア工科大学の科学者たちは、人工知能の流体シミュレーション モデルを使用して、細菌の逆流を防ぎ、感染症を引き起こすより優れたカテーテルを自動的に設計しました。この機能は、科学的発見の段階的なプロセスを根本的に変え、電球設計におけるフィラメントの革新で長年見てきたものとは異なり、研究者が最初から最適なソリューションを設計できるようにし、段階的に洗練された設計の長いチェーンを経て進歩します。

実験段階に入ると、人工知能はより速く、より安価に、より大規模な実験を行うことができるようになります。たとえば、人工知能を搭載した機械を構築し、数百の微小管を昼夜を問わず稼働させ、人間には太刀打ちできない速度でサンプルを作成することができます。科学者は 6 つの実験に制限する代わりに、AI ツールを使用して 1,000 の実験を実行できます。

次の助成金、出版、または在職期間のプロセスを心配している科学者は、成功の可能性が最も高い安全な実験に縛られることがなくなり、より大胆でより学際的な仮説を自由に追求できるようになります。たとえば、新しい分子を評価する場合、研究者は既知の分子と構造的に類似した候補に固執する傾向がありますが、AI モデルには同じバイアスや制限がある必要はありません。

最終的には、科学の多くは「自律型ラボ」、つまり人工知能と組み合わせられた自律型ロボットプラットフォームで行われるようになるでしょう。ここでは、人工知能の機能をデジタル領域から物理世界に持ち込むことができます。このような自動化されたラボは、Emerald Cloud Lab や Artificial などの企業、さらにはアルゴンヌ国立研究所でもすでに導入されています。

最後に、分析と要約のフェーズでは、自動ラボは自動化を超えて、LLM を使用して解釈し、生成された実験結果に基づいて実行する次の実験を推奨します。その後、研究プロセスのパートナーとして、AI ラボのアシスタントは、以前の実験で使用されたものと交換する消耗品を注文し、次の推奨実験を一晩でセットアップして実行できます。実験者たちがまだ家で寝ている間に結果が完成した。

可能性と限界

若い研究者たちは、この見通しを前に席で緊張して震えるかもしれない。幸いなことに、この革命によって生まれる新しい仕事は、現在のほとんどの研究室での仕事よりも創造的で、無神経ではないかもしれません。

AI ツールは、新しい科学者の参入障壁を下げ、従来この分野から排除されていた人々に機会を広げることができます。 LLM がコードの構築を支援できるようになると、STEM 学生は難解なコーディング言語を習得する必要がなくなり、新しい非伝統的な才能に象牙の塔の扉が開かれ、科学者が自分の専門外の分野に触れることが容易になります。間もなく、特別な訓練を受けた LLM が、助成金提案などの著作物の初稿を提供するだけでなく、人間の査読者と一緒に新しい論文の「ピア」レビューを提供するように開発されるかもしれません。

AI ツールには信じられないほどの可能性がありますが、私たちは人間との接触が依然として重要であることを認識し、高くなりすぎないようにする必要があります。たとえば、自動化された研究室を通じて人工知能とロボット工学をうまく融合させるのは簡単ではありません。科学者が研究室で学ぶ暗黙知の多くは、AI を活用したロボット工学に移すのが困難です。同様に、私たちは現在の LLM に多くの書類作成、調査、分析を行う前に、その限界、特に幻覚について認識しておく必要があります。

OpenAI や DeepMind などの企業は、依然として新しいブレークスルー、モデル、研究論文で先頭に立っているが、現在の業界の優位性が永遠に続くわけではない。これまでのところ、DeepMind は、明確な目標と指標を使用して、明確に定義された問題に焦点を当てることに優れています。その最も有名な成功は、研究チームがアミノ酸配列に基づいてタンパク質の正確な形状を予測した、2 年に一度の構造予測コンペティションにおける重要な評価でした。

2006 年から 2016 年まで、最も難しいカテゴリの平均スコアは、1 ~ 100 の CASP スケールで約 30 ~ 40 でした。 2018 年に突然、DeepMind の AlphaFold モデルはなんと 58 ポイントを獲得しました。 2 年後、AlphaFold2 と呼ばれる更新バージョンは 87 ポイントを獲得し、人間のライバルをさらに引き離しました。

オープンソース リソースのおかげで、産業界が特定のベンチマークに達し、その後学界が介入してモデルを改良するというパターンが見え始めています。 DeepMind が AlphaFold をリリースした後、ワシントン大学の Minkyung Baek と David Baker は、DeepMind のフレームワークを使用して、AlphaFold が当初処理できた単一タンパク質構造ではなく、タンパク質複合体の構造を予測する RoseTTAFold をリリースしました。さらに、学術界は市場の競争圧力からより保護されているため、ディープマインドを惹きつけた明確な問題や目に見える成功を超えて冒険をすることができます。

AI は新たな高みに到達するだけでなく、科学的再現性の危機に対処することで、私たちがすでに知っていることを検証するのにも役立ちます。科学者の約 70% が、他の科学者の実験を再現できなかったと報告しました。これは憂鬱な数字です。 AI によって実験のコストと労力が削減されるため、場合によっては結果を再現したり、再現できない結論を導き出したりすることが容易になり、科学への信頼の向上に役立ちます。

複製可能性と信頼性の鍵は透明性です。理想的な世界では、ペイウォールのない記事からオープンソースのデータ、コード、モデルに至るまで、科学のすべてがオープンになるでしょう。残念ながら、このようなモデルには危険が伴うため、すべてのモデルをオープンソースにすることが常に現実的であるとは限りません。多くの場合、完全な透明性のリスクが信頼と公平性のメリットを上回ります。それでも、モデル、特に用途が限定された古典的な AI モデルについて透明性を保つことができる限り、それらをオープンソース化する必要があります。

規制の重要性

これらすべての分野において、AI に固有の制限とリスクを念頭に置く必要があります。 AI は、人間がより少ない時間、より少ない教育、より少ない設備でより多くのことを達成できるため、非常に強力なツールです。しかし、これらの機能は、悪者の手に渡る可能性のある危険な武器にもなります。ロチェスター大学のアンドリュー・ホワイト教授は、GPT-4のリスクをリリース前に暴露する可能性がある「レッドチーム」テストに参加するためにOpenAIと契約した。ホワイト氏は、言語モデルを使用し、ツールを提供することで、GPT-4 が危険な化合物を示唆し、さらには化学物質供給業者に注文できることを発見しました。このプロセスをテストするために、彼は翌週、(安全な) テスト化合物を自宅に発送しました。 OpenAIは、ホワイト氏の発見を利用してGPT-4をリリース前に微調整したと述べた。

完全に善意を持った人間であっても、AI を駆動して悪い結果を生み出す可能性はあります。私たちはターミネーターの作成についてあまり心配する必要はなく、コンピューター科学者のスチュアート・ラッセルが言うように、ミダス王になることについてもっと心配すべきです。王は自分が触れたものすべてを金に変えたいと考えていましたが、そのために誤って抱き合ってしまったために自分の娘が命を落としてしまいました。

AI が予測できない方法で目標に反応する場合でも、AI の目標を変更させるメカニズムはありません。よく引用される仮定は、AI ができるだけ多くのペーパークリップを作成するように求められるというものです。目標を達成することを決意したこのモデルは、送電網を乗っ取り、ペーパークリップが積み重なる中、送電網を止めようとする人間を殺害します。世界は混乱してしまいました。 AI は仕事を終えたので、尻をたたいて立ち去ります。 (この有名な思考実験に敬意を表して、OpenAI の従業員の多くはブランドの付いたペーパー クリップを持ち歩いています)。

OpenAI は、見事な一連の保護手段を実装することに成功しましたが、GPT-4 が OpenAI のサーバーに格納されている限り、それらの保護手段はそのまま残ります。誰かがモデルを複製して自分のサーバーに置く日が近いかもしれません。このような最先端のモデルは、元の開発者が慎重に追加した AI セキュリティ フェンスを窃盗犯が破壊するのを防ぐために保護する必要があります。

AI の意図的および意図的でない悪用に対処するには、科学に有益な方法で AI を使用することを妨げない、テクノロジー巨人とオープンソース モデルに対する賢明で情報に基づいた規制が必要です。テクノロジー企業が AI の安全性において進歩を遂げている一方で、政府規制当局は現在、適切な法律を制定する準備が整っていないため、最新の動向を把握するためにさらに努力する必要があります。

規制の外では、政府は慈善活動と併せて、高い社会的利益をもたらす科学プロジェクトを支援できますが、経済的利益や学術的インセンティブはほとんどありません。気候変動、バイオセキュリティ、パンデミックへの備えなど、いくつかの分野が特に緊急です。 AI シミュレーションと自動化されたラボによって提供されるスピードとスケールが最も必要なのは、これらの分野です。

セキュリティ上の考慮事項が許す限り、政府は、AlphaFold が依存しているような大規模で高品質のデータセットの開発を支援することもできます。オープン データセットは公共財です。多くの研究者に利益をもたらしますが、研究者自身がデータセットを作成する動機はほとんどありません。政府や慈善団体は大学や企業と協力して、堅牢なデータベースの使用から恩恵を受ける科学における大きな課題を特定できます。

たとえば、化学にはその分野を統一する言語があり、AI モデルによる分析が容易になるようです。しかし、数十のデータベースに保存されている分子特性データを適切に集約できる人は誰もおらず、ソースが 1 つしかない場合に AI モデルが達成できるような分野への洞察を否定しています。同時に、生物学には物理学や化学の基礎となる既知の計算可能なデータが不足しており、本質的に無秩序なタンパク質のような下位分野は私たちにとって謎のままです。そのため、包括的なデータベースを構築するには、データを理解し、さらには文書化するために、より協調的な努力が必要になります。

科学における AI の普及への道のりは長く、適切なデータベースの構築から適切な規制の施行、AI アルゴリズムの偏りの軽減、国境を越えたコンピューティング リソースへの平等なアクセスの確保まで、私たちはやるべきことがたくさんあります。

それにもかかわらず、これは非常に楽観的な瞬間です。科学プロセスやビッグデータの出現など、これまでの科学パラダイムシフトは内向きであり、科学をより正確かつ組織化できる可能性がありました。同時に、AI は拡張性があり、新しい方法で情報を組み合わせ、科学の創造性と進歩を新たな高みに押し上げることを可能にします。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)