著者: Stanford HAI (Stanford Institute for Artificial Intelligence)コンピレーション:フェリックス、PANewsスタンフォード HAI は最近、456 ページにわたる「2025 年人工知能指数レポート」を発表しました。以下は人工知能のトレンドに関するいくつかの重要なポイントです:### **1.****人工知能は想像以上に強力になっている**新しいベンチマークである MMMU、GPQA、SWE-bench において、人工知能のパフォーマンスが大幅に向上しました:スコアはそれぞれ 18.8%、48.9%、67.3% 増加しました。ベンチマーク以外にも、人工知能システムは高品質のビデオ生成において重要な進展を遂げており、場合によっては、大規模言語モデル(LLM)が時間制限のあるプログラミングタスクで人間を超えることさえあります。凝らす:MMMUは、大学レベルの多分野・多モーダル理解と推論のために特別に設計された新しい基準であり、幅広いタスクにおける基礎モデルの専門的な多モーダル理解能力を評価することを目的としています。GPQAは、448問の異なる分野の専門家によって作成された高品質で非常に難易度の高い多肢選択問題を含む挑戦的なデータセットです。該当分野で博士号を取得または取得中の専門家の正答率は65%に過ぎず、スキルの高い非専門家の検証者は、平均して30分以上の時間をかけ、制限なくインターネットにアクセスできるにもかかわらず、正答率は34%にとどまります。SWE-bench は、GitHub から収集した実世界のソフトウェア問題に対する大規模言語モデル(LLM)のパフォーマンスを評価するためのベンチマークです。! [Stanford HAI 2025 Artificial Intelligence Index Report Highlights](https://img.gateio.im/social/moments-ea10e02115dc2a4cb0e9a9b423bfd3d8)### **2.****人工知能はより効率的で、よりアクセスしやすく、より経済的です**パラメータが少ない小型人工知能モデルの能力がますます向上しています:わずか2年で、パラメータの数が約100倍減少しましたが、それでも大規模多タスク言語理解(MMLU)テストでのスコアは60%を超えています。オープンソースモデルとクローズドソースモデルの間のギャップも縮小しており、特定のベンチマークテストでは、パフォーマンスのギャップが8%からわずか1.7%に減少しています。! [Stanford HAI 2025 Artificial Intelligence Index Report Highlights](https://img.gateio.im/social/moments-f2f473b9274c0d2f1d8e6a0ca05c855c)さらに、2022年11月から2024年10月までの間に、GPT-3.5レベルのシステムの推論コストは280倍以上減少しました。ハードウェアのレベルでは、コストは毎年30%減少し、エネルギー効率は毎年40%向上しています。高度な人工知能のハードルが急速に低下しています。DeepSeekのようなスパースモデルの開発は言うまでもなく、専門家の混合(MoE)構造の下で、関連するパラメータのみがユーザーのクエリに答えるためにアクティブ化され、全体のプロセスがより効率的になります。確かに、規模が小さいが能力が高いAIモデルが次々と登場する中で、AIモデルのトレーニング要件は低下し、コスト効果の高い分散トレーニングが今後10年で主流になることが期待されています。現在、異なる理論的枠組みに基づいて関連研究を行っているいくつかのトッププロジェクトがあります。### **3.****人工知能はますます日常生活に統合されています**2023年、アメリカ食品医薬品局(FDA)は223種類のAI支援医療機器を承認しましたが、2015年にはこの数字はわずか6種類でした。自動運転車はもはや実験的なものではありません。アメリカの最大のオペレーターの1つであるWaymoは、週に15万回以上の自動運転サービスを提供しており、百度のApollo Go無人タクシー隊は現在中国の複数の都市で運行されています。! [Stanford HAI 2025 Artificial Intelligence Index Report Highlights](https://img.gateio.im/social/moments-70d675efe59455ce28c970e9c504b401)### **4.****企業の人工知能分野への投資が大幅に増加し、記録的な投資と応用を推進しています**ビジネスにおける人工知能の応用も加速しています:2024年には、78%の組織が人工知能を使用しており、前年の55%から増加しています。一方で、ますます多くの研究が、人工知能が生産性を向上させ、全体の労働力のスキルギャップを縮小するのに役立つことを確認しています。実際、人工知能によって顧客の期待値が指数関数的に増加するにつれて、既存のソリューションは一夜にして時代遅れに思えるようになり、既存の企業が適応する機会を失うことになります。製品市場適合性の崩壊がより頻繁に発生するでしょう。### **5.****世界的人工知能に対する楽観的な感情が高まる中、アジアの人々は人工知能に対してさらに楽観的である**中国(83%)、インドネシア(80%)、タイ(77%)などの国々では、ほとんどの人々が人工知能の製品とサービスは利益が害よりも大きいと考えています。それに対して、カナダ(40%)、アメリカ(39%)、オランダ(36%)などでは、楽観的な感情は依然としてこれを大きく下回っています。しかし、この態度は変化しつつあります:2022年以来、以前は懐疑的だったいくつかの国の楽観的な感情が著しく増加しています。ドイツ(10%増)、フランス(10%増)、カナダ(8%増)、イギリス(8%増)、アメリカ(4%増)を含みます。! [Stanford HAI 2025 Artificial Intelligence Index Report Highlights](https://img.gateio.im/social/moments-1dd6075d8adcc9da8c3cebf12efe16d0)### **6.****人工知能の研究における影響力がますます強まっており、科学の進歩を推進する重要な原動力となっています**人工知能の重要性の高まりは、重要な科学賞に反映されています:2つのノーベル賞はそれぞれ、深層学習(物理学)とその蛋白質折りたたみ(化学)への応用に貢献した研究に授与され、チューリング賞は強化学習における先駆的な貢献を称えています。明らかに、人工知能は指数関数的で予想外の速度で急速に発展しており、これはほとんどの人にとって非常に重要です。そのため、人工知能の安全性もますます重要になっています。人工知能は偽造を容易にする一方で、暗号学は偽造をさらに困難にします。ブロックチェーンのネイティブ特性(検証可能性と透明性)を利用してこの分野の実用的なソリューションを構築できる暗号プロジェクトを楽しみにしています。関連記事:a16zの創設者クリス・ディクソンへのインタビュー:人工知能と暗号技術の交差
スタンフォードHAI『2025年人工知能指数レポート』の要約
著者: Stanford HAI (Stanford Institute for Artificial Intelligence)
コンピレーション:フェリックス、PANews
スタンフォード HAI は最近、456 ページにわたる「2025 年人工知能指数レポート」を発表しました。以下は人工知能のトレンドに関するいくつかの重要なポイントです:
**1.**人工知能は想像以上に強力になっている
新しいベンチマークである MMMU、GPQA、SWE-bench において、人工知能のパフォーマンスが大幅に向上しました:スコアはそれぞれ 18.8%、48.9%、67.3% 増加しました。ベンチマーク以外にも、人工知能システムは高品質のビデオ生成において重要な進展を遂げており、場合によっては、大規模言語モデル(LLM)が時間制限のあるプログラミングタスクで人間を超えることさえあります。
凝らす:
MMMUは、大学レベルの多分野・多モーダル理解と推論のために特別に設計された新しい基準であり、幅広いタスクにおける基礎モデルの専門的な多モーダル理解能力を評価することを目的としています。
GPQAは、448問の異なる分野の専門家によって作成された高品質で非常に難易度の高い多肢選択問題を含む挑戦的なデータセットです。該当分野で博士号を取得または取得中の専門家の正答率は65%に過ぎず、スキルの高い非専門家の検証者は、平均して30分以上の時間をかけ、制限なくインターネットにアクセスできるにもかかわらず、正答率は34%にとどまります。
SWE-bench は、GitHub から収集した実世界のソフトウェア問題に対する大規模言語モデル(LLM)のパフォーマンスを評価するためのベンチマークです。
! Stanford HAI 2025 Artificial Intelligence Index Report Highlights
**2.**人工知能はより効率的で、よりアクセスしやすく、より経済的です
パラメータが少ない小型人工知能モデルの能力がますます向上しています:わずか2年で、パラメータの数が約100倍減少しましたが、それでも大規模多タスク言語理解(MMLU)テストでのスコアは60%を超えています。
オープンソースモデルとクローズドソースモデルの間のギャップも縮小しており、特定のベンチマークテストでは、パフォーマンスのギャップが8%からわずか1.7%に減少しています。
! Stanford HAI 2025 Artificial Intelligence Index Report Highlights
さらに、2022年11月から2024年10月までの間に、GPT-3.5レベルのシステムの推論コストは280倍以上減少しました。ハードウェアのレベルでは、コストは毎年30%減少し、エネルギー効率は毎年40%向上しています。
高度な人工知能のハードルが急速に低下しています。DeepSeekのようなスパースモデルの開発は言うまでもなく、専門家の混合(MoE)構造の下で、関連するパラメータのみがユーザーのクエリに答えるためにアクティブ化され、全体のプロセスがより効率的になります。
確かに、規模が小さいが能力が高いAIモデルが次々と登場する中で、AIモデルのトレーニング要件は低下し、コスト効果の高い分散トレーニングが今後10年で主流になることが期待されています。現在、異なる理論的枠組みに基づいて関連研究を行っているいくつかのトッププロジェクトがあります。
**3.**人工知能はますます日常生活に統合されています
2023年、アメリカ食品医薬品局(FDA)は223種類のAI支援医療機器を承認しましたが、2015年にはこの数字はわずか6種類でした。自動運転車はもはや実験的なものではありません。アメリカの最大のオペレーターの1つであるWaymoは、週に15万回以上の自動運転サービスを提供しており、百度のApollo Go無人タクシー隊は現在中国の複数の都市で運行されています。
! Stanford HAI 2025 Artificial Intelligence Index Report Highlights
**4.**企業の人工知能分野への投資が大幅に増加し、記録的な投資と応用を推進しています
ビジネスにおける人工知能の応用も加速しています:2024年には、78%の組織が人工知能を使用しており、前年の55%から増加しています。一方で、ますます多くの研究が、人工知能が生産性を向上させ、全体の労働力のスキルギャップを縮小するのに役立つことを確認しています。
実際、人工知能によって顧客の期待値が指数関数的に増加するにつれて、既存のソリューションは一夜にして時代遅れに思えるようになり、既存の企業が適応する機会を失うことになります。製品市場適合性の崩壊がより頻繁に発生するでしょう。
**5.**世界的人工知能に対する楽観的な感情が高まる中、アジアの人々は人工知能に対してさらに楽観的である
中国(83%)、インドネシア(80%)、タイ(77%)などの国々では、ほとんどの人々が人工知能の製品とサービスは利益が害よりも大きいと考えています。それに対して、カナダ(40%)、アメリカ(39%)、オランダ(36%)などでは、楽観的な感情は依然としてこれを大きく下回っています。
しかし、この態度は変化しつつあります:2022年以来、以前は懐疑的だったいくつかの国の楽観的な感情が著しく増加しています。ドイツ(10%増)、フランス(10%増)、カナダ(8%増)、イギリス(8%増)、アメリカ(4%増)を含みます。
! Stanford HAI 2025 Artificial Intelligence Index Report Highlights
**6.**人工知能の研究における影響力がますます強まっており、科学の進歩を推進する重要な原動力となっています
人工知能の重要性の高まりは、重要な科学賞に反映されています:2つのノーベル賞はそれぞれ、深層学習(物理学)とその蛋白質折りたたみ(化学)への応用に貢献した研究に授与され、チューリング賞は強化学習における先駆的な貢献を称えています。
明らかに、人工知能は指数関数的で予想外の速度で急速に発展しており、これはほとんどの人にとって非常に重要です。そのため、人工知能の安全性もますます重要になっています。人工知能は偽造を容易にする一方で、暗号学は偽造をさらに困難にします。ブロックチェーンのネイティブ特性(検証可能性と透明性)を利用してこの分野の実用的なソリューションを構築できる暗号プロジェクトを楽しみにしています。
関連記事:a16zの創設者クリス・ディクソンへのインタビュー:人工知能と暗号技術の交差