【AIは不透明?Datanetsから見るデータが「トレーサブル」になる方法】



過去1年間のAIの爆発的な波の中で、大規模モデルは技術の限界を何度も更新しましたが、それと同時に常に解決されていない問題を露呈しました。それはデータソースのブラックボックス問題です。私たちは、モデルがどのようなコーパスで訓練されているのか、誰が重要なデータを提供したのかを知ることができず、モデルの出力が誰のコンテンツ権利を侵害しているかを判断することもできません。この「不透明さ」は、AIのさらなる規模化の障害となっています。

OpenLedgerの切り口は、この深層的な構造的問題を打破することにあります。データを基にAIの透明性とインセンティブの論理を再構築することが、その核心的な手段です:Datanets。

一、Datanetsとは何ですか?AIのために生まれたデータネットワークアーキテクチャ

DatanetsはOpenLedgerが構築したコアシステムで、AIモデルが使用するデータに「追跡可能性」と「計量的インセンティブ」を与えることを目的としています。それは単なるデータベースやクラウドソーシングプラットフォームではなく、オンチェーンの権利確定、タスク管理、経済的インセンティブを組み合わせたモジュール式ネットワークシステムであり、データの提供、加工、消費プロセスを構造的に組織することができます。

各 Datanet は具体的なデータ収集とタスク協力のスペースであり、特定の垂直分野に基づいて展開されています。例えば、DeFi 指標、NFT プロジェクトの紹介、AI の対話コーパスなどです。この設計は、OpenLedger が「専用言語モデル(SLM)」エコシステムを理解していることを示しています:多くのデータを取得することが重要なのではなく、より高品質でより特定の分野に特化したデータを取得することが重要です。

二、メカニズムの核心:PoA、Infini-gram とデータ協力の新しいパラダイム

OpenLedgerはDatanetsに2つの重要なメカニズムを導入し、従来の「データ提供 → モデル訓練」のプロセスを再構築しました:

(1)アトリビューションの証明(PoA):データ提供者とAI生成物との関係を記録するためのメカニズムです。これは、モデルの各出力が訓練に参加したデータに部分的に「遡る」ことを可能にし、インセンティブの追跡可能な配分を実現します。

(2)Infini-gram モデルユニット:OpenLedger は、モデルをより細かなコンポーネントに分割する柔軟なモデルマイクロモジュール設計を採用しています。各コンポーネントは、それに対応するデータソースにバインドできます。この設計は、モデルの組み合わせ性を向上させるだけでなく、「データに基づく責任追及」を可能にしました。

Datanetsは孤立して存在するのではなく、モジュラーインターフェースを介してAgentsやPayable AIモデルと接続され、「タスク – データ – モデル – アプリケーション」の完全なフローリンクを構築します。これはつまり、将来的にはデータを提供するだけでなく、トレーニングタスクに参加し、モデルを使用し、フィードバックや利益を得ることもできるということです。

三、従来のクラウドソーシングとデータアノテーションプラットフォームと比較して、Datanetsは何を解決しましたか?

これまで私たちは、Amazon Mechanical Turk、Scale AIなどの多くのWeb2クラウドデータプラットフォームを目にしてきました。それらは規模の上で一定の成果を上げてきましたが、一般的に2つの問題が存在します:

(1)データの帰属なし:参加者が提供するデータは最終的にプラットフォームの所有となり、一度AIに使用されると、その後の追跡や利益分配が難しくなる。

(2)タスクが散発的で繰り返しでインセンティブがない:多くのタスクは長期的な目標や構造化された協力が欠けており、結果として重複作業が発生し、データの質を保証することが難しくなっています。

Datanetsの目標は、「データタスク」を長期的な協力資産に変えることです。もはやプラットフォームの一回限りの搾取行為ではなく、持続的な関係を築くことです。あなたが提供するデータはオンチェーン資産であり、あなたが参加するタスクは組み合わせ可能なモジュールです。あなたの貢献は、後続のどのモデルにも呼び出され、報酬を得ることができます。

四、小结:Datanets は専用の AI 時代のデータインフラです

OpenLedgerは次のChatGPTになろうとするのではなく、AIのデータ生成ロジックをどのように再構築するかという根本的な問題を解決しようとしています。

Datanetsの提案と実践は、OpenLedgerが「透明性、協力、計測可能性」をデータシステムの核心原則としていることを示しています。これはWeb3の文脈におけるAIへの最も本質的な応答の一つです。未来のAIモデルが信頼に値するかどうかは、パラメータの規模ではなく、「使用されるデータを明確に説明できるかどうか」に依存するかもしれません。
DEFI8.17%
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)