【ИИ непрозрачен? Как Datanets делает данные "отслеживаемыми"】



В ходе волны взрывного роста ИИ за последний год большие модели неоднократно обновляли технологические пределы, однако выявили одну неразрешимую проблему — проблему черного ящика источников данных. Мы не можем узнать, на основе каких корпусных данных была обучена модель, кто предоставил ключевые данные, и не можем оценить, нарушает ли вывод модели чьи-либо права на контент. Эта "непрозрачность" становится препятствием для дальнейшего масштабирования ИИ.

А точка входа OpenLedger заключается в разрешении этой глубинной структурной проблемы — реконструкция прозрачности и логики стимулов ИИ с точки зрения данных, и его ключевой инструмент: Datanets.

Что такое Datanets? Набор архитектур сетей данных, созданный для ИИ.

Datanets — это основная система, построенная OpenLedger, целью которой является сделать данные, используемые AI-моделями, "прослеживаемыми" и "подлежащими количественной оценке". Это не просто база данных или краудсорсинговая платформа, а модульная сетевую систему, которая сочетает в себе подтверждение прав на цепочке, управление задачами и экономические стимулы, позволяя структурированно организовать процесс предоставления, обработки и потребления данных.

Каждый Datanet представляет собой конкретное пространство для сбора данных и совместной работы над задачами, сосредоточенное вокруг определенной вертикальной области, такой как индикаторы DeFi, представление проектов NFT, корпуса диалогов AI и т. д. Этот дизайн отражает понимание OpenLedger экосистемы "специальных языковых моделей (SLM)": не столько важно собрать как можно больше данных, сколько получить данные более высокого качества и более специализированные для определенной области.

2. Ядро механизма: PoA, Infini-gram и новый парадигма сотрудничества данных

OpenLedger внедрил два ключевых механизма в Datanets, реконструировав традиционный процесс «предоставление данных → обучение модели»:

(1) Доказательство атрибуции (PoA): механизм, используемый для записи связи между вкладчиком данных и результатами ИИ. Он позволяет каждой выдаче модели частично "отслеживать источник" данных, участвовавших в обучении, что позволяет осуществлять отслеживаемое распределение вознаграждений.

(2) Infini-gram модельный элемент: OpenLedger использует более гибкий дизайн микромодулей модели, разделяя модель на более мелкие компоненты, каждый из которых может быть связан со своим соответствующим источником данных. Этот дизайн не только улучшает комбинируемость модели, но и делает возможным "подотчетность по данным".

Datanets не существуют изолированно, а связаны с Agents и Payable AI моделями через модульные интерфейсы, создавая полную цепочку «задача – данные – модель – приложение». Это также означает, что в будущем вы сможете не только предоставлять данные, но и участвовать в обучающих задачах, использовать модели и получать обратную связь и доход.

Третье, что решает Datanets по сравнению с традиционным краудсорсингом и платформами для аннотирования данных?

В прошлом мы видели множество платформ для краудсорсинга данных Web2, таких как Amazon Mechanical Turk, Scale AI и другие, которые добились определенных успехов в масштабе, но у них есть две общие проблемы:

(1) Данные без принадлежности: данные, предоставленные участниками, в конечном итоге принадлежат платформе, и как только они используются ИИ, их трудно отслеживать или делить доходы.

(2) Разрозненные и повторяющиеся задачи без стимула: многие задачи лишены долгосрочных целей или структурированного сотрудничества, что приводит к повторяющейся работе и затрудняет обеспечение качества данных.

Цель Datanets заключается в том, чтобы превратить «данные задачи» в долгосрочный совместный актив, а не в одноразовую эксплуатацию платформы, а в установление устойчивых отношений. Ваши предоставленные данные являются активом на блокчейне, задачи, в которых вы участвуете, представляют собой компонуемые модули, а ваш вклад может быть использован любыми последующими моделями и получать вознаграждение.

Четыре, Итоги: Datanets является специализированной инфраструктурой данных эпохи ИИ

OpenLedger не пытается стать следующим ChatGPT, а хочет решить основную проблему, которую не может решить ChatGPT: как можно перестроить логическую структуру данных AI?

Представление и практика Datanets показывают, что OpenLedger рассматривает "прозрачность, сотрудничество и измеримость" как основные принципы системы данных, что является наиболее сущностным ответом на AI в контексте Web3. Будет ли AI модель достойна доверия в будущем, возможно, зависит не от размера параметров, а от того, сможет ли она "объяснить, какие данные используются".
DEFI8.17%
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить