【AI непрозорий? Як Datanets робить дані "відстежуваними"】



Протягом останнього року під час сплеску AI великі моделі неодноразово оновлювали технологічні межі, але водночас виявили одне невирішене питання — проблему чорної скриньки джерела даних. Ми не можемо знати, на яких корпусах навчалася модель, хто надав ключові дані, і не можемо оцінити, чи порушує вивід моделі чиїсь права на контент. Така "непрозорість" стає перешкодою для подальшої масштабної реалізації AI.

А точка входу OpenLedger полягає саме в розв'язанні цієї глибокої структурної проблеми — реконструкція прозорості та логіки стимулювання AI з боку даних, ключовим інструментом якої є: Datanets.

Одне. Що таке Datanets? Набір архітектур мережі даних, створених для AI.

Datanets є основною системою, побудованою OpenLedger, метою якої є забезпечення "простежуваності" та "кількісного стимулювання" даних, що використовуються AI моделями. Це не просто база даних або платформа краудсорсингу, а модульна мережна система, яка поєднує в собі підтвердження прав на блокчейні, управління завданнями та економічні стимули, що дозволяє структуровано організовувати процеси надання, обробки та споживання даних.

Кожен Datanet є конкретним простором для збору даних та співпраці над завданнями, який зосереджений на певній вертикальній сфері, такій як показники DeFi, презентація проектів NFT, корпуси діалогів AI тощо. Цей дизайн відображає розуміння OpenLedger екосистеми "спеціалізованих мовних моделей (SLM)": не скільки більше даних отримати, а скільки якісних та спеціалізованих даних.

Два, основа механізму: PoA, Infini-gram та нова парадигма даних співпраці

OpenLedger впровадила два ключових механізми в Datanets, реконструюючи традиційний процес "надання даних → навчання моделей":

(1)Proof of Attribution(PoA): механізм, що використовується для запису зв'язку між внесками даних і виходом AI. Він дозволяє кожному виходу моделі частково "відслідковуватися" до даних, залучених для навчання, що забезпечує можливість відстеження розподілу винагород.

(2) Модуль інфіні-грам: OpenLedger використовує більш гнучкий дизайн мікромодулів моделі, розділяючи модель на більш дрібні компоненти, кожен з яких може бути прив'язаний до відповідного джерела даних. Такий дизайн не лише підвищує комбінованість моделі, але й робить можливим "відповідальність за даними".

Datanets не існують ізольовано, а через модульні інтерфейси взаємодіють із Agents, Payable AI моделями, формуючи повний ланцюг «задача – дані – модель – застосування». Це також означає, що в майбутньому ви зможете не лише надавати дані, але й брати участь у навчальних завданнях, використовувати моделі та отримувати зворотний зв'язок і прибуток.

Три, що вирішує Datanets в порівнянні з традиційними платформами краудсорсингу та аннотації даних?

В минулому ми бачили багато платформ для краудсорсингу даних Web2, таких як Amazon Mechanical Turk, Scale AI тощо, які досягли певного успіху в масштабах, але загалом мають дві проблеми:

(1) Дані без власності: дані, надані учасниками, в кінцевому підсумку належать платформі, і після їх використання штучним інтелектом важко здійснити подальший моніторинг або розподіл доходів.

(2) Розрізнені завдання, повторення без стимулів: багато завдань не мають довгострокових цілей або структурованої співпраці, що призводить до повторної роботи та ускладнює забезпечення якості даних.

А мета Datanets полягає в тому, щоб перетворити "дані завдання" на довгостроковий актив співпраці, а не просто в одноразову експлуатацію платформи, а встановити постійні відносини. Ваші надані дані є активами в ланцюзі, завдання, в яких ви берете участь, є комбінованими модулями, а ваш внесок може бути викликаний будь-якою наступною моделлю та отримати винагороду.

Чотири, підсумок: Datanets є спеціальною інфраструктурою даних епохи штучного інтелекту.

OpenLedger не намагається стати наступним ChatGPT, а прагне вирішити фундаментальну проблему, яку не може вирішити ChatGPT: як можна переробити логіку виробництва даних AI?

Запровадження та практика Datanets свідчать про те, що OpenLedger вважає «прозорість, співпрацю та вимірність» основними принципами системи даних, що є найглибшою відповіддю на AI у контексті Web3. У майбутньому, чи можна довіряти AI моделям, можливо, не залежатиме від розміру параметрів, а від того, чи «може пояснити, які дані використовуються».
DEFI8.17%
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити