Реалістичність великої моделі Tencent: вирішення «занепокоєння ШІ» підприємств на сцені

Джерело: IT Times

Автор: Хао Цзюньхуей

Джерело зображення: створено Unbounded AI‌

Це співбесіда, в якій питання можна «схопити», лише прискоривши темп мовлення та збільшивши децибел.

У другій половині дня 7 липня, перед Всесвітньою конференцією зі штучного інтелекту Tencent Forum 2023, у маленькій і шумній конференц-залі Ву Юньшен, віце-президент Tencent Cloud, керівник Tencent Cloud Intelligence та керівник Youtu Lab, прийняв групове інтерв’ю. від ЗМІ. Майже 20 днів тому Tencent офіційно анонсувала панораму MaaS, врізавшись у гарячу «великомасштабну модельну трасу» з великомасштабними промисловими моделями. Шлях, який виглядає більш «реалістичним».

«Підприємствам потрібно справді вирішити певну проблему за реальним сценарієм, а не розв’язувати 70–80% проблеми за 100 сценаріями». Ву Юньшен сказав, що з точки зору стратегії компанії Tencent більше зосереджена на вирішенні актуальна проблема проблем посадки, і загальна велика модель не може повністю вирішити всі проблеми користувачів.

Tencent, яка має найбільшу кількість індивідуальних користувачів у Китаї, зробила перший крок у перетворенні промислового Інтернету на ШІ, коли прийшла нова хвиля штучного інтелекту.

Оновлення Tencent Cloud MaaS

19 червня Tencent Cloud вперше оголосила про прогрес у дослідженнях і розробках широкомасштабних галузевих моделей Tencent Cloud. Надала понад 50 великомасштабних галузевих рішень для більш ніж 10 галузей, таких як медіа, культурний туризм, державні справи та фінанси.

На Всесвітній конференції зі штучного інтелекту Tencent Cloud знову оголосила про ряд оновлень.

Серед них нещодавно оновлена високопродуктивна обчислювальна мережа Xingmai, розроблена власними силами Tencent Cloud, може збільшити використання графічного процесора на 40%, заощадити від 30% до 60% витрат на навчання моделі та забезпечити 10-кратне підвищення продуктивності зв’язку для великих моделей ШІ. . Заснований на кластері обчислювальної потужності Tencent Cloud нового покоління HCC, він може підтримувати надвеликий обчислювальний масштаб із 100 000 карт. Власна векторна база даних AI від Tencent Cloud підтримує векторний масштаб пошуку до 1 мільярда рівнів, а затримка контролюється на рівні мілісекунд. У порівнянні з традиційною окремою базою даних плагіна масштаб пошуку в 10 разів вищий, а також має максимальну здатність до мільйонів запитів за секунду (QPS).

Що стосується інновацій додатків, можливості широкомасштабної промислової моделі Tencent Cloud були застосовані до таких сценаріїв, як контроль фінансових ризиків, інтерактивний переклад і цифрове інтелектуальне обслуговування клієнтів, що значно підвищило ефективність інтелектуальних програм.

Рішення для контролю фінансових ризиків, яке підтримується широкомасштабною галузевою моделлю, має в 10 разів більшу ефективність порівняно з попереднім. Завдяки накопиченню Tencent понад 20 років досвіду протистояння чорного та сірого виробництва та тисячам реальних бізнес-сценаріїв загальна анти- ефект шахрайства в 20 разів вищий, ніж традиційна модель. Збільшення приблизно на %. Що стосується цифрових людей, Tencent Cloud цього року запустила невелику фабрику цифрових людей, яка може відтворювати 2D цифрові клони протягом 24 годин лише з невеликою кількістю даних, що значно знижує вартість цифрових людських послуг для корпоративних додатків.

«Насправді більше півроку ми думали та досліджували, яка найважливіша логіка за поєднанням великих моделей і різноманітних галузей? Насправді є лише два моменти: один полягає в тому, що фундаментальною відправною точкою технології є для вирішення практичних проблем, а інший: якщо ви не можете заглибитися в індустрію, ви не зможете справді вирішити проблеми, з якими стикається індустрія». багато.

Інтелектуальне обслуговування клієнтів визнано найбільш застосовною галуззю для LLM (Large-Scale Language Model). На цій конференції Tencent створив широкомасштабну галузеву модель для онлайн-компанії, що займається подорожами OTA. Тонко налаштована модель для конкретного клієнта може вирішувати бізнес-проблеми наскрізно без налаштування процесів діалогу. Підвищити швидкість виконання завдань і зменшити вартість побудови діалогу. Але насправді для великої моделі не так просто, як здається, по-справжньому зрозуміти проблеми клієнта.

«У процесі спілкування мислення клієнта стрибає і змінюється. Наприклад, він щойно запропонував забронювати готель 10 числа, але перед тим, як машина відповіла, він раптом сказав, дозвольте мені перевірити готель і рейс 11 числа, коли ШІ все ще надає відгук щодо другої вимоги, він може сказати, покажи мені кімнату з двома односпальними ліжками». не може Це просте рішення, але його потрібно поєднати зі сценою, особливо взаємодія із системою замовника для реконструкції деяких дуже складних моделей.

Настала ера "групових моделей, що танцюють разом"

Після початкової метушні питання про те, як комерціалізувати великі моделі штучного інтелекту, як корпоративні клієнти можуть насолоджуватися дивідендами штучного інтелекту та вирішити «занепокоєння штучного інтелекту», стали гарячими темами на цій Всесвітній конференції штучного інтелекту.

Чжен Ціншен, партнер Sequoia Capital China, увійшов у сферу інвестицій із середини періоду Інтернету для ПК. На його думку, переможці кожної ери походять від оригінальних технологій тієї епохи. Наприклад, у Інтернеті для ПК Люди цінують електронну комерцію та соціальні мережі. Програмне забезпечення стало найбільшим переможцем; з ери мобільного Інтернету люди звернули увагу на соціальне програмне забезпечення та довгі відео, але короткі відео займають найбільше часу. «Тепер ми не знаємо, які оригінальні сцени, створені самим штучним інтелектом, змінять наше життя. базова поведінка».

Хоча досі невідомо, коли з’явиться рідний «кілер» штучного інтелекту, першим кроком має бути «вхід у гру». Серед більш ніж 30 великомасштабних моделей, представлених цього разу на WAIC, за винятком першого раунду великомасштабних моделей загального призначення, таких як Baidu Wenxin Yiyan, Ali Tongyi, Xunfei Xinghuo та Shangtang Ririxin, ті, хто запізнився, в основному зосереджені на промислова велика модель.

«Для клієнтів більш імовірно, що клієнти приймуть спеціальні корпоративні великі моделі з невеликою кількістю параметрів, низькими інвестиціями та швидкими результатами, і їхня готовність платити відносно зрозуміла», — розповів «IT Times» один із учасників виставки новоствореної компанії. репортер, що деякі вже використовують великі моделі. Клієнти банків, які трансформують систему обслуговування клієнтів, зазвичай обирають метод розгортання приватного домену, який інтегрує програмне та апаратне забезпечення, і використовують свої наявні графіки знань і дані для навчання та впровадження міркувань, що не тільки забезпечує безпеку даних , а також зменшує вартість обчислювальної потужності. «Якщо потрібно визначити та вивести лише одну сцену, плату обчислювальної потужності можна зробити навіть однозначним».

«Промислові сценарії стали найкращим полігоном для тренувань», — сказав Тан Даошен, старший виконавчий віце-президент Tencent Group і генеральний директор бізнес-групи Cloud and Smart Industry Business Group, на пленарному засіданні WAIC-Форуму промислового розвитку, обираючи галузеву модель «одного вікна». Співпраця хмарних постачальників із можливостями надання послуг для створення власних ексклюзивних моделей на основі великих галузевих моделей може бути можливим шляхом для підприємств досліджувати практику застосування великих моделей.

Це означає, що майбутнє буде епохою «співіснування всіх моделей», і кожне підприємство матиме власну велику модель, і Tencent вирішила стати рушієм нової ери.

У панорамі послуг MaaS, опублікованій Tencent Cloud минулого місяця, було зазначено, що на основі платформи Tencent Cloud TI можна побудувати вибраний магазин великомасштабної галузевої моделі.Tencent Cloud може забезпечити 10 основних галузей, таких як фінанси, культурний туризм , урядові справи, медичне обслуговування, ЗМІ та освіта. рішення. У той же час Tencent Cloud запустила масштабне рішення для точного налаштування моделі, щоб допомогти розробникам моделей і інженерам-алгоритмам вирішувати такі завдання, як виклик моделі, керування даними та мітками, точне налаштування моделі, оціночне тестування та розгортання за одну зупинку, а також скоротити тиск створення великих моделей.

На основі цих моделей і інструментальних платформ підприємства можуть швидко генерувати власні «ексклюзивні моделі», лише додавши власні дані сцени.

«Це все ще на ранній стадії розробки великомасштабних моделей. Я особисто сподіваюся, що сто квітів розквітне, і кожен спробує різні можливості в різних сферах».Ву Юньшен вважає, що розвиток штучного інтелекту — це величезні дані Проект, який вимагає загальних знань, а також вимагає професійної, глибокої та авторитетної організації знань, і спільні зусилля всіх сторін потрібні, щоб справді дозволити технології служити галузі.

AI для науки фіксує космічне «мерехтіння»

Звичайно, окрім впливу на цифрову трансформацію галузей, широкомасштабна промислова модель Tencent Cloud також прискорює застосування технологій штучного інтелекту, таких як великі моделі в галузі наукових обчислень.

Починаючи з 2021 року, Tencent, Національна астрономічна обсерваторія та Школа комп’ютерних наук і технологій Університету Фудань спільно запустили «Проект дослідження зірок», використовуючи хмару + штучний інтелект, щоб допомогти Китаю Тянянь ШВИДКО обробляти величезну кількість даних, отриманих щодня, і знаходити швидкі радіосплески та імпульси за допомогою візуального аналізу штучного інтелекту. Згідно зі зоряними підказками, наразі виявлено 30 пульсарів.

На цьогорічному WAIC компанія Tencent оголосила, що програма дослідження зірок досягла подальшого прогресу та вперше виявила 2 швидкі радіосплески за допомогою технології ШІ.

Швидкі радіосплески – це загадкове астрономічне явище. Кожну 1 мілісекунду енергія, що виділяється Сонцем протягом року, буде випромінюватися, «мерехтить» Всесвіт. Однак частота його "миготіння" надзвичайно низька, а час надзвичайно короткий. Це легко ігнорувати в масиві даних і надзвичайно важко зафіксувати. Лише в 2007 році люди виявили перший пульсар, на 40 років пізніше відкриття. пульсарів.

Порівняно з дослідженням пульсарів, для виявлення швидких радіосплесків, які відбуваються з нижчою частотою в масивних даних, потрібні моделі штучного інтелекту, щоб мати вищу точність і швидкість обчислень. Щоб підвищити швидкість обчислення, Tencent спеціально розробив набір абсолютно нових наскрізних алгоритмів ШІ для дослідження швидких радіосплесків. За такої ж обчислювальної потужності ця абсолютно нова парадигма обробки астрономічних даних підвищує ефективність обробки сигналів у 1800 разів швидше, ніж звичайний процес обробки.

Раніше, перш ніж штучний інтелект міг зрозуміти карту, необхідно було виконати складну астрофізичну попередню обробку карти сигналу, таку як перетворення Фур’є, хроматична дисперсія... Ці завдання є професійними та складними. Тепер Tencent Youtu створив «наскрізний алгоритм AI» для обробки астрономічних даних, який може пропускати етапи попередньої обробки та безпосередньо вводити розпізнавання AI, що значно покращує ефективність.

FAST генерує сотні терабайт даних щодня та десятки мільйонів карт сигналів щотижня. Перед обличчям масивних даних Tencent Cloud може швидко знаходити та ідентифікувати корисну інформацію в даних за допомогою «багатоекземплярного методу навчання + механізму уваги» та забезпечувати потужну базову підтримку обчислювальної потужності.

Сьогодні Tencent Cloud і FAST продовжують виявляти радіосигнали M31 Andromeda на відстані 2,5 мільйонів світлових років, і очікується, що найближчим часом буде зафіксовано більше «космічних спалахів».

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити