Phỏng vấn Tengyan | Viện sĩ Wu Hequan: Những lợi thế, thách thức và con đường đổi mới của việc phát triển mô hình quy mô lớn của Trung Quốc

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Khi ChatGPT tạo nên một cơn sốt toàn cầu, mô hình AI đằng sau nó đột nhiên tăng mạnh. Ai cũng muốn biết kích thước và tiêu chuẩn đánh giá đẳng cấp của một mẫu xe phân khối lớn là gì?

Sự ra mắt của ChatGPT cho phép chúng ta nhìn thấy khoảng cách giữa Trung Quốc và Hoa Kỳ trên AIGC, vậy tình trạng phát triển hiện tại của mô hình lớn của Trung Quốc là gì? Sự phát triển mô hình quy mô lớn của Trung Quốc sẽ đối mặt với những cơ hội và thách thức nào trong tương lai?

Chúng ta hiện đang trong thời kỳ quan trọng đối với sự phát triển của trí tuệ nhân tạo nói chung, trước xu hướng phát triển nghiên cứu độc lập về các mô hình lớn của các tổ chức khác nhau, làm thế nào để nâng cao hiệu quả của sức mạnh tính toán và tránh trùng lặp ở mức độ thấp một cách hiệu quả?

Một số người trong ngành lo lắng AI sẽ hủy diệt con người, liệu lo lắng này có cơ sở? Làm thế nào chúng ta có thể ngăn chặn các vấn đề trước khi chúng xảy ra và nhận ra các kết quả có thể dự đoán và hành vi có thể kiểm soát của AI?

Với nhiều câu hỏi khác nhau về AIGC, **Viện nghiên cứu Tencent đã phỏng vấn độc quyền Wu Hequan, một học giả của Học viện Kỹ thuật Trung Quốc và là một chuyên gia có thẩm quyền trong lĩnh vực truyền thông ở nước tôi. **

【Người phỏng vấn】

Niu Fulian Nhà nghiên cứu cấp cao, Viện nghiên cứu Tencent

Wu Chunling Nhà nghiên cứu cấp cao tại Viện nghiên cứu Tencent

Wang Qiang Chuyên gia cao cấp của Viện nghiên cứu Tencent

(sau đây gọi tắt là T)

Tổng quy mô sức mạnh điện toán hiện có của Trung Quốc so với Hoa Kỳ: có khoảng cách nhưng không lớn

**T: Một số người nói rằng sự phát triển mô hình quy mô lớn của Trung Quốc chậm hơn nước ngoài 1-2 năm, bạn nghĩ gì về sự phát triển mô hình quy mô lớn của Trung Quốc hiện nay? **

**Wu Hequan: **Trung Quốc bắt đầu muộn hơn Hoa Kỳ trong việc phát triển các mô hình quy mô lớn. Sau khi ChatGPT ra mắt, nhiều đơn vị trong nước bày tỏ rằng họ đang phát triển các mô hình quy mô lớn. Hiện tại, chỉ có một số ít các công ty như Microsoft và Google ở Hoa Kỳ. So với nghiên cứu mô hình quy mô lớn, quốc gia của tôi có nhiều đơn vị phát triển mô hình quy mô lớn hơn Hoa Kỳ, nhưng số lượng đối tượng nghiên cứu lớn không có nghĩa là Trung Quốc có tỷ lệ cao mức độ nghiên cứu và phát triển trong các mô hình quy mô lớn. Người ta nói rằng số lượng tham số của một mô hình lớn trong nước cao tới 1,75 nghìn tỷ, vượt qua GPT-4, nhưng không có báo cáo nào về ứng dụng của nó. **Mặc dù một số công ty Trung Quốc đã tuyên bố tung ra các chatbot tương tự như ChatGPT, nhưng chúng hiện không tốt bằng ChatGPT về khả năng hỗ trợ đa ngôn ngữ và vẫn còn khoảng cách về tốc độ phản hồi về khả năng đối thoại của Trung Quốc. **

**Hiện tại, chúng tôi chỉ chú ý đến ChatGPT, nhắm mục tiêu đến các tác vụ tổng quát và chủ yếu hoàn thành việc tạo ngôn ngữ như trò chuyện và viết. Mô hình BERT của Google chú ý nhiều hơn đến khả năng phán đoán và ra quyết định, nhấn mạnh đến khả năng hiểu ngôn ngữ như trả lời câu hỏi và trích xuất mối quan hệ ngữ nghĩa. nhiệm vụ, công nghệ của mô hình BERT cũng đáng được chúng ta quan tâm. **Đánh giá mức độ của các mô hình quy mô lớn phải đa chiều, toàn diện, hợp lý, dễ sử dụng, tốc độ phản hồi, chi phí, hiệu quả năng lượng, v.v. **Nói chung, khoảng cách giữa sự phát triển của các mô hình quy mô lớn ở nước tôi và nước ngoài là 1-2 năm Cơ sở vẫn chưa rõ ràng và việc đưa ra kết luận này bây giờ là không có ý nghĩa. **

Các công ty Trung Quốc có lợi thế tự nhiên so với các công ty nước ngoài trong việc có được kho tàng văn hóa Trung Quốc và hiểu biết về văn hóa Trung Quốc. Về sức mạnh tính toán, Trung Quốc đã có một nền tảng tốt. **Theo báo cáo của OpenAI, sức mạnh tính toán cần thiết để huấn luyện mô hình GPT3 cao tới 3,64EFlops/ngày, tương đương với 3-4 Pengcheng Cloud Brain II (Pengcheng Cloud Brain II là 1Eflops, tức là hàng chục hàng tỷ phép tính dấu chấm động mỗi giây ). **Theo dữ liệu vào cuối năm 2022, Hoa Kỳ chiếm 36% sức mạnh điện toán toàn cầu và Trung Quốc chiếm 31%, trong đó Trung Quốc cao hơn đáng kể so với Hoa Kỳ (theo dữ liệu tại đến cuối năm 2021, quy mô điện toán thông minh của Hoa Kỳ chiếm 15% tổng quy mô điện toán thông minh toàn cầu và Trung Quốc chiếm 26%). các phòng thí nghiệm quốc gia và Phòng thí nghiệm được chính quyền một số thành phố hỗ trợ cũng có tài nguyên năng lượng tính toán quy mô lớn, có thể nói Trung Quốc cũng có thể đạt được sự hỗ trợ năng lượng tính toán cần thiết để đào tạo các mô hình lớn. ** Được biết, Phòng thí nghiệm Pengcheng đang thiết kế Pengcheng Cloud Brain III, có sức mạnh tính toán 16EFlops, cao gấp ba lần so với GPT-3. Nó ước tính trị giá 6 tỷ nhân dân tệ và sẽ tiếp tục cung cấp khả năng tính toán mạnh mẽ sức mạnh cho đào tạo trí tuệ nhân tạo.hỗ trợ mạnh mẽ.

Nghiên cứu và phát triển AIGC của Trung Quốc: Cần nhận ra khoảng cách, tập trung vào các thách thức và đổi mới

**T: Ngoài nền tảng tốt của chúng tôi về sức mạnh tính toán, bạn nghĩ có những thách thức nào trong việc xây dựng một mô hình quy mô lớn ở Trung Quốc? **

Wu Hequan: Sức mạnh máy tính thôi là chưa đủ. Chúng ta còn phải đối mặt với nhiều thách thức ở các khía cạnh sau:

** Trước hết, nền tảng của mô hình lớn là khung học sâu. Tensorflow và PyTorch ở Hoa Kỳ đã nuôi dưỡng hệ sinh thái khung học sâu trong nhiều năm. Mặc dù các công ty trong nước cũng đã độc lập phát triển khung học sâu, thử nghiệm thị trường là không đủ, và hệ sinh thái vẫn cần được xây dựng.

**Thứ hai, việc mở rộng AIGC cho các ứng dụng công nghiệp có thể yêu cầu nhiều hơn một mô hình lớn. Làm thế nào để tích hợp hiệu quả nhiều mô hình lớn có những thách thức trong tiêu chuẩn hóa và hợp nhất dữ liệu.

Thứ ba, các mô hình lớn yêu cầu đào tạo dữ liệu lớn. Trung Quốc có hàng ngàn năm văn minh, nhưng hầu hết các kho tàng văn hóa phong phú chưa được số hóa. Tiếng Trung chỉ chiếm chưa đến 0,1% kho ngữ liệu được sử dụng trong đào tạo ChatGPT. Mặc dù các công ty Internet của nước tôi có một lượng lớn dữ liệu mạng như thương mại điện tử, mạng xã hội và tìm kiếm, nhưng các loại dữ liệu tương ứng không đủ toàn diện và độ tin cậy của kiến thức trực tuyến không được đảm bảo nghiêm ngặt. được sử dụng để đào tạo vẫn cần rất nhiều công việc khai thác.

Thứ tư, chip GPU mà đào tạo mô hình lớn dựa vào được đại diện bởi chip A100 của Nvidia, nhưng chip này đã bị Hoa Kỳ hạn chế xuất khẩu sang Trung Quốc và hiệu suất của GPU trong nước cần được thử nghiệm thêm. vẫn còn khoảng cách về hiệu quả.

Thứ năm, không có ít kỹ thuật viên tham gia nghiên cứu AI ở Trung Quốc, nhưng vẫn thiếu nhân tài có khả năng thiết kế kiến trúc và người hướng dẫn đào tạo dữ liệu AIGC. Trước khi ChatGPT xuất hiện, một số người cho rằng số lượng giấy tờ và bằng sáng chế về AI của Trung Quốc có thể so sánh với Hoa Kỳ. chúng ta cần hiểu rõ và chú ý đến những thách thức mà chúng ta gặp phải, tạo ra những đổi mới thực sự, biến thách thức thành cơ hội và đóng góp của Trung Quốc vào vòng theo dõi AI mới. **

Nên mở nền tảng điện toán quốc gia để hỗ trợ đào tạo mô hình quy mô lớn khác nhau

**T: ChatGPT chắc chắn là một sự đổi mới to lớn. Trung Quốc nên khuyến khích những đổi mới như thế này như thế nào trong tương lai và nó nên làm những khía cạnh công việc nào? **

**Wu Hequan: **Sự phát triển của trí tuệ nhân tạo từ phân biệt đối xử sang tạo ra là một sự đổi mới quan trọng và nó đã bắt đầu đi vào con đường của trí tuệ nhân tạo nói chung. Từ GPT-3 đến GPT-4, nó đã phát triển từ đầu vào văn bản sang đầu vào đồ họa một phần, tức là nó đã tăng khả năng hiểu đồ họa, trên cơ sở đó, việc triển khai kiến trúc học sâu và mô hình chung không còn xa nữa để hỗ trợ đầu vào dữ liệu đa phương thức. Đúng, nhưng nhiệm vụ khái quát hóa các mô hình lớn và tinh chỉnh việc gọi các mô hình lớn theo yêu cầu vẫn cần đầu tư và đổi mới nhiều hơn. Dữ liệu không được gắn nhãn và học tập không giám sát cho đồ họa và video khó hơn nhiều so với ngôn ngữ và nhập văn bản.

Hiện nay chúng ta đang ở thời kỳ quan trọng của phát triển trí tuệ nhân tạo nói chung, đối với nước ta đây là cơ hội hiếm có để phát triển nhảy vọt, đồng thời cũng là thách thức gay gắt. Sức mạnh điện toán, mô hình và dữ liệu là những điều kiện cần thiết cho sự thành công của ChatGPT và cũng sẽ là những yếu tố cần thiết cho sự thành công của trí tuệ nhân tạo nói chung. Trung Quốc có thể so sánh với Hoa Kỳ về tổng quy mô sức mạnh tính toán, nhưng sự phối hợp sức mạnh tính toán giữa các trung tâm dữ liệu vẫn phải đối mặt với những thách thức về thể chế, tỷ lệ sử dụng và hiệu quả của sức mạnh tính toán trong nhiều trung tâm tính toán thông minh không cao. **Nhiều đơn vị độc lập nghiên cứu mô hình lớn, lặp lại ở trình độ thấp là điều khó tránh khỏi Nên hình thành một liên quân có sự phân công lao động hợp lý dưới sự điều phối của kế hoạch khoa học công nghệ và công nghiệp quốc gia. Nên mở nền tảng sức mạnh tính toán của phòng thí nghiệm quốc gia để hỗ trợ đào tạo mô hình quy mô lớn khác nhau. Ví dụ, sức mạnh tính toán của Pengcheng Cloud Brain đã đạt 3/4 tổng công suất, có thể hỗ trợ quy mô của 200 tỷ tham số có thể so sánh với GPT-3. Mô hình lớn ngôn ngữ được đào tạo trước của Trung Quốc mã nguồn mở. **Đồng thời, nên thành lập một liên minh sức mạnh tính toán để tập trung tài nguyên sức mạnh tính toán của các GPU cao cấp hiện có và cung cấp sức mạnh tính toán cần thiết cho đào tạo dữ liệu mô hình quy mô lớn. **Hiện tại, "Mạng điện toán Trung Quốc (C2NET)" do Phòng thí nghiệm Bành Thành xây dựng chủ yếu đã được kết nối với hơn 20 trung tâm dữ liệu, siêu điện toán và điện toán thông minh quy mô lớn, và sức mạnh điện toán không đồng nhất tổng hợp đã đạt tới 3EFlops. chúng, sức mạnh tính toán AI tự phát triển vượt quá 1,8EFlops. Ngoài ra, việc ứng dụng chatbot chỉ là một cách trực quan để huấn luyện và thử nghiệm AIGC, nhưng trò chuyện không chỉ cần thiết mà cần phát triển các mô hình khác nhau cho các ứng dụng công nghiệp dựa trên các mô hình lớn, để làm cho các mô hình lớn trở nên hiệu quả trong ngành càng sớm càng tốt Trau dồi thêm nhiều tài năng trong ứng dụng của mọi tầng lớp xã hội. **

Các ứng dụng công nghiệp mô hình lớn đòi hỏi những tài năng toàn diện, những người hiểu cả công nghệ công nghiệp và đào tạo AI

**T: Cho đến nay, chúng tôi đã thấy ứng dụng của ChatGPT trong một số lĩnh vực, chẳng hạn như chatbot, tạo văn bản và nhận dạng giọng nói. Sẽ có một số cơ hội ứng dụng trong ngành và lĩnh vực vật lý trong tương lai? Những trở ngại nào vẫn gặp phải trong việc áp dụng các mô hình lớn trong ngành vật lý? **

**Wu Hequan: **Dựa trên các chatbot ChatGPT hiện có, sau khi bổ sung kiến thức về ngành và doanh nghiệp liên quan, họ có thể đảm nhận công việc dịch vụ khách hàng thông minh trong doanh nghiệp, thay thế nhân công để cung cấp cho khách hàng các dịch vụ trước và sau bán hàng. Trong quá trình thiết kế, sản xuất cần lập trình phần mềm, ChatGPT có thể thay thế người lập trình để hoàn thành các công việc lập trình và kiểm tra lỗi phần mềm. Có thể đảm nhận việc thu thập, dịch thuật và sắp xếp các tài liệu, vật liệu cần thiết trong quá trình thiết kế và sản xuất. Sau khi được đào tạo chuyên nghiệp, các mô hình lớn giống như AIGC có thể được sử dụng để thiết kế phần mềm EDA, chẳng hạn như phần mềm công cụ để thiết kế vi mạch. Trong các công ty hoạt hình và trò chơi, rô-bốt được đào tạo dựa trên các mô hình lớn giống như AIGC có thể viết kịch bản, tạo kịch bản trò chơi và lập trình chúng theo lời nhắc, đồng thời hoàn thành quá trình kết xuất hoạt hình 3D.

Tuy nhiên, ChatGPT không phải là mô hình chung, khó áp dụng trực tiếp vào quy trình sản xuất của ngành thực tế, tuy nhiên có thể dựa trên nguyên tắc đào tạo ChatGPT và sử dụng biểu đồ tri thức của ngành, doanh nghiệp để đào tạo chuyên sâu.Có thể phát triển một mô hình lớn dành riêng cho doanh nghiệp để hoàn thành việc này.Thách thức của công việc đầu tiên là cần những nhân tài không chỉ quen thuộc với quy trình tải lên của doanh nghiệp và công nghệ liên kết chính, mà còn thông thạo đào tạo dữ liệu lớn trí tuệ nhân tạo công nghệ.

Từ tập trung vào kết quả đến tập trung vào quy trình, sự tích hợp của công nghệ và hệ thống pháp luật chi phối quá trình lập luận của AIGC

**T:ChatGPT cũng sẽ mắc nhiều lỗi khác nhau và nó cũng sẽ mang lại một số vấn đề về đạo đức, bảo mật và quyền riêng tư. Khi áp dụng các mô hình lớn trong tương lai, làm thế nào chúng ta có thể tạo ra một môi trường phát triển toàn diện và an toàn? **

**Wu Hequan:**Sự xuất hiện của trí tuệ nhân tạo AI đã đẩy sự chú ý của xã hội đối với trí tuệ nhân tạo lên một tầm cao chưa từng thấy. kêu gọi Ngừng nghiên cứu về GPT-5. Lo ngại của một số chuyên gia không phải là không có cơ sở, bởi hiện tại quá trình tư duy của robot ChatGPT còn mờ đục, con người đã tạo ra ChatGPT nhưng hiện tại con người chưa nắm bắt hết quá trình suy luận của nó, cái không biết sẽ không thể kiểm soát được, tiềm ẩn nguy cơ robot bất thường , bất thường về đạo đức và hành vi mất kiểm soát.

**Giải pháp không phải là ngừng nghiên cứu về trí tuệ nhân tạo mà là tập trung vào nghiên cứu AIGC thay vì tập trung vào kết quả, thiết kế và dẫn dắt quá trình lập luận của nó, để kết quả có thể được mong đợi và hành vi có thể được kiểm soát. **Việc quảng bá và áp dụng mô hình lớn trong tương lai cần có sự đánh giá an toàn và đáng tin cậy bởi một tổ chức đủ điều kiện và quy trình lập luận của mô hình lớn có thể truy nguyên được sau khi kiểm tra. Đồng thời, cần thiết lập các luật và quy định quản trị AI tương ứng để ngăn chặn việc đào tạo AIGC sai lệch, buộc các đối tượng đào tạo AIGC phải chịu trách nhiệm và nghiêm trị các tội phạm tiếp tay, tiếp tay. Thông qua sự bổ sung cho nhau của công nghệ và hệ thống luật pháp, trí tuệ nhân tạo đã trở thành trợ thủ đắc lực thực sự của con người.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)