Tác giả: Hu Xiner, thực tập sinh, Shao Wen, phóng viên tờ The Paper
Nguồn hình ảnh: Được tạo bởi Unbounded AI
Dai Qionghai, một học giả của Học viện Kỹ thuật Trung Quốc, cho biết: "Đất nước chúng ta nên tăng cường đào tạo nhân viên trí tuệ nhân tạo và nghiên cứu cơ bản về chính sách, cơ chế và đầu tư, tăng cường đổi mới ban đầu và tránh rơi vào tình thế tiến thoái lưỡng nan của 'nước không có nguồn'."
Wang Yu, giáo sư chính thức của Khoa Kỹ thuật Điện tử của Đại học Thanh Hoa, chỉ ra: "Đã có nhiều công ty sản xuất chip ở Thượng Hải và cũng có nhiều thuật toán ở Thượng Hải. Làm thế nào để triển khai hiệu quả và thống nhất và chạy các thuật toán như vậy trên chip là một vấn đề rất quan trọng. câu hỏi."
Vào ngày 7 tháng 7, tại Hội nghị trí tuệ nhân tạo thế giới năm 2023 diễn đàn "Cơ hội và rủi ro phát triển ngành trí tuệ nhân tạo chung trong kỷ nguyên mô hình quy mô lớn", một số chuyên gia trong lĩnh vực trí tuệ nhân tạo nói chung lần lượt tập trung vào các mô hình quy mô lớn từ đổi mới cơ bản, công nghệ ứng dụng và triển vọng tương lai Thảo luận chuyên sâu về trí tuệ nhân tạo ở các cấp độ khác.
"Đất nước chúng ta nên tăng cường đào tạo tài năng AI và nghiên cứu cơ bản về chính sách, cơ chế và đầu tư, tăng cường đổi mới ban đầu và tránh rơi vào tình thế tiến thoái lưỡng nan 'nước không có nguồn'." Dai Qionghai, cố vấn của Hội đồng Nhà nước và học giả của Học viện Kỹ thuật Trung Quốc, được nhấn mạnh trong bài phát biểu quan trọng của mình.
Wang Yu, giáo sư được thuê và trưởng khoa Kỹ thuật điện tử tại Đại học Thanh Hoa, cho biết từ góc độ ứng dụng hạ cánh, hiện tại rất khó triển khai các mô hình quy mô lớn trong lĩnh vực dọc và các mô hình quy mô lớn trong nước phải đối mặt với ba thách thức : chi phí triển khai tại hiện trường cao, chênh lệch lớn về sức mạnh tính toán của mô hình và khó thay thế Chip trong nước. "Ở dặm cuối cùng của mô hình lớn hạ cánh, chúng ta cần kết nối thuật toán với con chip." Wang Yu nói.
"Trí tuệ não bộ là hướng đi mới của tương lai"
Dai Qionghai tin rằng trong sự đổi mới của mô hình lớn "0 đến 1", những thành tựu đột phá trong nước trong lĩnh vực nghiên cứu cơ bản là yếu. "Từ góc độ của ngành phát triển thông minh, chúng tôi vừa lạc quan vừa không lạc quan." Theo quan điểm của ông, hầu hết các tài năng trí tuệ nhân tạo của Trung Quốc đều tập trung ở lớp ứng dụng, vì vậy có rất nhiều chỗ cho các kịch bản ứng dụng và lớp công nghệ. Tuy nhiên, Trung Quốc rõ ràng là bất lợi về nhân tài ở cấp độ cơ bản và thiếu sự đổi mới ban đầu.
Dai Qionghai cho rằng sự đổi mới và phát triển của trí tuệ nhân tạo đòi hỏi ba trụ cột, đó là thuật toán, dữ liệu và sức mạnh tính toán. Các thuật toán xác định mức độ thông minh, dữ liệu xác định phạm vi thông minh và sức mạnh tính toán xác định hiệu quả của trí thông minh. Ở cấp độ thuật toán, các mô hình lớn dự kiến sẽ trở thành nền tảng cơ bản quan trọng trong các ứng dụng trí tuệ nhân tạo trong khoảng 5 năm tới.
Dai Qionghai cũng chỉ ra rằng trí tuệ não bộ là một hướng đi mới trong tương lai. Thuật toán trí tuệ nhân tạo mới tích hợp não bộ và nhận thức đang đi đầu trong bố cục ngành và sẽ dẫn đầu một thế hệ trí thông minh mới. Ông đề nghị tại diễn đàn rằng chính phủ nên khuyến khích các doanh nghiệp đi đầu trong việc xây dựng các mô hình quy mô lớn, khám phá sự kết hợp giữa cơ chế sinh học và đặc điểm của máy móc, tiếp tục tạo ra các mô hình trí tuệ nhân tạo mới, đồng thời thúc đẩy nghiên cứu cơ bản và mở rộng ứng dụng. Ông dự đoán rằng trí tuệ nhân tạo với trí thông minh nhận thức làm cốt lõi sẽ bắt đầu được áp dụng vào mười năm sau.
Ngoài ra, Dai Qionghai tin rằng cần phải cảnh giác về các vấn đề bảo mật của các ứng dụng mô hình quy mô lớn. Các mô hình lớn chưa có khả năng xác thực đầu ra chẳng hạn như tạo nội dung lừa đảo. "Điều này có nghĩa là một khi ứng dụng mô hình lớn có vấn đề, nó không đơn giản như virus mạng máy tính hiện nay, chỉ diệt và diệt virus, sẽ có tác động phá hoại. Vì vậy, khi mô hình lớn là được áp dụng, bảo mật và độ tin cậy nên được kết hợp. Độ tin cậy đã được thảo luận rõ ràng."
Các mô hình quy mô lớn trong nước nên tập trung giải quyết bốn điểm nhức nhối
Wang Yu cho biết trong diễn đàn, "Thượng Hải rất quan tâm đến trí tuệ nhân tạo và chip, nhưng từ một góc độ khác, các mô hình tiên tiến nhất và sức mạnh tính toán tương đối quan trọng của chúng tôi thực sự phải chịu một số hạn chế nhất định. Sức mạnh tính toán của chúng ta nên đi theo hướng nào hơn, làm thế nào để bù đắp tốt hơn cho sức mạnh tính toán trong nước và làm thế nào để hỗ trợ sự phát triển của đất nước trong đào tạo mô hình lớn và lý luận với một không gian như vậy, những vấn đề này đã trở nên cực kỳ quan trọng."
Wang Yu cũng đề cập rằng hiện tại ở nước ngoài, chỉ Nvidia và AMD mới có thể chọn chip có sức mạnh tính toán lớn. Nvidia thống trị thị trường và hệ sinh thái phần mềm của nó tương đối tốt. "Vì vậy, nhiều mô hình nước ngoài, chẳng hạn như OpenAI, Microsoft và Google, đang mua chip Nvidia với số lượng lớn, sau đó phát triển chúng trên khung phần mềm của Nvidia. Hệ sinh thái nước ngoài rất đơn giản. Các doanh nghiệp làm tốt công việc của các thuật toán. Trong lĩnh vực này, việc triển khai được hỗ trợ bởi hệ thống phần mềm của Nvidia."
"Tuy nhiên, sự phát triển của chip sức mạnh tính toán lớn ở Trung Quốc vẫn còn ở giai đoạn sơ khai." Wang Yu tin rằng, "Đã có nhiều công ty chip ở Thượng Hải, chẳng hạn như Tianshu Zhixin, Suiyuan Technology, Cambrian, Biren Technology, v.v. cũng có nhiều ở Thượng Hải. Các thuật toán, làm thế nào để đạt được sự triển khai thống nhất và hiệu quả, và làm thế nào để chạy các thuật toán đó trên chip là một vấn đề rất quan trọng."
Đồng thời, Wang Yu nhấn mạnh rằng hiện tại rất khó triển khai các mô hình quy mô lớn trong lĩnh vực dọc và việc triển khai các mô hình quy mô lớn ở Trung Quốc phải đối mặt với ba thách thức lớn: chi phí triển khai lĩnh vực cao, khoảng cách lớn trong sức mạnh tính toán của mô hình và khó thay thế chip trong nước.
"Khác với mô hình trong kỷ nguyên AI 1.0 trước đây cho một nhiệm vụ cụ thể, thời đại AI 2.0 ngày nay là mô hình giải quyết nhiều nhiệm vụ và lớp ứng dụng, lớp thuật toán và lớp hệ thống cần được tối ưu hóa một cách cộng tác." Wang Yu nói rằng khi kết thúc hạ cánh mô hình lớn Một km, các mô hình quy mô lớn trong nước nên tập trung giải quyết bốn điểm đau.
"Trước tiên chúng ta cần giải quyết vấn đề về văn bản dài, nghĩa là sử dụng nó tốt." Wang Yu nói rằng xu hướng hiện tại của các thuật toán là tăng độ dài của văn bản được hỗ trợ bởi các mô hình lớn, nhưng văn bản dài cũng sẽ mang lại Transformer (Một mô hình học sâu do Google phát triển, trên đó OpenAI đã phát triển GPT) Tải trọng trên kiến trúc tăng lên đáng kể khi đầu vào trở nên dài hơn. Vì vậy, việc điều chỉnh văn bản dài là một yêu cầu cực kỳ quan trọng.
Một yêu cầu khác đối với các mô hình lớn là cải thiện hiệu suất chi phí. "Nếu Google sử dụng một mô hình lớn trong công cụ tìm kiếm của mình, nó sẽ tăng chi phí lên 36 tỷ đô la Mỹ và lợi nhuận của nó có thể bị mất 65%." Wang Yu nói rằng nếu công ty có thể giảm chi phí cho một cú nhấp chuột, thì tổn thất chung lợi nhuận có thể bị giảm. . Di chuyển theo hướng này, mọi người đều mong đợi có thể mua được những mẫu xe lớn.
Ngoài ra, các mô hình lớn cần trao quyền cho nhiều lĩnh vực theo chiều dọc, đối với mọi tầng lớp xã hội, không có nhiều mô hình lớn có nhiều kiến thức. Đặc biệt trong các lĩnh vực như chăm sóc y tế và tài chính, việc thu thập dữ liệu văn bản rất tốn kém và rất khan hiếm. "Nếu bạn có thể thêm một mô hình cơ sở có mục đích chung và tinh chỉnh nó, thì hiệu suất cơ bản của các ngành khác nhau dự kiến sẽ được cải thiện hơn nữa." Nhưng Wang Yu cũng chỉ ra rằng nếu nó phát triển theo chiều dọc, thì mục đích chung mô hình lớn thì phải tinh chỉnh, và mô hình càng lớn thì chi phí tinh chỉnh cũng tăng lên đáng kể. Do đó, làm thế nào để thiết kế một thuật toán tinh chỉnh hiệu quả là một chủ đề cần được thảo luận.
Đồng thời, các mô hình lớn cũng mang đến những yêu cầu mới cho việc triển khai một cửa. Trong việc tối ưu hóa phần mềm và phần cứng, nếu triển khai tối ưu hóa người vận hành, tối ưu hóa biên dịch và triển khai phần cứng theo lớp, thì cần tổng cộng 100 nhân lực mỗi ngày, trong khi đối với triển khai tự động một cửa, chỉ cần 10 nhân lực mỗi ngày. Wang Yu chỉ ra rằng triển khai một cửa có thể tối ưu hóa chi phí lao động, tăng hơn nữa quy mô của không gian tối ưu hóa biên dịch và dự kiến sẽ thúc đẩy sự phát triển của toàn bộ chuỗi công nghiệp.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Giải bài toán mô hình lớn trong nước: tránh “bị động nước”, chặng đường cuối cần kết nối thuật toán và chip
Nguồn: The Paper
Tác giả: Hu Xiner, thực tập sinh, Shao Wen, phóng viên tờ The Paper
Dai Qionghai, một học giả của Học viện Kỹ thuật Trung Quốc, cho biết: "Đất nước chúng ta nên tăng cường đào tạo nhân viên trí tuệ nhân tạo và nghiên cứu cơ bản về chính sách, cơ chế và đầu tư, tăng cường đổi mới ban đầu và tránh rơi vào tình thế tiến thoái lưỡng nan của 'nước không có nguồn'."
Wang Yu, giáo sư chính thức của Khoa Kỹ thuật Điện tử của Đại học Thanh Hoa, chỉ ra: "Đã có nhiều công ty sản xuất chip ở Thượng Hải và cũng có nhiều thuật toán ở Thượng Hải. Làm thế nào để triển khai hiệu quả và thống nhất và chạy các thuật toán như vậy trên chip là một vấn đề rất quan trọng. câu hỏi."
Vào ngày 7 tháng 7, tại Hội nghị trí tuệ nhân tạo thế giới năm 2023 diễn đàn "Cơ hội và rủi ro phát triển ngành trí tuệ nhân tạo chung trong kỷ nguyên mô hình quy mô lớn", một số chuyên gia trong lĩnh vực trí tuệ nhân tạo nói chung lần lượt tập trung vào các mô hình quy mô lớn từ đổi mới cơ bản, công nghệ ứng dụng và triển vọng tương lai Thảo luận chuyên sâu về trí tuệ nhân tạo ở các cấp độ khác.
"Đất nước chúng ta nên tăng cường đào tạo tài năng AI và nghiên cứu cơ bản về chính sách, cơ chế và đầu tư, tăng cường đổi mới ban đầu và tránh rơi vào tình thế tiến thoái lưỡng nan 'nước không có nguồn'." Dai Qionghai, cố vấn của Hội đồng Nhà nước và học giả của Học viện Kỹ thuật Trung Quốc, được nhấn mạnh trong bài phát biểu quan trọng của mình.
Wang Yu, giáo sư được thuê và trưởng khoa Kỹ thuật điện tử tại Đại học Thanh Hoa, cho biết từ góc độ ứng dụng hạ cánh, hiện tại rất khó triển khai các mô hình quy mô lớn trong lĩnh vực dọc và các mô hình quy mô lớn trong nước phải đối mặt với ba thách thức : chi phí triển khai tại hiện trường cao, chênh lệch lớn về sức mạnh tính toán của mô hình và khó thay thế Chip trong nước. "Ở dặm cuối cùng của mô hình lớn hạ cánh, chúng ta cần kết nối thuật toán với con chip." Wang Yu nói.
"Trí tuệ não bộ là hướng đi mới của tương lai"
Dai Qionghai tin rằng trong sự đổi mới của mô hình lớn "0 đến 1", những thành tựu đột phá trong nước trong lĩnh vực nghiên cứu cơ bản là yếu. "Từ góc độ của ngành phát triển thông minh, chúng tôi vừa lạc quan vừa không lạc quan." Theo quan điểm của ông, hầu hết các tài năng trí tuệ nhân tạo của Trung Quốc đều tập trung ở lớp ứng dụng, vì vậy có rất nhiều chỗ cho các kịch bản ứng dụng và lớp công nghệ. Tuy nhiên, Trung Quốc rõ ràng là bất lợi về nhân tài ở cấp độ cơ bản và thiếu sự đổi mới ban đầu.
Dai Qionghai cho rằng sự đổi mới và phát triển của trí tuệ nhân tạo đòi hỏi ba trụ cột, đó là thuật toán, dữ liệu và sức mạnh tính toán. Các thuật toán xác định mức độ thông minh, dữ liệu xác định phạm vi thông minh và sức mạnh tính toán xác định hiệu quả của trí thông minh. Ở cấp độ thuật toán, các mô hình lớn dự kiến sẽ trở thành nền tảng cơ bản quan trọng trong các ứng dụng trí tuệ nhân tạo trong khoảng 5 năm tới.
Dai Qionghai cũng chỉ ra rằng trí tuệ não bộ là một hướng đi mới trong tương lai. Thuật toán trí tuệ nhân tạo mới tích hợp não bộ và nhận thức đang đi đầu trong bố cục ngành và sẽ dẫn đầu một thế hệ trí thông minh mới. Ông đề nghị tại diễn đàn rằng chính phủ nên khuyến khích các doanh nghiệp đi đầu trong việc xây dựng các mô hình quy mô lớn, khám phá sự kết hợp giữa cơ chế sinh học và đặc điểm của máy móc, tiếp tục tạo ra các mô hình trí tuệ nhân tạo mới, đồng thời thúc đẩy nghiên cứu cơ bản và mở rộng ứng dụng. Ông dự đoán rằng trí tuệ nhân tạo với trí thông minh nhận thức làm cốt lõi sẽ bắt đầu được áp dụng vào mười năm sau.
Ngoài ra, Dai Qionghai tin rằng cần phải cảnh giác về các vấn đề bảo mật của các ứng dụng mô hình quy mô lớn. Các mô hình lớn chưa có khả năng xác thực đầu ra chẳng hạn như tạo nội dung lừa đảo. "Điều này có nghĩa là một khi ứng dụng mô hình lớn có vấn đề, nó không đơn giản như virus mạng máy tính hiện nay, chỉ diệt và diệt virus, sẽ có tác động phá hoại. Vì vậy, khi mô hình lớn là được áp dụng, bảo mật và độ tin cậy nên được kết hợp. Độ tin cậy đã được thảo luận rõ ràng."
Các mô hình quy mô lớn trong nước nên tập trung giải quyết bốn điểm nhức nhối
Wang Yu cho biết trong diễn đàn, "Thượng Hải rất quan tâm đến trí tuệ nhân tạo và chip, nhưng từ một góc độ khác, các mô hình tiên tiến nhất và sức mạnh tính toán tương đối quan trọng của chúng tôi thực sự phải chịu một số hạn chế nhất định. Sức mạnh tính toán của chúng ta nên đi theo hướng nào hơn, làm thế nào để bù đắp tốt hơn cho sức mạnh tính toán trong nước và làm thế nào để hỗ trợ sự phát triển của đất nước trong đào tạo mô hình lớn và lý luận với một không gian như vậy, những vấn đề này đã trở nên cực kỳ quan trọng."
Wang Yu cũng đề cập rằng hiện tại ở nước ngoài, chỉ Nvidia và AMD mới có thể chọn chip có sức mạnh tính toán lớn. Nvidia thống trị thị trường và hệ sinh thái phần mềm của nó tương đối tốt. "Vì vậy, nhiều mô hình nước ngoài, chẳng hạn như OpenAI, Microsoft và Google, đang mua chip Nvidia với số lượng lớn, sau đó phát triển chúng trên khung phần mềm của Nvidia. Hệ sinh thái nước ngoài rất đơn giản. Các doanh nghiệp làm tốt công việc của các thuật toán. Trong lĩnh vực này, việc triển khai được hỗ trợ bởi hệ thống phần mềm của Nvidia."
"Tuy nhiên, sự phát triển của chip sức mạnh tính toán lớn ở Trung Quốc vẫn còn ở giai đoạn sơ khai." Wang Yu tin rằng, "Đã có nhiều công ty chip ở Thượng Hải, chẳng hạn như Tianshu Zhixin, Suiyuan Technology, Cambrian, Biren Technology, v.v. cũng có nhiều ở Thượng Hải. Các thuật toán, làm thế nào để đạt được sự triển khai thống nhất và hiệu quả, và làm thế nào để chạy các thuật toán đó trên chip là một vấn đề rất quan trọng."
Đồng thời, Wang Yu nhấn mạnh rằng hiện tại rất khó triển khai các mô hình quy mô lớn trong lĩnh vực dọc và việc triển khai các mô hình quy mô lớn ở Trung Quốc phải đối mặt với ba thách thức lớn: chi phí triển khai lĩnh vực cao, khoảng cách lớn trong sức mạnh tính toán của mô hình và khó thay thế chip trong nước.
"Khác với mô hình trong kỷ nguyên AI 1.0 trước đây cho một nhiệm vụ cụ thể, thời đại AI 2.0 ngày nay là mô hình giải quyết nhiều nhiệm vụ và lớp ứng dụng, lớp thuật toán và lớp hệ thống cần được tối ưu hóa một cách cộng tác." Wang Yu nói rằng khi kết thúc hạ cánh mô hình lớn Một km, các mô hình quy mô lớn trong nước nên tập trung giải quyết bốn điểm đau.
"Trước tiên chúng ta cần giải quyết vấn đề về văn bản dài, nghĩa là sử dụng nó tốt." Wang Yu nói rằng xu hướng hiện tại của các thuật toán là tăng độ dài của văn bản được hỗ trợ bởi các mô hình lớn, nhưng văn bản dài cũng sẽ mang lại Transformer (Một mô hình học sâu do Google phát triển, trên đó OpenAI đã phát triển GPT) Tải trọng trên kiến trúc tăng lên đáng kể khi đầu vào trở nên dài hơn. Vì vậy, việc điều chỉnh văn bản dài là một yêu cầu cực kỳ quan trọng.
Một yêu cầu khác đối với các mô hình lớn là cải thiện hiệu suất chi phí. "Nếu Google sử dụng một mô hình lớn trong công cụ tìm kiếm của mình, nó sẽ tăng chi phí lên 36 tỷ đô la Mỹ và lợi nhuận của nó có thể bị mất 65%." Wang Yu nói rằng nếu công ty có thể giảm chi phí cho một cú nhấp chuột, thì tổn thất chung lợi nhuận có thể bị giảm. . Di chuyển theo hướng này, mọi người đều mong đợi có thể mua được những mẫu xe lớn.
Ngoài ra, các mô hình lớn cần trao quyền cho nhiều lĩnh vực theo chiều dọc, đối với mọi tầng lớp xã hội, không có nhiều mô hình lớn có nhiều kiến thức. Đặc biệt trong các lĩnh vực như chăm sóc y tế và tài chính, việc thu thập dữ liệu văn bản rất tốn kém và rất khan hiếm. "Nếu bạn có thể thêm một mô hình cơ sở có mục đích chung và tinh chỉnh nó, thì hiệu suất cơ bản của các ngành khác nhau dự kiến sẽ được cải thiện hơn nữa." Nhưng Wang Yu cũng chỉ ra rằng nếu nó phát triển theo chiều dọc, thì mục đích chung mô hình lớn thì phải tinh chỉnh, và mô hình càng lớn thì chi phí tinh chỉnh cũng tăng lên đáng kể. Do đó, làm thế nào để thiết kế một thuật toán tinh chỉnh hiệu quả là một chủ đề cần được thảo luận.
Đồng thời, các mô hình lớn cũng mang đến những yêu cầu mới cho việc triển khai một cửa. Trong việc tối ưu hóa phần mềm và phần cứng, nếu triển khai tối ưu hóa người vận hành, tối ưu hóa biên dịch và triển khai phần cứng theo lớp, thì cần tổng cộng 100 nhân lực mỗi ngày, trong khi đối với triển khai tự động một cửa, chỉ cần 10 nhân lực mỗi ngày. Wang Yu chỉ ra rằng triển khai một cửa có thể tối ưu hóa chi phí lao động, tăng hơn nữa quy mô của không gian tối ưu hóa biên dịch và dự kiến sẽ thúc đẩy sự phát triển của toàn bộ chuỗi công nghiệp.