Vào ngày 31 tháng 8, lô sản phẩm mô hình quy mô lớn đầu tiên của Trung Quốc đã vượt qua "Các biện pháp tạm thời để quản lý dịch vụ trí tuệ nhân tạo sáng tạo" và có thể chính thức ra mắt để cung cấp dịch vụ cho công chúng. Lô 8 mô hình quy mô lớn đầu tiên được ra mắt bao gồm Baidu Wenxin Yiyan, mô hình quy mô lớn Skylark của Byte, mô hình quy mô lớn Baichuan của Baichuan Intelligence và Zhipu Qingyan thuộc công ty AI Zhipu Huazhang có trụ sở tại Tsinghua.
Kể từ đầu năm nay, các mẫu xe cỡ lớn cực kỳ phổ biến và là đường đua cạnh tranh của các nhà sản xuất lớn trên thế giới, tất cả các công ty công nghệ lớn đều cho ra mắt các mẫu xe cỡ lớn của riêng mình, nhân dịp hoành tráng “Trận chiến 100 mẫu”.
Mô hình lớn thúc đẩy phát triển kinh tế số
Từ ngày 31 tháng 8, người dùng có thể tải xuống "Ứng dụng Wenxin Yiyan" trong cửa hàng ứng dụng hoặc đăng nhập vào "trang web chính thức của Wenxin Yiyan" để trải nghiệm. Baidu cũng sẽ mở một loạt ứng dụng gốc AI mới được xây dựng lại, cho phép người dùng trải nghiệm bốn khả năng cốt lõi của AI tạo sinh: hiểu, tạo, logic và trí nhớ.
Nguồn: Trang web chính thức của Wenxinyiyan
Robin Li, người sáng lập, chủ tịch và giám đốc điều hành của Baidu, từng nói rằng các mô hình lớn sẽ thâm nhập ngày càng nhiều lĩnh vực. Nền kinh tế kỹ thuật số, được thúc đẩy bởi các mô hình lớn làm chủ đạo, sẽ hội nhập sâu sắc với nền kinh tế thực và sẽ trở nên mạnh mẽ hơn, tốt hơn và lớn hơn, tạo ra giá trị gia tăng đáng kể, mang lại sự phát triển kinh tế, xã hội và những thay đổi sâu sắc trong ngành.
Điều này được hiểu rằng trong mười năm qua, Baidu đã đầu tư hơn 140 tỷ nhân dân tệ vào nghiên cứu và phát triển tích lũy, trở thành một công ty AI với bố cục đầy đủ bốn lớp gồm các ứng dụng, mô hình, khung và chip, đạt được mục tiêu cuối cùng. tối ưu hóa từ đầu đến cuối và có chìa khóa để dẫn đầu ngành ở mọi cấp độ.
Nguồn: "Báo cáo nghiên cứu bản đồ mô hình lớn trí tuệ nhân tạo Trung Quốc"
Cũng trong sáng sớm ngày 31, Baichuan Intelligence cũng thông báo rằng mô hình lớn của họ đã được đăng ký thông qua "Các biện pháp tạm thời để quản lý các dịch vụ trí tuệ nhân tạo sáng tạo" và mở cửa cho công chúng. trải nghiệm nó.
Baichuan Intelligence được thành lập vào ngày 10 tháng 4 năm 2023 bởi cựu Giám đốc điều hành Sogou, Wang Xiaochuan. Đội ngũ nòng cốt bao gồm những tài năng AI hàng đầu từ các công ty công nghệ nổi tiếng như Sogou, Baidu, Huawei, Microsoft, Byte và Tencent. Chỉ bốn tháng sau khi thành lập, Ba Xuyên Thông minh đã phát hành ba mô hình ngôn ngữ lớn có mục đích chung, bao gồm Ba Xuyên-7B, mô hình ngôn ngữ lớn nguồn mở đầu tiên của đất nước với 7 tỷ tham số có thể được thương mại hóa miễn phí và Ba Xuyên-53B, một mô hình lớn mô hình ngôn ngữ với 53 tỷ tham số.
Nguồn: Trang web chính thức của Baichuan Intelligence
iFlytek đã chính thức phát hành “Mô hình nhận thức lớn iFlytek Spark” vào ngày 6 tháng 5 năm nay. iFlytek cho biết đến ngày 24 tháng 10 năm nay, iFlytek Spark sẽ đạt được điểm chuẩn mô hình phổ quát so với ChatGPT. Trong báo cáo đánh giá mô hình lớn do MIT Technology Review Trung Quốc công bố ngày 17/8, iFlytek Spark V2.0 đứng đầu với tổng số điểm là 81,5 điểm, và được mệnh danh là mô hình lớn “thông minh” nhất Trung Quốc.
Mô hình lớn toàn cầu nở rộ hơn
Trí tuệ nhân tạo đang chuyển từ đám mây sang thiết bị đầu cuối. Từ góc độ toàn cầu, các nhà sản xuất như Google, Microsoft và Apple cũng đang nỗ lực trong các mô hình thiết bị đầu cuối quy mô lớn và trọng lượng nhẹ đã trở thành hướng phát triển quan trọng để triển khai mô hình quy mô lớn trong các thiết bị đầu cuối.
Nguồn: DragonImages
Vào tháng 5 năm nay, Google đã phát hành PaLM2, một mẫu máy cỡ lớn phù hợp với thiết bị biên. Cụ thể, có 4 thông số kỹ thuật của mẫu lớn PaLM2 là Gecko (Tắc kè), Rái cá (Otter), Bison (Bison) và Unicorn (Unicorn). Trong số đó, Gecko rất nhẹ và hoạt động trên thiết bị di động. Một mô hình nhẹ hơn nhưng chất lượng cao hơn có thể cải thiện đáng kể hiệu quả suy luận và giảm chi phí dịch vụ, cho phép các ứng dụng hạ nguồn của mô hình thích ứng với nhiều ứng dụng và người dùng hơn, giúp triển khai AI biên có thể thực hiện được.
Vào tháng 7, Apple đã chính thức công bố khởi động quá trình phát triển AppleGPT và tham gia vào cuộc chiến mô hình lớn AI cuối cùng. Được biết, AppleGPT là một công cụ AI được Apple phát triển dựa trên framework Ajax do hãng tự phát triển và hiện đang được thử nghiệm ở quy mô nhỏ trong nội bộ Apple.
Nguồn: Pixabay
Đồng thời, Microsoft đã cung cấp mô hình đào tạo DeepSpeedChat mã nguồn mở và LLaMA mã nguồn mở Meta, nhanh chóng tạo nên xu hướng đào tạo dựa trên LLaMA trong số các nhà phát triển AI, đẩy nhanh sự thâm nhập của các phương pháp đào tạo như Lora. Điều này được hiểu rằng các mô hình Deepspeed và Lora cung cấp cho các nhà phát triển vừa và nhỏ các công cụ hoàn chỉnh để đào tạo nhanh chóng và chi phí thấp cho các "mô hình nhỏ" của riêng họ, đẩy nhanh việc thiết lập các mô hình phân phối độ dốc cho các mô hình lớn.
Về phía các nhà sản xuất chip, Qualcomm đã phát hành bản trình diễn phía thiết bị đầu cuối Khuếch tán ổn định đầu tiên trên thế giới chạy trên điện thoại Android tại hội nghị MWC 2023. Theo báo cáo, các tham số của mô hình Khuếch tán ổn định vượt quá 1 tỷ. Qualcomm sử dụng ngăn xếp phần mềm AI của mình để định lượng, biên dịch và tối ưu hóa khả năng tăng tốc phần cứng của mô hình để có thể chạy thành công trên điện thoại di động được trang bị nền tảng di động Snapdragon 8 thế hệ thứ hai .
Nguồn: Pixabay
Mô hình lớn “ứng dụng” và “giám sát” luôn song hành
Vào tháng 3 năm nay, công cụ chatbot AI mới ChatGPT 3.5 do công ty khởi nghiệp OPEN AI ở Thung lũng Silicon ra mắt đã chứng tỏ khả năng đàm thoại đáng kinh ngạc. Chỉ trong hai tháng, số người dùng hoạt động hàng tháng của ChatGPT đã đạt 100 triệu, khiến nó trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử.
Trước những cơ hội và thách thức do AI tạo ra mang lại, các quốc gia có quan điểm khác nhau về cách quản lý AI. Trung Quốc, Hoa Kỳ, Liên minh Châu Âu và các quốc gia hoặc khu vực khác đã phản ứng nhanh chóng, trong khi Singapore và Ấn Độ tuyên bố họ không có kế hoạch quản lý AI vào thời điểm hiện tại.
Vào ngày 15 tháng 8, “Các biện pháp tạm thời để quản lý các dịch vụ trí tuệ nhân tạo sáng tạo” của Trung Quốc đã chính thức được thực thi, được coi là luật về trí tuệ nhân tạo sáng tạo đầu tiên trên thế giới.
Nguồn: Pixabay
Trong khi thực hiện các quy tắc và quy định, "Biện pháp" tiếp tục khuyến khích ứng dụng đổi mới công nghệ trí tuệ nhân tạo sáng tạo trong các ngành và lĩnh vực khác nhau, đồng thời hỗ trợ các tổ chức khác nhau trong đổi mới công nghệ trí tuệ nhân tạo sáng tạo, xây dựng, chuyển đổi và ứng dụng tài nguyên dữ liệu, phòng ngừa rủi ro, v.v. Hợp tác thúc đẩy xây dựng cơ sở hạ tầng trí tuệ nhân tạo tổng hợp và nền tảng tài nguyên dữ liệu đào tạo công cộng.
Những người trong ngành cho biết, với việc triển khai các "Biện pháp", các mô hình AI lớn dự kiến sẽ dần bước vào giai đoạn đấu tranh cho các ứng dụng gốc và triển khai công nghiệp từ các thông số.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
"Trận chiến của những người mẫu lớn" có bao nhiêu tập?
Nguồn: Hội nghị Internet thế giới
Vào ngày 31 tháng 8, lô sản phẩm mô hình quy mô lớn đầu tiên của Trung Quốc đã vượt qua "Các biện pháp tạm thời để quản lý dịch vụ trí tuệ nhân tạo sáng tạo" và có thể chính thức ra mắt để cung cấp dịch vụ cho công chúng. Lô 8 mô hình quy mô lớn đầu tiên được ra mắt bao gồm Baidu Wenxin Yiyan, mô hình quy mô lớn Skylark của Byte, mô hình quy mô lớn Baichuan của Baichuan Intelligence và Zhipu Qingyan thuộc công ty AI Zhipu Huazhang có trụ sở tại Tsinghua.
Kể từ đầu năm nay, các mẫu xe cỡ lớn cực kỳ phổ biến và là đường đua cạnh tranh của các nhà sản xuất lớn trên thế giới, tất cả các công ty công nghệ lớn đều cho ra mắt các mẫu xe cỡ lớn của riêng mình, nhân dịp hoành tráng “Trận chiến 100 mẫu”.
Mô hình lớn thúc đẩy phát triển kinh tế số
Từ ngày 31 tháng 8, người dùng có thể tải xuống "Ứng dụng Wenxin Yiyan" trong cửa hàng ứng dụng hoặc đăng nhập vào "trang web chính thức của Wenxin Yiyan" để trải nghiệm. Baidu cũng sẽ mở một loạt ứng dụng gốc AI mới được xây dựng lại, cho phép người dùng trải nghiệm bốn khả năng cốt lõi của AI tạo sinh: hiểu, tạo, logic và trí nhớ.
Robin Li, người sáng lập, chủ tịch và giám đốc điều hành của Baidu, từng nói rằng các mô hình lớn sẽ thâm nhập ngày càng nhiều lĩnh vực. Nền kinh tế kỹ thuật số, được thúc đẩy bởi các mô hình lớn làm chủ đạo, sẽ hội nhập sâu sắc với nền kinh tế thực và sẽ trở nên mạnh mẽ hơn, tốt hơn và lớn hơn, tạo ra giá trị gia tăng đáng kể, mang lại sự phát triển kinh tế, xã hội và những thay đổi sâu sắc trong ngành.
Điều này được hiểu rằng trong mười năm qua, Baidu đã đầu tư hơn 140 tỷ nhân dân tệ vào nghiên cứu và phát triển tích lũy, trở thành một công ty AI với bố cục đầy đủ bốn lớp gồm các ứng dụng, mô hình, khung và chip, đạt được mục tiêu cuối cùng. tối ưu hóa từ đầu đến cuối và có chìa khóa để dẫn đầu ngành ở mọi cấp độ.
Cũng trong sáng sớm ngày 31, Baichuan Intelligence cũng thông báo rằng mô hình lớn của họ đã được đăng ký thông qua "Các biện pháp tạm thời để quản lý các dịch vụ trí tuệ nhân tạo sáng tạo" và mở cửa cho công chúng. trải nghiệm nó.
Baichuan Intelligence được thành lập vào ngày 10 tháng 4 năm 2023 bởi cựu Giám đốc điều hành Sogou, Wang Xiaochuan. Đội ngũ nòng cốt bao gồm những tài năng AI hàng đầu từ các công ty công nghệ nổi tiếng như Sogou, Baidu, Huawei, Microsoft, Byte và Tencent. Chỉ bốn tháng sau khi thành lập, Ba Xuyên Thông minh đã phát hành ba mô hình ngôn ngữ lớn có mục đích chung, bao gồm Ba Xuyên-7B, mô hình ngôn ngữ lớn nguồn mở đầu tiên của đất nước với 7 tỷ tham số có thể được thương mại hóa miễn phí và Ba Xuyên-53B, một mô hình lớn mô hình ngôn ngữ với 53 tỷ tham số.
iFlytek đã chính thức phát hành “Mô hình nhận thức lớn iFlytek Spark” vào ngày 6 tháng 5 năm nay. iFlytek cho biết đến ngày 24 tháng 10 năm nay, iFlytek Spark sẽ đạt được điểm chuẩn mô hình phổ quát so với ChatGPT. Trong báo cáo đánh giá mô hình lớn do MIT Technology Review Trung Quốc công bố ngày 17/8, iFlytek Spark V2.0 đứng đầu với tổng số điểm là 81,5 điểm, và được mệnh danh là mô hình lớn “thông minh” nhất Trung Quốc.
Mô hình lớn toàn cầu nở rộ hơn
Trí tuệ nhân tạo đang chuyển từ đám mây sang thiết bị đầu cuối. Từ góc độ toàn cầu, các nhà sản xuất như Google, Microsoft và Apple cũng đang nỗ lực trong các mô hình thiết bị đầu cuối quy mô lớn và trọng lượng nhẹ đã trở thành hướng phát triển quan trọng để triển khai mô hình quy mô lớn trong các thiết bị đầu cuối.
Vào tháng 5 năm nay, Google đã phát hành PaLM2, một mẫu máy cỡ lớn phù hợp với thiết bị biên. Cụ thể, có 4 thông số kỹ thuật của mẫu lớn PaLM2 là Gecko (Tắc kè), Rái cá (Otter), Bison (Bison) và Unicorn (Unicorn). Trong số đó, Gecko rất nhẹ và hoạt động trên thiết bị di động. Một mô hình nhẹ hơn nhưng chất lượng cao hơn có thể cải thiện đáng kể hiệu quả suy luận và giảm chi phí dịch vụ, cho phép các ứng dụng hạ nguồn của mô hình thích ứng với nhiều ứng dụng và người dùng hơn, giúp triển khai AI biên có thể thực hiện được.
Vào tháng 7, Apple đã chính thức công bố khởi động quá trình phát triển AppleGPT và tham gia vào cuộc chiến mô hình lớn AI cuối cùng. Được biết, AppleGPT là một công cụ AI được Apple phát triển dựa trên framework Ajax do hãng tự phát triển và hiện đang được thử nghiệm ở quy mô nhỏ trong nội bộ Apple.
Đồng thời, Microsoft đã cung cấp mô hình đào tạo DeepSpeedChat mã nguồn mở và LLaMA mã nguồn mở Meta, nhanh chóng tạo nên xu hướng đào tạo dựa trên LLaMA trong số các nhà phát triển AI, đẩy nhanh sự thâm nhập của các phương pháp đào tạo như Lora. Điều này được hiểu rằng các mô hình Deepspeed và Lora cung cấp cho các nhà phát triển vừa và nhỏ các công cụ hoàn chỉnh để đào tạo nhanh chóng và chi phí thấp cho các "mô hình nhỏ" của riêng họ, đẩy nhanh việc thiết lập các mô hình phân phối độ dốc cho các mô hình lớn.
Về phía các nhà sản xuất chip, Qualcomm đã phát hành bản trình diễn phía thiết bị đầu cuối Khuếch tán ổn định đầu tiên trên thế giới chạy trên điện thoại Android tại hội nghị MWC 2023. Theo báo cáo, các tham số của mô hình Khuếch tán ổn định vượt quá 1 tỷ. Qualcomm sử dụng ngăn xếp phần mềm AI của mình để định lượng, biên dịch và tối ưu hóa khả năng tăng tốc phần cứng của mô hình để có thể chạy thành công trên điện thoại di động được trang bị nền tảng di động Snapdragon 8 thế hệ thứ hai .
Mô hình lớn “ứng dụng” và “giám sát” luôn song hành
Vào tháng 3 năm nay, công cụ chatbot AI mới ChatGPT 3.5 do công ty khởi nghiệp OPEN AI ở Thung lũng Silicon ra mắt đã chứng tỏ khả năng đàm thoại đáng kinh ngạc. Chỉ trong hai tháng, số người dùng hoạt động hàng tháng của ChatGPT đã đạt 100 triệu, khiến nó trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử.
Trước những cơ hội và thách thức do AI tạo ra mang lại, các quốc gia có quan điểm khác nhau về cách quản lý AI. Trung Quốc, Hoa Kỳ, Liên minh Châu Âu và các quốc gia hoặc khu vực khác đã phản ứng nhanh chóng, trong khi Singapore và Ấn Độ tuyên bố họ không có kế hoạch quản lý AI vào thời điểm hiện tại.
Vào ngày 15 tháng 8, “Các biện pháp tạm thời để quản lý các dịch vụ trí tuệ nhân tạo sáng tạo” của Trung Quốc đã chính thức được thực thi, được coi là luật về trí tuệ nhân tạo sáng tạo đầu tiên trên thế giới.
Trong khi thực hiện các quy tắc và quy định, "Biện pháp" tiếp tục khuyến khích ứng dụng đổi mới công nghệ trí tuệ nhân tạo sáng tạo trong các ngành và lĩnh vực khác nhau, đồng thời hỗ trợ các tổ chức khác nhau trong đổi mới công nghệ trí tuệ nhân tạo sáng tạo, xây dựng, chuyển đổi và ứng dụng tài nguyên dữ liệu, phòng ngừa rủi ro, v.v. Hợp tác thúc đẩy xây dựng cơ sở hạ tầng trí tuệ nhân tạo tổng hợp và nền tảng tài nguyên dữ liệu đào tạo công cộng.
Những người trong ngành cho biết, với việc triển khai các "Biện pháp", các mô hình AI lớn dự kiến sẽ dần bước vào giai đoạn đấu tranh cho các ứng dụng gốc và triển khai công nghiệp từ các thông số.