Nền văn minh nhân loại có thể được coi là tổng số các ghi chép về dấu ấn của toàn bộ cuộc sống con người. Vậy, nếu có một bộ não siêu việt học hỏi tất cả những kiến thức mà con người ghi nhận được, nó có thể giúp chúng ta tạo ra một nền văn minh rực rỡ và phong phú hơn không?
Vào tháng 12 năm 2022, AIGC, được tạp chí "Science" bình chọn là một trong mười bước đột phá hàng đầu của khoa học, sẽ biến giấc mơ này thành hiện thực. Tên đầy đủ của AIGC là AI-Generated Content, tức là AI tổng quát, sử dụng công nghệ trí tuệ nhân tạo để tự động sản xuất nội dung. Đối với AIGC, năm 2022 được coi là một năm tăng trưởng đáng kinh ngạc. **AIGC có thể nói là hướng phát triển phổ biến và đầy ảo mộng nhất trong lĩnh vực AI hiện nay, sự phát triển của AIGC đã cho ra đời những ứng dụng bùng nổ như trợ lý viết, AI vẽ tranh, robot đối thoại, con người kỹ thuật số, văn phòng trợ lý phần mềm, được hình thành thông qua tương tác giữa người và máy tính, các mô hình mới về ghi âm, học tập và tái tạo. **Sau đó, một câu hỏi hấp dẫn được đặt ra: AIGC sẽ thúc đẩy làn sóng trí tuệ nhân tạo mới như thế nào?
Ghi lại, tìm hiểu và tạo lại
Anh hùng không nhất thiết phải bắt đầu từ dưới đáy Câu chuyện về OpenAI bắt đầu với một nhóm doanh nhân mới nổi đầy lo sợ về tương lai của trí tuệ nhân tạo. Sê-ri GPT giống như một bộ não siêu phàm được nuôi dưỡng bởi nhiều nguồn cấp dữ liệu khác nhau được OpenAI chuẩn bị kỹ lưỡng.
Mô hình GPT-2, được tạo ra gần ba năm rưỡi sau khi thành lập, là tác phẩm tiêu biểu thực sự đầu tiên của OpenAI. GPT-2 chứa 1,5 tỷ tham số, cung cấp 8 triệu bài đăng trên diễn đàn Reddit và tổng cộng 40 GB văn bản, cho thấy khả năng tiếp tục viết văn bản. Ví dụ: nếu bạn nhập một câu trong "Chúa tể của những chiếc nhẫn", nó sẽ tạo ra một phần tiếp theo khiến bạn không thể phân biệt đúng sai và cốt truyện khác với nguyên tác nhưng có vẻ hợp lý.
OpenAI điên cuồng muốn biết siêu bộ não này sẽ có những khả năng gì nếu nó có thể ăn nhiều khối văn bản hơn, vì vậy GPT-3 với 175 tỷ thông số đã ra đời. Chỉ riêng việc đào tạo GPT-3 đã tốn hàng chục triệu đô la Các chuyên gia cung cấp cho mô hình hàng trăm tỷ từ tiếng Anh, bao gồm các bản tin, bài đăng, sách toàn văn và nhiều trang web khác nhau được thu thập từ 60 triệu tên miền trong 12 năm qua. . Lần này, GPT-3 không chỉ có khả năng tạo ngôn ngữ mạnh mẽ hơn mà còn có khả năng học ngữ cảnh xuất sắc và nhiều kiến thức thế giới, thành thạo làm thơ, viết báo cáo tin tức, trả lời câu hỏi và viết mã. GPT-4 mới nhất có khả năng xử lý và hiểu dữ liệu mạnh hơn, có thể nhận và tạo văn bản 25.000 từ, gấp 8 lần so với ChatGPT trước đó.
Ngoài ra, khả năng tư duy logic và khả năng hiểu hình ảnh của nó cũng có những bước tiến nhảy vọt. OpenAI có lẽ là người thực hành kiên định nhất về mô hình ghi, học và tái tạo AI. Theo suy đoán của Đại học Edinburgh và Viện Trí tuệ nhân tạo Allen, từ GPT-3 đến GPT-3.5 đến GPT-4, OpenAI đã lặp lại nhiều phiên bản trong nội bộ. **ChatGPT thực hiện tinh chỉnh hướng dẫn dựa trên quá trình học tăng cường phản hồi của con người và cải thiện bốn khả năng là phản hồi chi tiết, phản hồi hợp lý, từ chối các câu hỏi không phù hợp và từ chối các câu hỏi ngoài phạm vi kiến thức bằng cách giảm đáng kể khả năng học theo ngữ cảnh. **
AIGC trên đường đi
Ngoài công nghệ tạo ngôn ngữ do ChatGPT đại diện, AIGC còn bao gồm tạo hình ảnh, tạo video, tạo âm thanh, v.v. Quá trình phát triển lâu dài của AIGC, theo "AIGC White Paper" do Học viện Công nghệ Thông tin và Truyền thông Trung Quốc phát hành, có thể tạm chia thành ba giai đoạn sau:
**Giai đoạn đầu phôi thai (những năm 1950-1990): ** Bị giới hạn bởi trình độ công nghệ, AIGC chỉ giới hạn trong các thử nghiệm quy mô nhỏ và nội dung được tạo ra không thực tế lắm. Năm 1957, Lejaren Hiller và Leonard Isaacson hoàn thành tác phẩm âm nhạc do máy tính tạo ra đầu tiên trong lịch sử bằng cách thay đổi các biến điều khiển trong chương trình máy tính thành các nốt nhạc— - Bộ tứ đàn dây "Ilyac Suite". Năm 1966, Joseph Weizenbaum (Joseph Weizenbaum) và Kenneth Colby (Kenneth Colby) cùng nhau phát triển robot "Eliza" (Eliza) đầu tiên trên thế giới, robot này sử dụng chức năng quét và tái tổ hợp từ khóa để hoàn thành các nhiệm vụ tương tác. Vào giữa những năm 1980, IBM đã tạo ra máy đánh chữ điều khiển bằng giọng nói "Tangora" dựa trên mô hình chuỗi Markov ẩn, có thể xử lý 20.000 từ. Ở giai đoạn này, AIGC chỉ được tạo ra bằng cách học các quy tắc do các chuyên gia viết ra và khả năng khái quát hóa của nó là vô cùng hạn chế, giống như một con rối do các chuyên gia chơi.
**Giai đoạn tích tụ trầm tích (thập niên 1990-2010): **AIGC chuyển dần từ thực nghiệm sang thực tiễn. Những đột phá lớn đã được thực hiện trong các thuật toán học sâu, đơn vị xử lý đồ họa (GPU), bộ xử lý tensor (TPU) và quy mô dữ liệu đào tạo. Năm 2007, hệ thống trí tuệ nhân tạo được lắp ráp bởi nhà nghiên cứu trí tuệ nhân tạo Ross Goodwin (Ross Goodwin) của Đại học New York đã viết tác phẩm trí tuệ nhân tạo hoàn toàn đầu tiên trên thế giới bằng cách ghi lại và cảm nhận những gì anh ấy nhìn thấy và nghe thấy trong chuyến đi. . Vào năm 2012, Microsoft đã trình diễn công khai một hệ thống phiên dịch đồng thời hoàn toàn tự động. Thông qua mạng thần kinh sâu (DNN), nội dung của những người nói tiếng Anh có thể được tự động tạo thành giọng nói tiếng Trung thông qua nhận dạng giọng nói, dịch ngôn ngữ, tổng hợp giọng nói và các công nghệ khác. Ở giai đoạn này, AIGC bắt đầu tự động học một lượng nhỏ dữ liệu do con người ghi lại và nắm vững một khả năng tổng quát hóa nhất định, nhưng bị hạn chế bởi nút cổ chai của thuật toán, hiệu ứng tạo cần được cải thiện. Lúc này, AIGC giống như một con vẹt giỏi bắt chước, ra vẻ đàng hoàng nhưng lại chẳng biết gì.
**Giai đoạn phát triển nhanh (những năm 2010 đến nay):**Kể từ năm 2014, với sự ra đời của các thuật toán học sâu tổng quát và sự mở rộng nhanh chóng của quy mô dữ liệu đào tạo, tác động của nội dung do AIGC tạo ra đã dần trở nên thực tế đến mức khó con người để phân biệt. Năm 2017, cô gái trí tuệ nhân tạo "Xiaobing" của Microsoft đã ra mắt tập thơ đầu tiên trên thế giới "Ánh nắng lạc mất cửa sổ thủy tinh" được tạo hoàn toàn bằng trí tuệ nhân tạo. Vào năm 2018, mẫu StyleGAN do Nvidia phát hành có thể tự động tạo ảnh và những bức ảnh có độ phân giải cao do nó tạo ra khó có thể phân biệt được bằng mắt người. Năm 2021, OpenAI ra mắt DALL-E và ra mắt phiên bản nâng cấp DALL-E-2 một năm sau đó, người dùng chỉ cần nhập một đoạn văn bản mô tả ngắn và DALL-E-2 có thể tạo ra các phim hoạt hình tương ứng với chất lượng cực cao, chân thực, trừu tượng và các phong cách vẽ khác. Vào tháng 7 năm 2022, công cụ vẽ AI mã nguồn mở Stable Diffusion đã được phát hành, cho phép những người bình thường tạo ra các tác phẩm ở cấp độ họa sĩ chuyên nghiệp. Vào tháng 8 cùng năm, một tác phẩm nghệ thuật mang tên "Space Opera House" đã giành giải nhất tại Hội chợ bang Colorado, Hoa Kỳ, tác phẩm này được thực hiện bởi AI. Các mô hình như Make-A-Video, Imagen Video và Phenaki được phát hành sau này có thể tạo video có mô tả văn bản. ** Vào ngày 30 tháng 11 năm 2022, OpenAI đã phát hành robot trò chuyện ChatGPT. Cho đến nay, kỷ nguyên của AIGC đã mở ra hoàn toàn và nội dung được tạo ra đang phát triển mạnh mẽ. **
Nhiên liệu dữ liệu
Sau gần 70 năm phát triển công nghệ, AIGC đã trở thành một hình thức quan trọng của ngành công nghiệp trí tuệ nhân tạo. Vào năm 2022, các nhà nghiên cứu tại Google đã xuất bản một bài báo có tựa đề "Khả năng mới nổi của các mô hình ngôn ngữ lớn" và nhận thấy rằng khi mô hình ngôn ngữ quá lớn vượt quá một giá trị quan trọng nhất định, thì các khả năng mà các mô hình nhỏ hơn không có sẽ xuất hiện. **Trong những năm gần đây, thành tựu đáng kể của các công nghệ mô hình quy mô lớn do GPT-4 và ChatGPT đại diện đã cho thấy rằng việc tăng quy mô mô hình và dữ liệu là một cách hiệu quả để vượt qua nút thắt cổ chai của các công nghệ hiện có.
Các mô hình AI ngày càng có kích thước lớn hơn, về cơ bản là để chứa nhiều dữ liệu hơn, nhưng dữ liệu chất lượng cao do con người ghi lại có thể cạn kiệt trong tương lai gần. Epoch, một tổ chức nghiên cứu và dự báo trí tuệ nhân tạo, đã dự đoán trong một bài báo không được đánh giá ngang hàng rằng dữ liệu văn bản chất lượng cao, dữ liệu văn bản chất lượng thấp và dữ liệu hình ảnh sẽ được xử lý nhân tạo vào năm 2023-2027, 2030-2050 và 2030 -2070, tương ứng. Trí thông minh cạn kiệt.
Khi đó, tổng hợp dữ liệu dựa trên AIGC sẽ trở thành nhiên liệu mới cho trí tuệ nhân tạo. Hiện tại, dữ liệu do trí tuệ nhân tạo tạo ra chiếm chưa đến 1% tổng số dữ liệu.**Theo dự báo của hãng tư vấn Gartner (Gartner), đến năm 2025, dữ liệu do trí tuệ nhân tạo tạo ra sẽ chiếm 10% tổng số dữ liệu. ** Do đó, việc thiết lập một hệ sinh thái công nghiệp AIGC hoàn chỉnh càng sớm càng tốt, cho phép người dùng tương tác tích cực với AIGC để tạo dữ liệu, từ đó hình thành bánh đà dữ liệu, sẽ tiếp tục thúc đẩy sự phát triển của công nghệ trí tuệ nhân tạo.
Nhìn về tương lai, AIGC cho khoa học có thể trở thành vùng nước sâu và chiến trường chính mới cho việc ứng dụng công nghệ trí tuệ nhân tạo, tức là “trí tuệ nhân tạo mở ra tương lai nghiên cứu khoa học”. ** Trước đây, cổ tức dữ liệu của các công ty Internet đã cạn kiệt, nhưng một lượng lớn dữ liệu thử nghiệm đã được tích lũy trong lĩnh vực khoa học. Sau khi cung cấp 280 triệu chuỗi axit amin, một công ty mới thành lập ở Berkeley, California, đã để mô hình học ngôn ngữ của protein, lần đầu tiên thực hiện quá trình tổng hợp protein mới từ con số không. Sự đổi mới mà AIGC mang lại cho khoa học đang phát triển mạnh mẽ. **Người ta dự đoán rằng đến năm 2025, hơn 30% thuốc và vật liệu sẽ được phát hiện với sự trợ giúp của AIGC. **
Trong tương lai, con người sẽ liên kết với AIGC để tạo thành cộng sinh sáng tạo nội dung và khám phá tri thức, nhưng tất cả những gì sâu kín của con người sẽ không bị AI thay đổi. CEO OpenAI Sam Altman (Sam Altman) từng hình dung: **Là con người, chúng ta vẫn quan tâm đến sự tương tác giữa con người với nhau, cơ chế khen thưởng của bộ não con người không thay đổi, chúng ta vẫn theo đuổi hạnh phúc và có khát vọng tạo ra Và khát vọng tranh giành, khát vọng lập gia đình... Điều mà con người 50.000 năm trước quan tâm, con người sẽ quan tâm hàng trăm năm sau. **
Sam Altman cũng nói rằng sự phổ biến của ChatGPT khiến mọi người cảm thấy rằng AGI (Trí tuệ nhân tạo chung) dường như gần gũi hơn với chúng ta, nhưng trên thực tế, một mô hình ngôn ngữ lớn tương tự như ChatGPT vẫn còn rất xa so với AGI và chúng ta vẫn có một con đường dài để đi trong tương lai. con đường để đi. Giữa thay đổi và bất biến, làn sóng do AIGC tạo ra đã đến.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
AIGC, làn sóng tạo nội dung đã đến
Bản gốc: Kiến thức kinh doanh Phúc Đán
Nền văn minh nhân loại có thể được coi là tổng số các ghi chép về dấu ấn của toàn bộ cuộc sống con người. Vậy, nếu có một bộ não siêu việt học hỏi tất cả những kiến thức mà con người ghi nhận được, nó có thể giúp chúng ta tạo ra một nền văn minh rực rỡ và phong phú hơn không?
Vào tháng 12 năm 2022, AIGC, được tạp chí "Science" bình chọn là một trong mười bước đột phá hàng đầu của khoa học, sẽ biến giấc mơ này thành hiện thực. Tên đầy đủ của AIGC là AI-Generated Content, tức là AI tổng quát, sử dụng công nghệ trí tuệ nhân tạo để tự động sản xuất nội dung. Đối với AIGC, năm 2022 được coi là một năm tăng trưởng đáng kinh ngạc. **AIGC có thể nói là hướng phát triển phổ biến và đầy ảo mộng nhất trong lĩnh vực AI hiện nay, sự phát triển của AIGC đã cho ra đời những ứng dụng bùng nổ như trợ lý viết, AI vẽ tranh, robot đối thoại, con người kỹ thuật số, văn phòng trợ lý phần mềm, được hình thành thông qua tương tác giữa người và máy tính, các mô hình mới về ghi âm, học tập và tái tạo. **Sau đó, một câu hỏi hấp dẫn được đặt ra: AIGC sẽ thúc đẩy làn sóng trí tuệ nhân tạo mới như thế nào?
Ghi lại, tìm hiểu và tạo lại
Anh hùng không nhất thiết phải bắt đầu từ dưới đáy Câu chuyện về OpenAI bắt đầu với một nhóm doanh nhân mới nổi đầy lo sợ về tương lai của trí tuệ nhân tạo. Sê-ri GPT giống như một bộ não siêu phàm được nuôi dưỡng bởi nhiều nguồn cấp dữ liệu khác nhau được OpenAI chuẩn bị kỹ lưỡng.
Mô hình GPT-2, được tạo ra gần ba năm rưỡi sau khi thành lập, là tác phẩm tiêu biểu thực sự đầu tiên của OpenAI. GPT-2 chứa 1,5 tỷ tham số, cung cấp 8 triệu bài đăng trên diễn đàn Reddit và tổng cộng 40 GB văn bản, cho thấy khả năng tiếp tục viết văn bản. Ví dụ: nếu bạn nhập một câu trong "Chúa tể của những chiếc nhẫn", nó sẽ tạo ra một phần tiếp theo khiến bạn không thể phân biệt đúng sai và cốt truyện khác với nguyên tác nhưng có vẻ hợp lý.
OpenAI điên cuồng muốn biết siêu bộ não này sẽ có những khả năng gì nếu nó có thể ăn nhiều khối văn bản hơn, vì vậy GPT-3 với 175 tỷ thông số đã ra đời. Chỉ riêng việc đào tạo GPT-3 đã tốn hàng chục triệu đô la Các chuyên gia cung cấp cho mô hình hàng trăm tỷ từ tiếng Anh, bao gồm các bản tin, bài đăng, sách toàn văn và nhiều trang web khác nhau được thu thập từ 60 triệu tên miền trong 12 năm qua. . Lần này, GPT-3 không chỉ có khả năng tạo ngôn ngữ mạnh mẽ hơn mà còn có khả năng học ngữ cảnh xuất sắc và nhiều kiến thức thế giới, thành thạo làm thơ, viết báo cáo tin tức, trả lời câu hỏi và viết mã. GPT-4 mới nhất có khả năng xử lý và hiểu dữ liệu mạnh hơn, có thể nhận và tạo văn bản 25.000 từ, gấp 8 lần so với ChatGPT trước đó.
Ngoài ra, khả năng tư duy logic và khả năng hiểu hình ảnh của nó cũng có những bước tiến nhảy vọt. OpenAI có lẽ là người thực hành kiên định nhất về mô hình ghi, học và tái tạo AI. Theo suy đoán của Đại học Edinburgh và Viện Trí tuệ nhân tạo Allen, từ GPT-3 đến GPT-3.5 đến GPT-4, OpenAI đã lặp lại nhiều phiên bản trong nội bộ. **ChatGPT thực hiện tinh chỉnh hướng dẫn dựa trên quá trình học tăng cường phản hồi của con người và cải thiện bốn khả năng là phản hồi chi tiết, phản hồi hợp lý, từ chối các câu hỏi không phù hợp và từ chối các câu hỏi ngoài phạm vi kiến thức bằng cách giảm đáng kể khả năng học theo ngữ cảnh. **
AIGC trên đường đi
Ngoài công nghệ tạo ngôn ngữ do ChatGPT đại diện, AIGC còn bao gồm tạo hình ảnh, tạo video, tạo âm thanh, v.v. Quá trình phát triển lâu dài của AIGC, theo "AIGC White Paper" do Học viện Công nghệ Thông tin và Truyền thông Trung Quốc phát hành, có thể tạm chia thành ba giai đoạn sau:
**Giai đoạn đầu phôi thai (những năm 1950-1990): ** Bị giới hạn bởi trình độ công nghệ, AIGC chỉ giới hạn trong các thử nghiệm quy mô nhỏ và nội dung được tạo ra không thực tế lắm. Năm 1957, Lejaren Hiller và Leonard Isaacson hoàn thành tác phẩm âm nhạc do máy tính tạo ra đầu tiên trong lịch sử bằng cách thay đổi các biến điều khiển trong chương trình máy tính thành các nốt nhạc— - Bộ tứ đàn dây "Ilyac Suite". Năm 1966, Joseph Weizenbaum (Joseph Weizenbaum) và Kenneth Colby (Kenneth Colby) cùng nhau phát triển robot "Eliza" (Eliza) đầu tiên trên thế giới, robot này sử dụng chức năng quét và tái tổ hợp từ khóa để hoàn thành các nhiệm vụ tương tác. Vào giữa những năm 1980, IBM đã tạo ra máy đánh chữ điều khiển bằng giọng nói "Tangora" dựa trên mô hình chuỗi Markov ẩn, có thể xử lý 20.000 từ. Ở giai đoạn này, AIGC chỉ được tạo ra bằng cách học các quy tắc do các chuyên gia viết ra và khả năng khái quát hóa của nó là vô cùng hạn chế, giống như một con rối do các chuyên gia chơi.
**Giai đoạn tích tụ trầm tích (thập niên 1990-2010): **AIGC chuyển dần từ thực nghiệm sang thực tiễn. Những đột phá lớn đã được thực hiện trong các thuật toán học sâu, đơn vị xử lý đồ họa (GPU), bộ xử lý tensor (TPU) và quy mô dữ liệu đào tạo. Năm 2007, hệ thống trí tuệ nhân tạo được lắp ráp bởi nhà nghiên cứu trí tuệ nhân tạo Ross Goodwin (Ross Goodwin) của Đại học New York đã viết tác phẩm trí tuệ nhân tạo hoàn toàn đầu tiên trên thế giới bằng cách ghi lại và cảm nhận những gì anh ấy nhìn thấy và nghe thấy trong chuyến đi. . Vào năm 2012, Microsoft đã trình diễn công khai một hệ thống phiên dịch đồng thời hoàn toàn tự động. Thông qua mạng thần kinh sâu (DNN), nội dung của những người nói tiếng Anh có thể được tự động tạo thành giọng nói tiếng Trung thông qua nhận dạng giọng nói, dịch ngôn ngữ, tổng hợp giọng nói và các công nghệ khác. Ở giai đoạn này, AIGC bắt đầu tự động học một lượng nhỏ dữ liệu do con người ghi lại và nắm vững một khả năng tổng quát hóa nhất định, nhưng bị hạn chế bởi nút cổ chai của thuật toán, hiệu ứng tạo cần được cải thiện. Lúc này, AIGC giống như một con vẹt giỏi bắt chước, ra vẻ đàng hoàng nhưng lại chẳng biết gì.
**Giai đoạn phát triển nhanh (những năm 2010 đến nay):**Kể từ năm 2014, với sự ra đời của các thuật toán học sâu tổng quát và sự mở rộng nhanh chóng của quy mô dữ liệu đào tạo, tác động của nội dung do AIGC tạo ra đã dần trở nên thực tế đến mức khó con người để phân biệt. Năm 2017, cô gái trí tuệ nhân tạo "Xiaobing" của Microsoft đã ra mắt tập thơ đầu tiên trên thế giới "Ánh nắng lạc mất cửa sổ thủy tinh" được tạo hoàn toàn bằng trí tuệ nhân tạo. Vào năm 2018, mẫu StyleGAN do Nvidia phát hành có thể tự động tạo ảnh và những bức ảnh có độ phân giải cao do nó tạo ra khó có thể phân biệt được bằng mắt người. Năm 2021, OpenAI ra mắt DALL-E và ra mắt phiên bản nâng cấp DALL-E-2 một năm sau đó, người dùng chỉ cần nhập một đoạn văn bản mô tả ngắn và DALL-E-2 có thể tạo ra các phim hoạt hình tương ứng với chất lượng cực cao, chân thực, trừu tượng và các phong cách vẽ khác. Vào tháng 7 năm 2022, công cụ vẽ AI mã nguồn mở Stable Diffusion đã được phát hành, cho phép những người bình thường tạo ra các tác phẩm ở cấp độ họa sĩ chuyên nghiệp. Vào tháng 8 cùng năm, một tác phẩm nghệ thuật mang tên "Space Opera House" đã giành giải nhất tại Hội chợ bang Colorado, Hoa Kỳ, tác phẩm này được thực hiện bởi AI. Các mô hình như Make-A-Video, Imagen Video và Phenaki được phát hành sau này có thể tạo video có mô tả văn bản. ** Vào ngày 30 tháng 11 năm 2022, OpenAI đã phát hành robot trò chuyện ChatGPT. Cho đến nay, kỷ nguyên của AIGC đã mở ra hoàn toàn và nội dung được tạo ra đang phát triển mạnh mẽ. **
Nhiên liệu dữ liệu
Sau gần 70 năm phát triển công nghệ, AIGC đã trở thành một hình thức quan trọng của ngành công nghiệp trí tuệ nhân tạo. Vào năm 2022, các nhà nghiên cứu tại Google đã xuất bản một bài báo có tựa đề "Khả năng mới nổi của các mô hình ngôn ngữ lớn" và nhận thấy rằng khi mô hình ngôn ngữ quá lớn vượt quá một giá trị quan trọng nhất định, thì các khả năng mà các mô hình nhỏ hơn không có sẽ xuất hiện. **Trong những năm gần đây, thành tựu đáng kể của các công nghệ mô hình quy mô lớn do GPT-4 và ChatGPT đại diện đã cho thấy rằng việc tăng quy mô mô hình và dữ liệu là một cách hiệu quả để vượt qua nút thắt cổ chai của các công nghệ hiện có.
Các mô hình AI ngày càng có kích thước lớn hơn, về cơ bản là để chứa nhiều dữ liệu hơn, nhưng dữ liệu chất lượng cao do con người ghi lại có thể cạn kiệt trong tương lai gần. Epoch, một tổ chức nghiên cứu và dự báo trí tuệ nhân tạo, đã dự đoán trong một bài báo không được đánh giá ngang hàng rằng dữ liệu văn bản chất lượng cao, dữ liệu văn bản chất lượng thấp và dữ liệu hình ảnh sẽ được xử lý nhân tạo vào năm 2023-2027, 2030-2050 và 2030 -2070, tương ứng. Trí thông minh cạn kiệt.
Khi đó, tổng hợp dữ liệu dựa trên AIGC sẽ trở thành nhiên liệu mới cho trí tuệ nhân tạo. Hiện tại, dữ liệu do trí tuệ nhân tạo tạo ra chiếm chưa đến 1% tổng số dữ liệu.**Theo dự báo của hãng tư vấn Gartner (Gartner), đến năm 2025, dữ liệu do trí tuệ nhân tạo tạo ra sẽ chiếm 10% tổng số dữ liệu. ** Do đó, việc thiết lập một hệ sinh thái công nghiệp AIGC hoàn chỉnh càng sớm càng tốt, cho phép người dùng tương tác tích cực với AIGC để tạo dữ liệu, từ đó hình thành bánh đà dữ liệu, sẽ tiếp tục thúc đẩy sự phát triển của công nghệ trí tuệ nhân tạo.
Nhìn về tương lai, AIGC cho khoa học có thể trở thành vùng nước sâu và chiến trường chính mới cho việc ứng dụng công nghệ trí tuệ nhân tạo, tức là “trí tuệ nhân tạo mở ra tương lai nghiên cứu khoa học”. ** Trước đây, cổ tức dữ liệu của các công ty Internet đã cạn kiệt, nhưng một lượng lớn dữ liệu thử nghiệm đã được tích lũy trong lĩnh vực khoa học. Sau khi cung cấp 280 triệu chuỗi axit amin, một công ty mới thành lập ở Berkeley, California, đã để mô hình học ngôn ngữ của protein, lần đầu tiên thực hiện quá trình tổng hợp protein mới từ con số không. Sự đổi mới mà AIGC mang lại cho khoa học đang phát triển mạnh mẽ. **Người ta dự đoán rằng đến năm 2025, hơn 30% thuốc và vật liệu sẽ được phát hiện với sự trợ giúp của AIGC. **
Trong tương lai, con người sẽ liên kết với AIGC để tạo thành cộng sinh sáng tạo nội dung và khám phá tri thức, nhưng tất cả những gì sâu kín của con người sẽ không bị AI thay đổi. CEO OpenAI Sam Altman (Sam Altman) từng hình dung: **Là con người, chúng ta vẫn quan tâm đến sự tương tác giữa con người với nhau, cơ chế khen thưởng của bộ não con người không thay đổi, chúng ta vẫn theo đuổi hạnh phúc và có khát vọng tạo ra Và khát vọng tranh giành, khát vọng lập gia đình... Điều mà con người 50.000 năm trước quan tâm, con người sẽ quan tâm hàng trăm năm sau. **
Sam Altman cũng nói rằng sự phổ biến của ChatGPT khiến mọi người cảm thấy rằng AGI (Trí tuệ nhân tạo chung) dường như gần gũi hơn với chúng ta, nhưng trên thực tế, một mô hình ngôn ngữ lớn tương tự như ChatGPT vẫn còn rất xa so với AGI và chúng ta vẫn có một con đường dài để đi trong tương lai. con đường để đi. Giữa thay đổi và bất biến, làn sóng do AIGC tạo ra đã đến.