Nửa sau của "cuộc chiến 100 mô hình" sẽ bắt đầu và nền tảng này sẽ trở thành chìa khóa

Nguồn gốc: Titanium Media

Nguồn hình ảnh: Được tạo bởi Unbounded AI

Đã gần một năm kể từ khi mô hình lớn bước vào tầm nhìn của mọi người, và dưới làn sóng các mô hình lớn AI, các công ty công nghệ lớn đã đổ xô tung ra các sản phẩm mô hình lớn của riêng họ. Đồng thời, các doanh nghiệp trong các ngành công nghiệp khác nhau cũng chú ý đến các mô hình lớn.

Nếu nói tình trạng các nhà sản xuất lớn tung ra các sản phẩm mô hình quy mô lớn để tạo thành "cuộc chiến 100 mô hình" là nửa đầu của "cuộc chiến" của các mô hình lớn, thì nửa sau của "cuộc chiến" này sẽ tập trung nhiều hơn vào khả năng tích hợp các sản phẩm mô hình quy mô lớn, cũng như hướng phát triển của nền tảng và công nghiệp hóa.

**Nửa sau của trò chơi, nền tảng hóa và công nghiệp hóa sẽ trở thành đường đua chính **

Lấy ChatGPT, "người khởi xướng" mô hình lớn, ChatGPT là một ứng dụng và có thể coi là một APP, còn GPT4 là mô hình lớn, xây dựng hệ sinh thái tương tự như mô hình lớn, để doanh nghiệp có thể tự xây dựng mô hình lớn dựa trên điều này.

Từ những trường hợp trên, có thể thấy trong gần một năm trở lại đây, tất cả các công ty đều tập trung vào việc đánh bóng các sản phẩm tương tự như "ChatGPT", và việc hạ cánh là ở phía ứng dụng, trong khi về phía doanh nghiệp, ngành vẫn thiếu một nền tảng cho phép doanh nghiệp linh hoạt gọi từng sản phẩm mô hình lớn, hoặc mở một mô hình lớn cho nhu cầu riêng dựa trên một sản phẩm nhất định. Theo Li Gang, phó chủ tịch và CTO của Digital China, nếu một mô hình lớn muốn đạt được sự bùng nổ của các ứng dụng ở phía doanh nghiệp, nó cần một, hoặc thậm chí nhiều nền tảng mô hình lớn mã nguồn mở và mở.

Khi nói đến việc áp dụng các mô hình lớn cấp doanh nghiệp, chúng ta phải đề cập đến mô hình lớn của ngành, quan sát phương tiện titan nhận thấy mô hình lớn cấp ngành hiện nay vẫn đang trong giai đoạn phát triển ban đầu, mặc dù có nhiều công ty đã cho ra mắt mô hình lớn công nghiệp, nhưng ứng dụng không tốt lắm.

Lấy ngành tài chính đang phát triển nhanh chóng làm ví dụ, vào tháng 3 năm nay, Bloomberg đã ra mắt BloombergGPT, một mô hình ngôn ngữ lớn cho ngành tài chính, thu hút sự chú ý của thị trường đối với các mô hình lớn trong ngành dọc tài chính và vào tháng Sáu, Đại học Columbia và NYU Thượng Hải đã ra mắt FinGPT.

Tại Trung Quốc, vào tháng Bảy, Huawei đã phát hành mô hình Pangu, một trong số đó là một trong một số mô hình toàn ngành. Vào tháng 9, Ant Group đã chính thức phát hành "Mô hình cơ bản kiến" tự phát triển và "Mô hình tài chính kiến" tùy chỉnh trên cơ sở này.

Li Gang nói với Titanium Media rằng các loại mô hình lớn trên thị trường chủ yếu được chia thành nhiều loại, một là mô hình cơ bản chung, nói chung, các mô hình lớn này xây dựng cơ sở dữ liệu thông qua ngữ liệu ngôn ngữ tự nhiên, và sau khi làm sạch, đào tạo và các hoạt động khác, mô hình lớn cơ bản được tạo ra, "Loại mô hình này, kho dữ liệu càng lớn, số lượng tham số càng lớn, khả năng càng mạnh." Lý Cương nói.

Loại hình còn lại là mô hình công nghiệp, có tính chuyên nghiệp cao và đòi hỏi một số lượng lớn nền tảng kiến thức ngành, "Hiện tại, kho kiến thức của ngành này cần được kiểm soát ở mức 20%, không hơn không kém." Li Gang nhấn mạnh: "Nếu vượt quá 20%, người mẫu lớn được đào tạo có thể 'không thể nói', gây ra rào cản giao tiếp và dưới 20% có thể không có sự chuyên nghiệp của ngành". "

** Lớp "PaaS" để xây dựng các mô hình lớn **

Cũng giống như điện toán đám mây được chia thành IaaS, PaaS và SaaS, theo quan điểm của Huang Fu Ziqiao, tổng giám đốc bộ phận tiếp thị chiến lược của Digital China, trong kỷ nguyên của các mô hình lớn, các doanh nghiệp cũng cần một nền tảng PaaS tương tự như kỷ nguyên đám mây.

Để xây dựng nền tảng cho các doanh nghiệp sử dụng tốt hơn các mô hình lớn, Digital China gần đây đã chính thức phát hành nền tảng Shenzhou Wenxue, nói về tầm quan trọng của việc phát hành nền tảng, Li Gang nói với Titanium Media: "Với nền tảng Shenzhou Wenxue làm cốt lõi, chúng tôi không thực hiện mô hình lớn cơ bản, mà là nền tảng tích hợp và phát triển và phân phối ứng dụng của mô hình lớn, để thúc đẩy đổi mới AI doanh nghiệp; chúng tôi là đối tác dịch vụ của dữ liệu lớn, để đẩy nhanh việc nâng cấp quản trị dữ liệu doanh nghiệp; chúng tôi làm mối quan hệ sinh thái, thị trường mô hình, siêu thị dữ liệu, App Store, để thúc đẩy đổi mới công nghiệp và đột phá sinh thái. "

Vào đầu năm nay, Huawei CLOUD đã phát hành mô hình lớn Pangu và phân loại nó theo L0, L1 và L2. Theo HUAWEI CLOUD, L0 đề cập đến mô hình cơ bản, L1 đề cập đến mô hình công nghiệp và L2 đề cập đến mô hình suy luận cho các kịch bản được chia nhỏ hơn.

Về các mô hình lớn cơ bản, lấy mô hình lớn mạng đồ thị làm ví dụ, một mô hình lớn có thể được điều chỉnh cho nhiều kịch bản như tối ưu hóa quy trình, dự đoán chuỗi thời gian và phân tích thông minh và có thể được áp dụng cho nhiều ngành như tài chính, khai thác than và sản xuất.

Về mô hình công nghiệp, HUAWEI CLOUD đã đưa ra các mô hình công nghiệp như Mô hình tài chính Pangu, Mô hình mỏ Pangu, Mô hình điện Pangu, Mô hình kiểm tra chất lượng sản xuất Pangu và Mô hình phân tử dược phẩm Pangu.

Về các mô hình suy luận, ví dụ, dựa trên mô hình năng lượng Pangu, HUAWEI CLOUD đã ra mắt mô hình kiểm tra năng lượng Pangu cho các kịch bản phân chia kiểm tra công suất UAV thông qua đào tạo trước + tinh chỉnh các nhiệm vụ hạ nguồn, giải quyết các vấn đề về học mẫu nhỏ, học tập tích cực và học tập gia tăng trong hệ thống kiểm tra thông minh UAV (phát hiện lỗi) và giải quyết các vấn đề về khối lượng công việc lớn của chú thích dữ liệu lớn và nhiều lỗi khác nhau.

Trên đây là những hiểu biết của HUAWEI CLOUD về các mô hình lớn và một số bố cục ngành của HUAWEI CLOUD. Dựa trên điều này, Huangfu Ziqiao nói với Titanium Media rằng nền tảng học tập của Digital China sẽ đóng vai trò là "bộ chuyển đổi" trong việc giúp các doanh nghiệp chuyển từ các kịch bản ứng dụng công nghiệp L0 sang L2, "cung cấp cho các doanh nghiệp khả năng cung cấp nền tảng PaaS tương tự như kỷ nguyên điện toán đám mây". Hoàng Phủ Tử Kiều nói.

Thật trùng hợp, Giám đốc công nghệ Baidu Wang Haifeng cũng đã công khai tuyên bố rằng trước thách thức của công nghiệp hóa mô hình quy mô lớn, ngành công nghiệp cần một mô hình đúc chip tương tự để áp dụng mô hình "sản xuất chuyên sâu và ứng dụng dựa trên nền tảng", tức là các doanh nghiệp có lợi thế toàn diện về thuật toán, sức mạnh tính toán và dữ liệu sẽ gói gọn quá trình sản xuất mô hình phức tạp và cung cấp dịch vụ mô hình quy mô lớn cho hàng nghìn ngành công nghiệp thông qua nền tảng sản xuất ngưỡng thấp và hiệu quả cao.

Theo Titanium Media, hiện nay, con đường công nghiệp hóa này đã được xác minh trong thực tiễn của ngành công nghiệp mô hình lớn Wenxin, Baidu và các doanh nghiệp hàng đầu trong ngành, các tổ chức để xây dựng một mô hình lớn bao gồm năng lượng, tài chính, hàng không vũ trụ, sản xuất, truyền thông, thành phố, khoa học xã hội và điện ảnh và truyền hình và các ngành công nghiệp khác.

** Chi phí thấp hơn và ngưỡng thấp hơn là mục tiêu **

Mặc dù các mô hình lớn đã dần thâm nhập vào mọi tầng lớp xã hội, nhưng về mặt phát triển các mô hình lớn ở giai đoạn này, chi phí sử dụng các mô hình lớn vẫn còn cấm đối với nhiều doanh nghiệp đối với người dùng cấp doanh nghiệp.

Lấy GPT-3 làm ví dụ, Nvidia đã tiết lộ rằng phải mất 34 ngày để đào tạo GPT-3 với 175 tỷ thông số, sử dụng 1.024 chip GPU A100 và chi phí cho một lần đào tạo lên tới 12 triệu USD. Để đào tạo các mô hình AI quy mô cực lớn, Microsoft thậm chí đã xây dựng một trong năm siêu máy tính hàng đầu thế giới cho OpenAI.

Đồng thời, theo báo cáo "ChatGPT cần bao nhiêu sức mạnh tính toán" của Guosheng Securities, chi phí tiền đào tạo của các mô hình lớn là rất cao, với chi phí cho một lần đào tạo vượt quá một triệu đô la Mỹ. Phí này không chỉ bao gồm kiến trúc mô hình, lựa chọn thuật toán và lựa chọn dữ liệu đào tạo mà còn bao gồm lượng lớn tài nguyên tính toán và thời gian cần thiết cho việc đào tạo mô hình. Và với việc nâng cấp phiên bản mô hình lớn, chi phí đào tạo của nó cũng tăng theo cấp số nhân.

Robin Li, người sáng lập, chủ tịch và CEO của Baidu, cũng chỉ ra: "Không có công ty nào có thể tạo ra một mô hình ngôn ngữ lớn như vậy trong vài tháng". Học sâu và xử lý ngôn ngữ tự nhiên đòi hỏi nhiều năm kiên trì và tích lũy, và không thể đạt được nhanh chóng. "

Trước chi phí cao như vậy khi sử dụng một mô hình lớn và sử dụng ngưỡng, không thể chi trả được cho các doanh nghiệp thông thường, và chính vì điều này mà cho đến nay, không có bến đỗ hoàn hảo thực sự của các sản phẩm mô hình lớn trong ngành trên thị trường. Về vấn đề này, Huangfu Ziqiao nói rằng chi phí sử dụng các mô hình lớn là trở ngại lớn nhất đối với nhiều doanh nghiệp để áp dụng các mô hình lớn để trao quyền cho doanh nghiệp của họ và định vị của nền tảng Shenzhou Wenxue là cho phép các doanh nghiệp sử dụng các sản phẩm mô hình lớn với chi phí lựa chọn thấp hơn thông qua nguồn mở. "Có hai phần chính, một là nền tảng và phần còn lại là ứng dụng kịch bản vượt trội. Huangfu Ziqiao nói với Titanium Media, "Một mặt, hai phần này hy vọng sẽ tập hợp nhiều đối tác sinh thái hơn để cùng trao quyền cho người dùng, mặt khác, họ hy vọng rằng các doanh nghiệp có thể sử dụng các sản phẩm mô hình quy mô lớn nhanh hơn và thuận tiện hơn." "

Đó là sự đồng thuận trong ngành để giảm chi phí và ngưỡng của các mô hình lớn, cho dù đó là GPU "khó tìm", hay hóa đơn tiền điện cao, là ngưỡng để doanh nghiệp áp dụng các mô hình lớn ở giai đoạn này, và như Shenzhou Wenxue, Baidu Qianfan, Kunlun Wanwei, v.v., "phong cách khác nhau", nhưng cùng một mục tiêu - sự xuất hiện của các sản phẩm cấp nền tảng "giúp các mô hình lớn hạ cánh", cũng như số lượng đối tác ngày càng tăng trong hệ sinh thái mô hình lớn, ngưỡng và chi phí ứng dụng doanh nghiệp mô hình lớn sẽ giảm hơn nữa. Chúng ta cũng sẽ ngày càng tiến gần hơn đến tính toàn diện của mô hình ngành.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)