Tín dụng hình ảnh: Được tạo bởi các công cụ Unbounded AI
AI sáng tạo đang tạo ra rất nhiều động lực và nó tiếp tục cho thấy ngày càng nhiều tiềm năng. Ví dụ như để AI tự động thiết kế chip, hay để AI đi khám bác sĩ.
Để giành lấy vị trí dẫn đầu, các công ty đang gấp rút không chỉ nỗ lực hết mình để giải phóng sức mạnh kỹ thuật của mình mà còn làm cho các mô hình AI ngày càng lớn hơn, để đạt được hiệu quả của những viên gạch bay mạnh mẽ và nhận ra sự xuất hiện của trí thông minh.
"Báo cáo nghiên cứu bản đồ mô hình lớn trí tuệ nhân tạo Trung Quốc" của Trung tâm nghiên cứu phát triển trí tuệ nhân tạo thế hệ mới của Bộ Khoa học và Công nghệ cho thấy, cho đến nay, Trung Quốc đã phát hành 79 mô hình lớn với quy mô tham số hơn 1 tỷ và cuộc chiến của các mô hình lớn đã dần bước vào nửa thứ 2. Nhiều người bắt đầu chú ý đến sự kết hợp giữa các mô hình lớn và các ngành thực tế, và các doanh nghiệp cũng lần lượt đưa ra các kịch bản ứng dụng của sản phẩm của họ.
Nhưng công bằng mà nói, các ứng dụng ban đầu sử dụng công nghệ AI truyền thống có thực sự cần sử dụng các mô hình lớn không? Tại Hội nghị các nhà phát triển Huawei 2023 (HDC.Cloud 2023), Huawei Cloud đã giới thiệu tiến bộ mới nhất của mình trong "AI cho các ngành" và mô hình Pangu, đồng thời đề xuất để AI định hình lại hàng nghìn ngành.
Mô hình công nghiệp quy mô lớn trở thành xu hướng mới
Không doanh nghiệp nào muốn bị tụt hậu trước sự bùng nổ của người mẫu quy mô lớn Nếu em hát, tôi sẽ lên sàn diễn, vài tháng gần đây, cứ vài ngày lại có tin về một mô hình quy mô lớn. Dưới sự xoay chuyển của thị trường, các doanh nghiệp đã nắm bắt cơ hội và tung ra các mô hình quy mô lớn đa năng, dần dần chuyển sang các mô hình công nghiệp quy mô lớn để thể hiện tính khả thi của các sản phẩm của chính họ, bao gồm cả trình diễn máy thực và trình diễn chương trình.
Sở dĩ mô hình lớn được đông đảo công chúng biết đến là bởi vì những sản phẩm C như ChatGPT khiến người ta thực sự đánh giá cao giá trị của công nghệ. Trên thực tế, mấu chốt của một mô hình lớn không phải là nó lớn đến mức nào, hay khả năng phổ cập của nó mạnh đến đâu, mà là liệu nó có thể giải quyết các vấn đề của các ứng dụng hiện có và được mọi người chấp nhận hay không.
Trên toàn thế giới, do những thách thức như chi phí năng lượng tính toán cao, rò rỉ thông tin và giám sát chính sách, quá trình thương mại hóa các mô hình quy mô lớn sang C diễn ra chậm hơn. các yêu cầu của các kịch bản ngành cụ thể. . Có thể nói, nó đã trở thành một sự đồng thuận chung để xây dựng một mô hình công nghiệp quy mô lớn.
AI mô hình nhỏ truyền thống thường chỉ có thể thực hiện các nhiệm vụ cụ thể hoặc các vấn đề cụ thể. Đối với ngành công nghiệp B, các mô hình lớn không chỉ có thể kết nối thông tin hệ thống truyền thống với nhau mà còn thực hiện việc lập kế hoạch và ra quyết định phức tạp hơn.
Nhưng để làm ra một mô hình quy mô lớn của ngành không phải là điều dễ dàng, nhiều công ty muốn ứng dụng AI cuối cùng cũng phải từ bỏ.
Trước hết, các kịch bản kinh doanh của doanh nghiệp rất phức tạp, hầu hết cần tùy biến, cần xử lý các tác vụ đa dạng như văn bản, hình ảnh, âm thanh, video, cơ chế… Ngược lại, hầu hết các doanh nghiệp đều thiếu dữ liệu mẫu. .
Thứ hai, mô hình lớn là một trò chơi đốt tiền, không chỉ cần sử dụng sức mạnh tính toán lớn bắt đầu từ một kilocalorie trong giai đoạn đào tạo mà còn đòi hỏi những tài năng phát triển ứng dụng AI chuyên nghiệp có tay nghề cao.
Cuối cùng, dữ liệu và kiến thức là tài sản cốt lõi của doanh nghiệp và cần đảm bảo quyền riêng tư, bảo mật và tuân thủ dữ liệu của doanh nghiệp.
Những việc chuyên nghiệp nên giao cho người chuyên nghiệp, và mô hình lớn cũng vậy, thay vì để các công ty làm những công việc cơ bản như sản xuất ốc vít, vòng bi, bánh răng.
Huawei Cloud, với tư cách là doanh nghiệp đã phát hành mô hình quy mô lớn cơ bản Pangu vào đầu năm 2021, hoàn toàn không phải là người mới trong lĩnh vực mô hình quy mô lớn. Hôm nay, HUAWEI CLOUD chính thức phát hành dịch vụ đám mây Pangu 3.0 và Ascend AI, trở thành mô hình AI độc lập toàn diện đầu tiên của Trung Quốc, tuân thủ định hướng AI cho các ngành và tích hợp sâu AI với mọi tầng lớp xã hội.
Như Giám đốc điều hành Huawei kiêm Giám đốc điều hành Huawei Cloud Zhang Pinganfa đã đề cập, mô hình Pangu không sáng tác thơ ca mà chỉ làm mọi việc. khí tượng và các ngành công nghiệp khác.
Sự thay đổi do thay cái nhỏ bằng cái lớn
Trên thực tế, mô hình lớn đã ra khỏi giai đoạn ý tưởng từ lâu, nhưng đang âm thầm thay đổi mọi thứ trong cuộc sống.
Khí tượng không thể tách rời khỏi con người, và nó cũng mang lại nhiều thiệt hại cho sự phát triển của chúng ta. Ví dụ, hàng năm có khoảng 80 cơn bão hình thành trên khắp thế giới, trong đó có khoảng 25 cơn ảnh hưởng đến Tây Bắc Thái Bình Dương và Biển Đông, trung bình có 7 cơn sẽ đổ bộ vào nước tôi. Vào năm 2022, thiệt hại kinh tế trực tiếp do thiên tai bão gây ra sẽ là 5,42 tỷ nhân dân tệ.
Dự báo khí tượng truyền thống hầu hết được tính toán bằng máy tính hiệu suất cao HPC, để dự đoán đường đi của bão trong 10 ngày tới, cần dành vài giờ trên một siêu máy tính với hơn 3.000 nút để mô phỏng. Với xu hướng ngày càng tăng của sức mạnh tính toán và sự phức tạp của các mô hình vật lý, nút cổ chai của dự báo số truyền thống đã trở nên nổi bật.
Mô hình khí tượng Pangu lớn chỉ cần một máy và một thẻ duy nhất và có thể hoàn thành dự báo thời tiết trong vòng 10 giây. Đây là mô hình AI đầu tiên trên thế giới có độ chính xác vượt xa các phương pháp dự báo truyền thống. Nó có thể hoàn thành đường đi của một cơn bão trong 10 ngày tới chỉ trong vài giây. Độ chính xác của dự đoán đường đi của bão là đầu tiên trên thế giới, cao hơn khoảng 20% so với mô hình AI Cơ quan Khí tượng Châu Âu.
Sự thay đổi tương tự cũng xảy ra trong lĩnh vực dược phẩm.
Thuốc kháng sinh đã cứu sống vô số người, nhưng kể từ khi daptomycin được phát hiện vào năm 1987, không có loại kháng sinh mới nào được phát hiện trong gần 40 năm. Kháng thuốc không chỉ đe dọa sức khỏe của mọi người mà còn có thể làm giảm GDP ít nhất 3,4 nghìn tỷ USD mỗi năm vào năm 2030 và đẩy 24 triệu người vào tình trạng nghèo đói cùng cực. Thế giới đang rất cần một loại kháng sinh mới để thay đổi tình trạng bệnh nhân không có sẵn thuốc khi đối mặt với các bệnh nhiễm trùng "siêu vi khuẩn kháng thuốc".
Nghiên cứu một loại thuốc mới không hề dễ dàng, trong một thời gian dài, việc phát triển các loại thuốc mới không thể thoát khỏi lời nguyền của "Luật 10 kép", tức là chi phí trung bình vượt quá 1 tỷ đô la Mỹ, chu kỳ nghiên cứu và phát triển dài hơn hơn 10 năm. Không chỉ vậy, đây là hình thức kinh doanh tốt nhất, trên thực tế, trung bình phải mất từ 10 đến 15 năm để một loại thuốc mới được chấp thuận đưa ra thị trường, tiêu tốn hơn 2,6 tỷ đô la Mỹ và tỷ lệ thành công trên lâm sàng thấp hơn 10%.
Mô hình lớn phân tử thuốc Huawei Cloud Pangu sử dụng kiến trúc mạng học sâu mới để tạo ra 100 triệu thư viện phân tử nhỏ giống như thuốc với cấu trúc mới 100%. So với các phương pháp truyền thống, độ chính xác của dự đoán khả năng sử dụng thuốc có thể tăng thêm 20%.
Giáo sư Liu Bing của Bệnh viện liên kết đầu tiên của Đại học Giao thông Tây An đã sử dụng dịch vụ thiết kế thuốc có sự hỗ trợ của AI dựa trên mô hình phân tử lớn của thuốc Pangu trên Huawei Cloud trong nghiên cứu và phát triển các loại thuốc mới, đồng thời phát triển một loại thuốc siêu kháng khuẩn. X (cinnamoylmycin), dự kiến sẽ trở thành mục tiêu mới đầu tiên và nhóm kháng sinh mới trong 40 năm, rút ngắn chu kỳ R&D của thuốc dẫn đầu từ vài năm xuống còn một tháng, giảm 70% chi phí R&D và phá vỡ " Double Ten Law" trong ngành dược phẩm.
Không chỉ bệnh nhân bị thay đổi.
Dưới hầm mỏ tối tăm là cuộc sống của những người công nhân. Những công nhân xuống giếng đã ở trong môi trường nguy hiểm và áp lực cao trong thời gian dài, không chỉ mắc kẹt trong bóng đen tử thần mà còn kèm theo những thương tật suốt đời. Nhưng ngược lại, 300 mét dưới lòng đất hiện tại vẫn cần một lượng lớn nhân sự làm việc tại chỗ và họ cần được chăm sóc kỹ thuật và nhân văn hơn.
AI là một trợ thủ đắc lực trong việc đảm bảo an toàn cho các hoạt động ngầm và có thể bổ sung một trợ thủ đắc lực cho các quy trình thủ công không chắc chắn. Tuy nhiên, việc AI thâm nhập vào ngành khai thác than không đơn giản như tưởng tượng. Môi trường hoạt động hạ cấp rất khắc nghiệt và đòi hỏi độ chính xác cao trong nhận dạng hình ảnh và video. Hơn nữa, sự khác biệt giữa các mỏ là lớn và các hoạt động tại chỗ rất phức tạp, vì vậy mô hình không thể dễ dàng sử dụng lại. Đồng thời, ngành khai thác than thiếu nhân tài trí tuệ nhân tạo chất lượng cao.
Mô hình lớn mỏ Pangu chỉ cần nhập một lượng lớn dữ liệu hiện trường mỏ chưa được gắn nhãn để đào tạo trước, sau đó nó có thể thực hiện việc học độc lập không giám sát. các quy trình kinh doanh khác của mỏ than.Hơn 1.000 kịch bản được chia nhỏ có thể thực hiện kiểm tra toàn thời gian, giúp nhân viên phát hiện vấn đề kịp thời, tránh tai nạn an toàn do bỏ sót kiểm tra, rút ngắn thời gian ngừng hoạt động và nâng cao hiệu quả công việc của nhân viên kiểm tra ngầm. Hiện nay đã được sử dụng tại 8 mỏ trên cả nước.
Vô số thành phố lớn, vừa và nhỏ được kết nối với nhau bằng đường sắt, cho đến nay, đường sắt nước tôi có tổng chiều dài 155.000 km và hơn 1 triệu toa tàu chở hàng. Với sự cải thiện mức độ an toàn đường sắt của đất nước tôi, nhiều sự cố hiếm khi xảy ra và hầu hết mọi người chưa bao giờ nhìn thấy chúng, nhưng một khi sự cố xảy ra, đó thường là một sự cố lớn. Đơn cử như tấm lõi tăng đơ ra mắt, cả nước chỉ phát hiện 1 mẫu bị lỗi.
Đằng sau sự an toàn là công sức của vô số người. Bị hạn chế bởi sự phát triển công nghệ, TFDS (Hệ thống phát hiện hình ảnh động lỗi hoạt động của xe tải) hiện đang được sử dụng rộng rãi vẫn sử dụng các phương pháp thủ công để xác định lỗi. Lấy xưởng kiểm tra 5T của một nhà ga nào đó làm ví dụ, trung bình mỗi ngày có gần 800 đoàn tàu và hơn 40.000 phương tiện được kiểm tra, hệ thống TFDS chụp hơn 2,8 triệu bức ảnh. các lỗi trong tàu.
Thông qua mô hình lớn Pangu, trước đây cần phải xác định thủ công 4.000 bức ảnh, nhưng hiện tại chỉ cần kiểm tra lại hơn 170 bức ảnh và cường độ lao động của công nhân đã giảm 95,75%. Trong ứng dụng thực tế, nó có thể xác định chính xác hơn 430 loại lỗi khác nhau của 67 loại xe tải, xác định 100% các lỗi bất thường chính và tỷ lệ sàng lọc hình ảnh không bị lỗi cao tới 95%, vượt quá mong đợi của khách hàng.
Những ví dụ như vậy là quá nhiều để liệt kê, trên thực tế, mỗi khi tôi sử dụng One Netcom để kinh doanh và sử dụng các sản phẩm thông minh, đó có thể là tín dụng của mô hình lớn, chúng tôi đã trực tiếp hoặc gián tiếp được hưởng cổ tức do nâng cấp công nghệ mang lại. .
Mô hình Bàn Cổ khác nhau như thế nào?
Lĩnh vực mô hình quy mô lớn ngày nay vẫn rất hot, các tay chơi trong nước đã dàn dựng một "trận chiến trăm mô hình".
Trước hết, HUAWEI CLOUD có hàng trăm dự án trong lĩnh vực AI và tuân thủ AI cho các ngành. Kết hợp kinh nghiệm tích lũy trong ngành hơn 30 năm và sự phát triển không ngừng của hơn 10 tập đoàn ngành, Huawei Cloud đã tích lũy được bí quyết phong phú từ khách hàng và đối tác trong ngành Tích hợp với mô hình lớn để mô hình lớn có kiến thức và kinh nghiệm về ngành.
Thứ hai, ngoài việc học được nhiều kiến thức chung, mô hình Pangu còn học được dữ liệu công khai từ hơn 10 ngành, bao gồm tài chính, các vấn đề chính phủ, khí tượng, chăm sóc y tế, sức khỏe, Internet, giáo dục, ô tô, bán lẻ, v.v.
Quan trọng hơn, mô hình lớn Pangu đã đạt được sự đổi mới độc lập từ con chip cơ bản cho đến toàn bộ nền tảng quy trình. Bạn biết đấy, trong thời kỳ bùng nổ AI, GPU đã trở thành một mặt hàng nóng, nhưng dưới nhiều ảnh hưởng của xích mích địa chính trị và tình trạng thiếu nguồn cung, việc triển khai thẻ máy tính hiệu suất cao sẽ chỉ khó khăn. ngành công nghiệp.
Điểm lại lịch sử của các mô hình quy mô lớn Pangea là một quá trình liên tục đáp ứng nhu cầu của ngành. Vào tháng 3 năm 2020, Tian Qi gia nhập Huawei Cloud và bắt đầu xây dựng một nhóm; vào tháng 4 năm 2021, mô hình lớn Pangu chính thức được phát hành, bao gồm mô hình lớn NLP và mô hình lớn CV; vào tháng 9 năm 2021, Huawei Cloud đã phát hành mô hình lớn điện toán khoa học và Một mô hình lớn của các phân tử thuốc; vào tháng 6 năm 2022, Huawei Cloud đã phát hành một mô hình lớn của Pangu Mine; vào tháng 11 năm 2022, Huawei Cloud đã phát hành một mô hình thời tiết lớn.
Ngược dòng thời gian, HUAWEI CLOUD đã chính thức phát hành Pangu Large Model 3.0, đồng thời phát hành các mô hình lớn về các vấn đề chính phủ, tài chính và sản xuất. Mô hình cỡ lớn đã từng cực kỳ phổ biến trước đây, tại sao Huawei Cloud lại chọn thời điểm này để công bố tiến độ của mô hình cỡ lớn Pangu?
Trên thực tế, khi đối mặt với các công nghệ và xu hướng mới trong ngành, HUAWEI CLOUD ưu tiên đáp ứng nhu cầu của ngành và chỉ khi công nghệ đủ trưởng thành, hãng mới giới thiệu các công nghệ mới ra thị trường. Từ quan điểm của Mô hình lớn Pangu 3.0, lần này Huawei Cloud đã làm rõ định vị công nghiệp cho các sản phẩm của mình, tích hợp các mô hình lớn trước đó, tổ chức lại cấu trúc và mở rộng mạng thông qua mô hình lớn mới, để bao trùm mọi ngành.
Hu Houkun, chủ tịch luân phiên của Huawei, cũng nhấn mạnh tại Hội nghị Trí tuệ Nhân tạo Thế giới năm 2023 rằng chìa khóa để phát triển trí tuệ nhân tạo là "đi sâu và vững chắc" để nâng cấp công nghiệp. Ở giai đoạn hiện tại, Huawei có hai điểm trọng tâm trong việc phát triển trí tuệ nhân tạo: Thứ nhất, xây dựng một cơ sở điện toán mạnh mẽ để hỗ trợ sự phát triển của ngành trí tuệ nhân tạo của Trung Quốc. Thứ hai, từ các mô hình quy mô lớn đa năng đến các mô hình quy mô lớn toàn ngành, hãy để trí tuệ nhân tạo phục vụ tốt hàng nghìn ngành công nghiệp và nghiên cứu khoa học.
Mô hình lớn Pangu 3.0 áp dụng thiết kế phân lớp, bao gồm cấu trúc ba tầng 5+N+X: 5 mô hình lớn cơ bản cấp L0 cung cấp nhiều kỹ năng chung khác nhau, mô hình lớn ngành cấp N L1 giúp các công ty tạo mô hình quy mô lớn của riêng họ và các mô hình Kịch bản lớp L2 khổng lồ tập trung vào các tình huống ứng dụng cụ thể hoặc các doanh nghiệp cụ thể và cung cấp cho khách hàng các dịch vụ mô hình vượt trội.
Sức mạnh tính toán là thức ăn cho các mô hình lớn. Trong quá trình đào tạo, mỗi loạt mô hình lớn của Pangu hầu như cần hàng trăm, thậm chí hàng nghìn chip Ascend để đào tạo. Dịch vụ đám mây Ascend AI là cơ sở của các mô hình lớn Pangu, cung cấp cho nó một nền tảng vững chắc Căn cứ.
Dịch vụ đám mây Ascend AI cụm đơn của HUAWEI CLOUD với sức mạnh tính toán 2000P Flops đã được ra mắt đồng thời ở Ulanqab và Gui'an. Trung tâm dữ liệu HUAWEI CLOUD sử dụng nền tảng làm mát bằng chất lỏng Tiancheng có thể đảm bảo tốc độ ổn định dài hạn trong 30 ngày là 90% cho đào tạo kilocalorie Thời gian phục hồi điểm không quá 10 phút.
Zhang Ping'an cho biết: "Để giúp khách hàng, đối tác và nhà phát triển toàn cầu đào tạo và sử dụng các mô hình lớn, chúng tôi cam kết tạo ra một cực khác của AI trên thế giới cho khách hàng toàn cầu và cung cấp các lựa chọn mới cho tất cả các nhà phát triển AI".
Đối với nhiều doanh nghiệp, việc tuân thủ bảo mật dữ liệu là ưu tiên hàng đầu. Ngoài mô hình triển khai đám mây công cộng, mô hình lớn Pangea có thể cung cấp thêm vùng đám mây mô hình lớn và thiết lập nhóm tài nguyên dành riêng cho đám mây để đào tạo mô hình lớn và lập luận để đảm bảo dữ liệu tuân thủ bảo mật. Đối với các yêu cầu bản địa hóa dữ liệu nghiêm ngặt hơn, triển khai đám mây lai cũng được cung cấp để giúp khách hàng đào tạo các mô hình lớn trên HCS riêng của họ.
Đối với một sản phẩm, dễ sử dụng là chìa khóa. HUAWEI CLOUD cung cấp bộ công cụ mô hình quy mô lớn đáng tin cậy và dễ sử dụng, Kaitian aPaaS tập hợp một số lượng lớn API bối cảnh đa ngành và một cộng đồng dành riêng cho các mô hình quy mô lớn bao gồm các khóa học và kỹ thuật chất lượng cao và phong phú chứng chỉ để giúp các nhà phát triển phát triển nhanh chóng.
Đúng là bản thân công nghệ này đã mang tính cách mạng, nhưng để mô hình lớn của Pangu thâm nhập hàng nghìn ngành công nghiệp, nó vẫn cần có thời gian để bén rễ trong ngành.
Như Andrew Ng, một trong bốn vị vua của AI, đã nói: "Thật khó để tưởng tượng một ngành công nghiệp lớn sẽ không bị thay đổi bởi trí tuệ nhân tạo. Các ngành công nghiệp lớn bao gồm chăm sóc sức khỏe, giáo dục, vận tải, bán lẻ, truyền thông và nông nghiệp. Trí tuệ nhân tạo sẽ ở trong những ngành này Xu hướng này rất rõ ràng.” Trong tương lai, mọi ngành có thể bị thay đổi bởi các mô hình lớn của nhiều ngành khác nhau.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Kỷ nguyên AI truyền thống cuối cùng sẽ qua?
Tác giả: Vũ Phương
Nguồn: Tiger Sniff
AI sáng tạo đang tạo ra rất nhiều động lực và nó tiếp tục cho thấy ngày càng nhiều tiềm năng. Ví dụ như để AI tự động thiết kế chip, hay để AI đi khám bác sĩ.
Để giành lấy vị trí dẫn đầu, các công ty đang gấp rút không chỉ nỗ lực hết mình để giải phóng sức mạnh kỹ thuật của mình mà còn làm cho các mô hình AI ngày càng lớn hơn, để đạt được hiệu quả của những viên gạch bay mạnh mẽ và nhận ra sự xuất hiện của trí thông minh.
"Báo cáo nghiên cứu bản đồ mô hình lớn trí tuệ nhân tạo Trung Quốc" của Trung tâm nghiên cứu phát triển trí tuệ nhân tạo thế hệ mới của Bộ Khoa học và Công nghệ cho thấy, cho đến nay, Trung Quốc đã phát hành 79 mô hình lớn với quy mô tham số hơn 1 tỷ và cuộc chiến của các mô hình lớn đã dần bước vào nửa thứ 2. Nhiều người bắt đầu chú ý đến sự kết hợp giữa các mô hình lớn và các ngành thực tế, và các doanh nghiệp cũng lần lượt đưa ra các kịch bản ứng dụng của sản phẩm của họ.
Nhưng công bằng mà nói, các ứng dụng ban đầu sử dụng công nghệ AI truyền thống có thực sự cần sử dụng các mô hình lớn không? Tại Hội nghị các nhà phát triển Huawei 2023 (HDC.Cloud 2023), Huawei Cloud đã giới thiệu tiến bộ mới nhất của mình trong "AI cho các ngành" và mô hình Pangu, đồng thời đề xuất để AI định hình lại hàng nghìn ngành.
Mô hình công nghiệp quy mô lớn trở thành xu hướng mới
Không doanh nghiệp nào muốn bị tụt hậu trước sự bùng nổ của người mẫu quy mô lớn Nếu em hát, tôi sẽ lên sàn diễn, vài tháng gần đây, cứ vài ngày lại có tin về một mô hình quy mô lớn. Dưới sự xoay chuyển của thị trường, các doanh nghiệp đã nắm bắt cơ hội và tung ra các mô hình quy mô lớn đa năng, dần dần chuyển sang các mô hình công nghiệp quy mô lớn để thể hiện tính khả thi của các sản phẩm của chính họ, bao gồm cả trình diễn máy thực và trình diễn chương trình.
Sở dĩ mô hình lớn được đông đảo công chúng biết đến là bởi vì những sản phẩm C như ChatGPT khiến người ta thực sự đánh giá cao giá trị của công nghệ. Trên thực tế, mấu chốt của một mô hình lớn không phải là nó lớn đến mức nào, hay khả năng phổ cập của nó mạnh đến đâu, mà là liệu nó có thể giải quyết các vấn đề của các ứng dụng hiện có và được mọi người chấp nhận hay không.
Trên toàn thế giới, do những thách thức như chi phí năng lượng tính toán cao, rò rỉ thông tin và giám sát chính sách, quá trình thương mại hóa các mô hình quy mô lớn sang C diễn ra chậm hơn. các yêu cầu của các kịch bản ngành cụ thể. . Có thể nói, nó đã trở thành một sự đồng thuận chung để xây dựng một mô hình công nghiệp quy mô lớn.
AI mô hình nhỏ truyền thống thường chỉ có thể thực hiện các nhiệm vụ cụ thể hoặc các vấn đề cụ thể. Đối với ngành công nghiệp B, các mô hình lớn không chỉ có thể kết nối thông tin hệ thống truyền thống với nhau mà còn thực hiện việc lập kế hoạch và ra quyết định phức tạp hơn.
Nhưng để làm ra một mô hình quy mô lớn của ngành không phải là điều dễ dàng, nhiều công ty muốn ứng dụng AI cuối cùng cũng phải từ bỏ.
Trước hết, các kịch bản kinh doanh của doanh nghiệp rất phức tạp, hầu hết cần tùy biến, cần xử lý các tác vụ đa dạng như văn bản, hình ảnh, âm thanh, video, cơ chế… Ngược lại, hầu hết các doanh nghiệp đều thiếu dữ liệu mẫu. .
Thứ hai, mô hình lớn là một trò chơi đốt tiền, không chỉ cần sử dụng sức mạnh tính toán lớn bắt đầu từ một kilocalorie trong giai đoạn đào tạo mà còn đòi hỏi những tài năng phát triển ứng dụng AI chuyên nghiệp có tay nghề cao.
Cuối cùng, dữ liệu và kiến thức là tài sản cốt lõi của doanh nghiệp và cần đảm bảo quyền riêng tư, bảo mật và tuân thủ dữ liệu của doanh nghiệp.
Những việc chuyên nghiệp nên giao cho người chuyên nghiệp, và mô hình lớn cũng vậy, thay vì để các công ty làm những công việc cơ bản như sản xuất ốc vít, vòng bi, bánh răng.
Huawei Cloud, với tư cách là doanh nghiệp đã phát hành mô hình quy mô lớn cơ bản Pangu vào đầu năm 2021, hoàn toàn không phải là người mới trong lĩnh vực mô hình quy mô lớn. Hôm nay, HUAWEI CLOUD chính thức phát hành dịch vụ đám mây Pangu 3.0 và Ascend AI, trở thành mô hình AI độc lập toàn diện đầu tiên của Trung Quốc, tuân thủ định hướng AI cho các ngành và tích hợp sâu AI với mọi tầng lớp xã hội.
Như Giám đốc điều hành Huawei kiêm Giám đốc điều hành Huawei Cloud Zhang Pinganfa đã đề cập, mô hình Pangu không sáng tác thơ ca mà chỉ làm mọi việc. khí tượng và các ngành công nghiệp khác.
Sự thay đổi do thay cái nhỏ bằng cái lớn
Trên thực tế, mô hình lớn đã ra khỏi giai đoạn ý tưởng từ lâu, nhưng đang âm thầm thay đổi mọi thứ trong cuộc sống.
Khí tượng không thể tách rời khỏi con người, và nó cũng mang lại nhiều thiệt hại cho sự phát triển của chúng ta. Ví dụ, hàng năm có khoảng 80 cơn bão hình thành trên khắp thế giới, trong đó có khoảng 25 cơn ảnh hưởng đến Tây Bắc Thái Bình Dương và Biển Đông, trung bình có 7 cơn sẽ đổ bộ vào nước tôi. Vào năm 2022, thiệt hại kinh tế trực tiếp do thiên tai bão gây ra sẽ là 5,42 tỷ nhân dân tệ.
Dự báo khí tượng truyền thống hầu hết được tính toán bằng máy tính hiệu suất cao HPC, để dự đoán đường đi của bão trong 10 ngày tới, cần dành vài giờ trên một siêu máy tính với hơn 3.000 nút để mô phỏng. Với xu hướng ngày càng tăng của sức mạnh tính toán và sự phức tạp của các mô hình vật lý, nút cổ chai của dự báo số truyền thống đã trở nên nổi bật.
Mô hình khí tượng Pangu lớn chỉ cần một máy và một thẻ duy nhất và có thể hoàn thành dự báo thời tiết trong vòng 10 giây. Đây là mô hình AI đầu tiên trên thế giới có độ chính xác vượt xa các phương pháp dự báo truyền thống. Nó có thể hoàn thành đường đi của một cơn bão trong 10 ngày tới chỉ trong vài giây. Độ chính xác của dự đoán đường đi của bão là đầu tiên trên thế giới, cao hơn khoảng 20% so với mô hình AI Cơ quan Khí tượng Châu Âu.
Sự thay đổi tương tự cũng xảy ra trong lĩnh vực dược phẩm.
Thuốc kháng sinh đã cứu sống vô số người, nhưng kể từ khi daptomycin được phát hiện vào năm 1987, không có loại kháng sinh mới nào được phát hiện trong gần 40 năm. Kháng thuốc không chỉ đe dọa sức khỏe của mọi người mà còn có thể làm giảm GDP ít nhất 3,4 nghìn tỷ USD mỗi năm vào năm 2030 và đẩy 24 triệu người vào tình trạng nghèo đói cùng cực. Thế giới đang rất cần một loại kháng sinh mới để thay đổi tình trạng bệnh nhân không có sẵn thuốc khi đối mặt với các bệnh nhiễm trùng "siêu vi khuẩn kháng thuốc".
Nghiên cứu một loại thuốc mới không hề dễ dàng, trong một thời gian dài, việc phát triển các loại thuốc mới không thể thoát khỏi lời nguyền của "Luật 10 kép", tức là chi phí trung bình vượt quá 1 tỷ đô la Mỹ, chu kỳ nghiên cứu và phát triển dài hơn hơn 10 năm. Không chỉ vậy, đây là hình thức kinh doanh tốt nhất, trên thực tế, trung bình phải mất từ 10 đến 15 năm để một loại thuốc mới được chấp thuận đưa ra thị trường, tiêu tốn hơn 2,6 tỷ đô la Mỹ và tỷ lệ thành công trên lâm sàng thấp hơn 10%.
Mô hình lớn phân tử thuốc Huawei Cloud Pangu sử dụng kiến trúc mạng học sâu mới để tạo ra 100 triệu thư viện phân tử nhỏ giống như thuốc với cấu trúc mới 100%. So với các phương pháp truyền thống, độ chính xác của dự đoán khả năng sử dụng thuốc có thể tăng thêm 20%.
Giáo sư Liu Bing của Bệnh viện liên kết đầu tiên của Đại học Giao thông Tây An đã sử dụng dịch vụ thiết kế thuốc có sự hỗ trợ của AI dựa trên mô hình phân tử lớn của thuốc Pangu trên Huawei Cloud trong nghiên cứu và phát triển các loại thuốc mới, đồng thời phát triển một loại thuốc siêu kháng khuẩn. X (cinnamoylmycin), dự kiến sẽ trở thành mục tiêu mới đầu tiên và nhóm kháng sinh mới trong 40 năm, rút ngắn chu kỳ R&D của thuốc dẫn đầu từ vài năm xuống còn một tháng, giảm 70% chi phí R&D và phá vỡ " Double Ten Law" trong ngành dược phẩm.
Không chỉ bệnh nhân bị thay đổi.
Dưới hầm mỏ tối tăm là cuộc sống của những người công nhân. Những công nhân xuống giếng đã ở trong môi trường nguy hiểm và áp lực cao trong thời gian dài, không chỉ mắc kẹt trong bóng đen tử thần mà còn kèm theo những thương tật suốt đời. Nhưng ngược lại, 300 mét dưới lòng đất hiện tại vẫn cần một lượng lớn nhân sự làm việc tại chỗ và họ cần được chăm sóc kỹ thuật và nhân văn hơn.
AI là một trợ thủ đắc lực trong việc đảm bảo an toàn cho các hoạt động ngầm và có thể bổ sung một trợ thủ đắc lực cho các quy trình thủ công không chắc chắn. Tuy nhiên, việc AI thâm nhập vào ngành khai thác than không đơn giản như tưởng tượng. Môi trường hoạt động hạ cấp rất khắc nghiệt và đòi hỏi độ chính xác cao trong nhận dạng hình ảnh và video. Hơn nữa, sự khác biệt giữa các mỏ là lớn và các hoạt động tại chỗ rất phức tạp, vì vậy mô hình không thể dễ dàng sử dụng lại. Đồng thời, ngành khai thác than thiếu nhân tài trí tuệ nhân tạo chất lượng cao.
Mô hình lớn mỏ Pangu chỉ cần nhập một lượng lớn dữ liệu hiện trường mỏ chưa được gắn nhãn để đào tạo trước, sau đó nó có thể thực hiện việc học độc lập không giám sát. các quy trình kinh doanh khác của mỏ than.Hơn 1.000 kịch bản được chia nhỏ có thể thực hiện kiểm tra toàn thời gian, giúp nhân viên phát hiện vấn đề kịp thời, tránh tai nạn an toàn do bỏ sót kiểm tra, rút ngắn thời gian ngừng hoạt động và nâng cao hiệu quả công việc của nhân viên kiểm tra ngầm. Hiện nay đã được sử dụng tại 8 mỏ trên cả nước.
Vô số thành phố lớn, vừa và nhỏ được kết nối với nhau bằng đường sắt, cho đến nay, đường sắt nước tôi có tổng chiều dài 155.000 km và hơn 1 triệu toa tàu chở hàng. Với sự cải thiện mức độ an toàn đường sắt của đất nước tôi, nhiều sự cố hiếm khi xảy ra và hầu hết mọi người chưa bao giờ nhìn thấy chúng, nhưng một khi sự cố xảy ra, đó thường là một sự cố lớn. Đơn cử như tấm lõi tăng đơ ra mắt, cả nước chỉ phát hiện 1 mẫu bị lỗi.
Đằng sau sự an toàn là công sức của vô số người. Bị hạn chế bởi sự phát triển công nghệ, TFDS (Hệ thống phát hiện hình ảnh động lỗi hoạt động của xe tải) hiện đang được sử dụng rộng rãi vẫn sử dụng các phương pháp thủ công để xác định lỗi. Lấy xưởng kiểm tra 5T của một nhà ga nào đó làm ví dụ, trung bình mỗi ngày có gần 800 đoàn tàu và hơn 40.000 phương tiện được kiểm tra, hệ thống TFDS chụp hơn 2,8 triệu bức ảnh. các lỗi trong tàu.
Thông qua mô hình lớn Pangu, trước đây cần phải xác định thủ công 4.000 bức ảnh, nhưng hiện tại chỉ cần kiểm tra lại hơn 170 bức ảnh và cường độ lao động của công nhân đã giảm 95,75%. Trong ứng dụng thực tế, nó có thể xác định chính xác hơn 430 loại lỗi khác nhau của 67 loại xe tải, xác định 100% các lỗi bất thường chính và tỷ lệ sàng lọc hình ảnh không bị lỗi cao tới 95%, vượt quá mong đợi của khách hàng.
Những ví dụ như vậy là quá nhiều để liệt kê, trên thực tế, mỗi khi tôi sử dụng One Netcom để kinh doanh và sử dụng các sản phẩm thông minh, đó có thể là tín dụng của mô hình lớn, chúng tôi đã trực tiếp hoặc gián tiếp được hưởng cổ tức do nâng cấp công nghệ mang lại. .
Mô hình Bàn Cổ khác nhau như thế nào?
Lĩnh vực mô hình quy mô lớn ngày nay vẫn rất hot, các tay chơi trong nước đã dàn dựng một "trận chiến trăm mô hình".
Trước hết, HUAWEI CLOUD có hàng trăm dự án trong lĩnh vực AI và tuân thủ AI cho các ngành. Kết hợp kinh nghiệm tích lũy trong ngành hơn 30 năm và sự phát triển không ngừng của hơn 10 tập đoàn ngành, Huawei Cloud đã tích lũy được bí quyết phong phú từ khách hàng và đối tác trong ngành Tích hợp với mô hình lớn để mô hình lớn có kiến thức và kinh nghiệm về ngành.
Thứ hai, ngoài việc học được nhiều kiến thức chung, mô hình Pangu còn học được dữ liệu công khai từ hơn 10 ngành, bao gồm tài chính, các vấn đề chính phủ, khí tượng, chăm sóc y tế, sức khỏe, Internet, giáo dục, ô tô, bán lẻ, v.v.
Quan trọng hơn, mô hình lớn Pangu đã đạt được sự đổi mới độc lập từ con chip cơ bản cho đến toàn bộ nền tảng quy trình. Bạn biết đấy, trong thời kỳ bùng nổ AI, GPU đã trở thành một mặt hàng nóng, nhưng dưới nhiều ảnh hưởng của xích mích địa chính trị và tình trạng thiếu nguồn cung, việc triển khai thẻ máy tính hiệu suất cao sẽ chỉ khó khăn. ngành công nghiệp.
Điểm lại lịch sử của các mô hình quy mô lớn Pangea là một quá trình liên tục đáp ứng nhu cầu của ngành. Vào tháng 3 năm 2020, Tian Qi gia nhập Huawei Cloud và bắt đầu xây dựng một nhóm; vào tháng 4 năm 2021, mô hình lớn Pangu chính thức được phát hành, bao gồm mô hình lớn NLP và mô hình lớn CV; vào tháng 9 năm 2021, Huawei Cloud đã phát hành mô hình lớn điện toán khoa học và Một mô hình lớn của các phân tử thuốc; vào tháng 6 năm 2022, Huawei Cloud đã phát hành một mô hình lớn của Pangu Mine; vào tháng 11 năm 2022, Huawei Cloud đã phát hành một mô hình thời tiết lớn.
Ngược dòng thời gian, HUAWEI CLOUD đã chính thức phát hành Pangu Large Model 3.0, đồng thời phát hành các mô hình lớn về các vấn đề chính phủ, tài chính và sản xuất. Mô hình cỡ lớn đã từng cực kỳ phổ biến trước đây, tại sao Huawei Cloud lại chọn thời điểm này để công bố tiến độ của mô hình cỡ lớn Pangu?
Trên thực tế, khi đối mặt với các công nghệ và xu hướng mới trong ngành, HUAWEI CLOUD ưu tiên đáp ứng nhu cầu của ngành và chỉ khi công nghệ đủ trưởng thành, hãng mới giới thiệu các công nghệ mới ra thị trường. Từ quan điểm của Mô hình lớn Pangu 3.0, lần này Huawei Cloud đã làm rõ định vị công nghiệp cho các sản phẩm của mình, tích hợp các mô hình lớn trước đó, tổ chức lại cấu trúc và mở rộng mạng thông qua mô hình lớn mới, để bao trùm mọi ngành.
Hu Houkun, chủ tịch luân phiên của Huawei, cũng nhấn mạnh tại Hội nghị Trí tuệ Nhân tạo Thế giới năm 2023 rằng chìa khóa để phát triển trí tuệ nhân tạo là "đi sâu và vững chắc" để nâng cấp công nghiệp. Ở giai đoạn hiện tại, Huawei có hai điểm trọng tâm trong việc phát triển trí tuệ nhân tạo: Thứ nhất, xây dựng một cơ sở điện toán mạnh mẽ để hỗ trợ sự phát triển của ngành trí tuệ nhân tạo của Trung Quốc. Thứ hai, từ các mô hình quy mô lớn đa năng đến các mô hình quy mô lớn toàn ngành, hãy để trí tuệ nhân tạo phục vụ tốt hàng nghìn ngành công nghiệp và nghiên cứu khoa học.
Mô hình lớn Pangu 3.0 áp dụng thiết kế phân lớp, bao gồm cấu trúc ba tầng 5+N+X: 5 mô hình lớn cơ bản cấp L0 cung cấp nhiều kỹ năng chung khác nhau, mô hình lớn ngành cấp N L1 giúp các công ty tạo mô hình quy mô lớn của riêng họ và các mô hình Kịch bản lớp L2 khổng lồ tập trung vào các tình huống ứng dụng cụ thể hoặc các doanh nghiệp cụ thể và cung cấp cho khách hàng các dịch vụ mô hình vượt trội.
Dịch vụ đám mây Ascend AI cụm đơn của HUAWEI CLOUD với sức mạnh tính toán 2000P Flops đã được ra mắt đồng thời ở Ulanqab và Gui'an. Trung tâm dữ liệu HUAWEI CLOUD sử dụng nền tảng làm mát bằng chất lỏng Tiancheng có thể đảm bảo tốc độ ổn định dài hạn trong 30 ngày là 90% cho đào tạo kilocalorie Thời gian phục hồi điểm không quá 10 phút.
Zhang Ping'an cho biết: "Để giúp khách hàng, đối tác và nhà phát triển toàn cầu đào tạo và sử dụng các mô hình lớn, chúng tôi cam kết tạo ra một cực khác của AI trên thế giới cho khách hàng toàn cầu và cung cấp các lựa chọn mới cho tất cả các nhà phát triển AI".
Đối với nhiều doanh nghiệp, việc tuân thủ bảo mật dữ liệu là ưu tiên hàng đầu. Ngoài mô hình triển khai đám mây công cộng, mô hình lớn Pangea có thể cung cấp thêm vùng đám mây mô hình lớn và thiết lập nhóm tài nguyên dành riêng cho đám mây để đào tạo mô hình lớn và lập luận để đảm bảo dữ liệu tuân thủ bảo mật. Đối với các yêu cầu bản địa hóa dữ liệu nghiêm ngặt hơn, triển khai đám mây lai cũng được cung cấp để giúp khách hàng đào tạo các mô hình lớn trên HCS riêng của họ.
Đối với một sản phẩm, dễ sử dụng là chìa khóa. HUAWEI CLOUD cung cấp bộ công cụ mô hình quy mô lớn đáng tin cậy và dễ sử dụng, Kaitian aPaaS tập hợp một số lượng lớn API bối cảnh đa ngành và một cộng đồng dành riêng cho các mô hình quy mô lớn bao gồm các khóa học và kỹ thuật chất lượng cao và phong phú chứng chỉ để giúp các nhà phát triển phát triển nhanh chóng.
Đúng là bản thân công nghệ này đã mang tính cách mạng, nhưng để mô hình lớn của Pangu thâm nhập hàng nghìn ngành công nghiệp, nó vẫn cần có thời gian để bén rễ trong ngành.
Như Andrew Ng, một trong bốn vị vua của AI, đã nói: "Thật khó để tưởng tượng một ngành công nghiệp lớn sẽ không bị thay đổi bởi trí tuệ nhân tạo. Các ngành công nghiệp lớn bao gồm chăm sóc sức khỏe, giáo dục, vận tải, bán lẻ, truyền thông và nông nghiệp. Trí tuệ nhân tạo sẽ ở trong những ngành này Xu hướng này rất rõ ràng.” Trong tương lai, mọi ngành có thể bị thay đổi bởi các mô hình lớn của nhiều ngành khác nhau.