Cựu CEO Google Eric Schmidt: Trí tuệ nhân tạo sẽ thay đổi cách nghiên cứu khoa học như thế nào

Được viết bởi: Eric Schmidt

Nguồn: MIT Technology Review

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Lại là một mùa hè với thời tiết khắc nghiệt, với những đợt nắng nóng chưa từng có, cháy rừng và lũ lụt tấn công các quốc gia trên thế giới. Để đáp ứng thách thức dự đoán chính xác thời tiết khắc nghiệt như vậy, gã khổng lồ bán dẫn Nvidia đang xây dựng "cặp song sinh kỹ thuật số" được hỗ trợ bởi trí tuệ nhân tạo trên toàn hành tinh.

Bộ đôi kỹ thuật số, được gọi là Earth-2, sẽ sử dụng các dự đoán của FourCastNet. FourCastNet là một mô hình trí tuệ nhân tạo sử dụng hàng chục terabyte dữ liệu hệ thống Trái đất để dự đoán thời tiết trong hai tuần tới nhanh hơn và chính xác hơn các phương pháp dự báo hiện tại.

Một hệ thống dự báo thời tiết điển hình có khả năng tạo ra khoảng 50 dự báo cho tuần tới. Và FourCastNet có thể dự đoán hàng nghìn khả năng, nắm bắt chính xác các rủi ro thảm họa hiếm gặp nhưng chết người, giúp các nhóm dân cư dễ bị tổn thương có thời gian quý báu để chuẩn bị và sơ tán.

Cuộc cách mạng được chờ đợi từ lâu trong mô hình hóa khí hậu mới chỉ là bước khởi đầu. Với sự ra đời của trí tuệ nhân tạo, khoa học sắp trở nên thú vị hơn -- và theo một số cách khó nhận ra hơn. Tác động của sự thay đổi này sẽ vượt xa phạm vi phòng thí nghiệm; chúng sẽ ảnh hưởng đến tất cả chúng ta.

Nếu chúng ta áp dụng chiến lược phù hợp để giải quyết các vấn đề cấp bách nhất của khoa học bằng quy định hợp lý và hỗ trợ phù hợp cho việc sử dụng AI một cách sáng tạo, AI có thể viết lại quy trình khoa học. Chúng ta có thể xây dựng một tương lai trong đó các công cụ do AI cung cấp không chỉ giải phóng chúng ta khỏi lao động trí óc và tốn thời gian, mà còn hướng dẫn chúng ta đến những phát minh và khám phá sáng tạo, khuyến khích những bước đột phá mà nếu không sẽ phải mất hàng thập kỷ mới đạt được.

Trong những tháng gần đây, trí tuệ nhân tạo gần như đồng nghĩa với các mô hình ngôn ngữ lớn, hay LLM, nhưng trong khoa học, có nhiều kiến trúc mô hình khác nhau có thể có tác động thậm chí còn lớn hơn. Phần lớn tiến bộ trong khoa học trong thập kỷ qua đã được thực hiện thông qua các mô hình "cổ điển" nhỏ tập trung vào các vấn đề cụ thể. Những mô hình này đã dẫn đến những cải tiến sâu sắc. Gần đây hơn, các mô hình học sâu quy mô lớn đã bắt đầu kết hợp kiến thức đa miền và trí tuệ nhân tạo AI đã mở rộng phạm vi của những gì có thể.

Ví dụ, các nhà khoa học tại Đại học McMaster và Viện Công nghệ Massachusetts đã sử dụng các mô hình AI để xác định kháng sinh nhằm chống lại mầm bệnh mà Tổ chức Y tế Thế giới cho biết là một trong những vi khuẩn kháng kháng sinh nguy hiểm nhất thế giới đối với bệnh nhân nằm viện. Ngoài ra, mô hình DeepMind của Google có thể điều khiển plasma trong các phản ứng tổng hợp hạt nhân, đưa chúng ta đến gần hơn với cuộc cách mạng năng lượng sạch. Và trong lĩnh vực chăm sóc sức khỏe, Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ đã phê duyệt 523 thiết bị sử dụng trí tuệ nhân tạo, 75% trong số đó được sử dụng trong X quang.

Tái hình dung khoa học

Về cơ bản, quy trình khoa học mà chúng ta đã học ở trường tiểu học sẽ vẫn như cũ: tiến hành nghiên cứu cơ bản, xác định giả thuyết, kiểm tra nó bằng thí nghiệm, phân tích dữ liệu thu thập được và đưa ra kết luận. Nhưng trí tuệ nhân tạo có tiềm năng cách mạng hóa hình thức của các thành phần này trong tương lai.

AI đã thay đổi cách một số nhà khoa học tiến hành đánh giá tài liệu. Các công cụ như PaperQA và Elicit tận dụng LLM để quét cơ sở dữ liệu bài viết và tạo ra các bản tóm tắt ngắn gọn và chính xác về tài liệu hiện có -- bao gồm cả các trích dẫn.

Sau khi xem xét tài liệu hoàn tất, các nhà khoa học đưa ra các giả thuyết để kiểm tra. Công việc cốt lõi của LLM là dự đoán từ tiếp theo trong một câu, cho đến các câu và đoạn văn hoàn chỉnh. Kỹ thuật này làm cho các LLM đặc biệt phù hợp để giải quyết quy mô vốn có trong hệ thống phân cấp khoa học và cho phép chúng dự đoán khám phá lớn tiếp theo trong vật lý hoặc sinh học.

AI cũng có thể mở rộng mạng tìm kiếm giả định và thu nhỏ mạng tìm kiếm nhanh hơn. Do đó, các công cụ AI có thể giúp hình thành các giả thuyết mạnh mẽ hơn, chẳng hạn như các mô hình đề xuất các ứng cử viên thuốc mới hứa hẹn hơn. Các mô phỏng hiện chạy với cường độ nhanh hơn so với cách đây vài năm, cho phép các nhà khoa học thử nhiều tùy chọn thiết kế hơn trong các mô phỏng trước khi tiến hành các thí nghiệm trong thế giới thực.

Ví dụ, các nhà khoa học tại Viện Công nghệ California đã sử dụng các mô hình mô phỏng chất lỏng trí tuệ nhân tạo để tự động thiết kế một ống thông tốt hơn có thể ngăn vi khuẩn chảy ngược và gây nhiễm trùng. Khả năng này về cơ bản sẽ thay đổi quá trình khám phá khoa học ngày càng tăng, cho phép các nhà nghiên cứu thiết kế các giải pháp tối ưu ngay từ đầu, không giống như những gì chúng ta đã thấy trong nhiều năm qua với những đổi mới dây tóc trong thiết kế bóng đèn, tiến triển thông qua một chuỗi dài các thiết kế được cải tiến dần dần.

Bước vào bước thử nghiệm, trí tuệ nhân tạo sẽ có thể tiến hành các thử nghiệm nhanh hơn, rẻ hơn và trên quy mô lớn hơn. Ví dụ, chúng ta có thể chế tạo những cỗ máy chạy bằng trí tuệ nhân tạo, với hàng trăm vi ống chạy ngày đêm, tạo ra các mẫu với tốc độ mà con người không thể sánh được. Thay vì giới hạn bản thân trong sáu thí nghiệm, các nhà khoa học có thể sử dụng các công cụ AI để thực hiện hàng nghìn thí nghiệm.

Các nhà khoa học lo lắng về quy trình tài trợ, xuất bản hoặc sở hữu tiếp theo sẽ không còn bị ràng buộc vào thí nghiệm an toàn với cơ hội thành công cao nhất; họ sẽ được tự do theo đuổi các giả thuyết táo bạo hơn, liên ngành hơn. Ví dụ: khi đánh giá các phân tử mới, các nhà nghiên cứu có xu hướng chọn những ứng cử viên có cấu trúc tương tự như những gì chúng ta đã biết, nhưng các mô hình AI không nhất thiết phải có những thành kiến và hạn chế giống nhau.

Cuối cùng, phần lớn khoa học sẽ được tiến hành trong "phòng thí nghiệm tự trị" - nền tảng robot tự động kết hợp với trí tuệ nhân tạo. Tại đây, chúng ta có thể mang khả năng của trí tuệ nhân tạo từ lĩnh vực kỹ thuật số vào thế giới vật chất. Các phòng thí nghiệm tự động như vậy đã xuất hiện tại các công ty như Phòng thí nghiệm đám mây Emerald và Nhân tạo, và thậm chí cả Phòng thí nghiệm quốc gia Argonne.

Cuối cùng, trong giai đoạn phân tích và tóm tắt, phòng thí nghiệm tự động sẽ vượt ra ngoài phạm vi tự động hóa và sử dụng LLM để diễn giải và đề xuất chạy thử nghiệm tiếp theo dựa trên kết quả thử nghiệm được tạo ra. Sau đó, với tư cách là một đối tác trong quá trình nghiên cứu, trợ lý phòng thí nghiệm AI có thể đặt hàng nguồn cung cấp để thay thế những thứ đã được sử dụng trong các thử nghiệm trước đó, đồng thời thiết lập và chạy thử nghiệm được đề xuất tiếp theo trong đêm. Kết quả đã sẵn sàng trong khi những người thử nghiệm vẫn đang ngủ ở nhà.

Khả năng và Hạn chế

Các nhà nghiên cứu trẻ có thể rùng mình lo lắng trên ghế trước triển vọng. May mắn thay, những công việc mới xuất hiện từ cuộc cách mạng này có thể sáng tạo hơn và ít động não hơn hầu hết các công việc trong phòng thí nghiệm hiện nay.

Các công cụ AI có thể hạ thấp rào cản gia nhập đối với các nhà khoa học mới và mở ra cơ hội cho những người theo truyền thống bị loại khỏi lĩnh vực này. Với các LLM có thể hỗ trợ xây dựng mã, sinh viên STEM sẽ không còn cần phải thành thạo các ngôn ngữ mã hóa phức tạp, mở ra cánh cửa tháp ngà cho những tài năng mới, phi truyền thống và giúp các nhà khoa học dễ dàng tiếp xúc với các lĩnh vực bên ngoài lĩnh vực của họ. Chẳng bao lâu nữa, các LLM được đào tạo đặc biệt có thể vượt ra ngoài việc cung cấp các bản thảo đầu tiên của tác phẩm bằng văn bản, chẳng hạn như các đề xuất tài trợ, và có thể được phát triển để cung cấp các bài đánh giá "ngang hàng" về các bài báo mới cùng với những người đánh giá con người.

Các công cụ AI có tiềm năng đáng kinh ngạc, nhưng chúng ta phải nhận ra rằng sự tiếp xúc của con người vẫn quan trọng ở đâu và đừng quá cao. Ví dụ, không dễ để hợp nhất thành công trí tuệ nhân tạo và người máy thông qua các phòng thí nghiệm tự động. Phần lớn kiến thức ngầm mà các nhà khoa học học được trong phòng thí nghiệm rất khó chuyển giao cho người máy do AI cung cấp. Tương tự như vậy, chúng ta nên nhận thức được những hạn chế của LLM hiện tại, đặc biệt là ảo giác, trước khi cung cấp cho họ rất nhiều giấy tờ, nghiên cứu và phân tích.

Các công ty như OpenAI và DeepMind vẫn đang dẫn đầu với những đột phá, mô hình và tài liệu nghiên cứu mới, nhưng sự thống trị của ngành hiện tại sẽ không kéo dài mãi mãi. Cho đến nay, DeepMind đã xuất sắc trong việc tập trung vào các vấn đề được xác định rõ ràng với các mục tiêu và số liệu rõ ràng. Thành công nổi tiếng nhất của nó là tại cuộc thi Đánh giá quan trọng về dự đoán cấu trúc hai năm một lần, trong đó nhóm nghiên cứu đã dự đoán hình dạng chính xác của protein dựa trên trình tự axit amin của nó.

Từ năm 2006 đến 2016, điểm trung bình cho hạng mục khó nhất là khoảng 30 đến 40 trên thang điểm CASP từ 1 đến 100. Đột nhiên, vào năm 2018, mô hình AlphaFold của DeepMind đã ghi được số điểm khổng lồ là 58. Hai năm sau, một phiên bản cập nhật có tên AlphaFold2 đã ghi được 87 điểm, bỏ xa các đối thủ con người của nó.

Nhờ các tài nguyên nguồn mở, chúng tôi bắt đầu thấy một mô hình trong đó ngành công nghiệp đạt được các tiêu chuẩn nhất định và sau đó các học viện bước vào để tinh chỉnh mô hình. Sau khi DeepMind phát hành AlphaFold, Minkyung Baek và David Baker của Đại học Washington đã phát hành RoseTTAFold, sử dụng khung của DeepMind để dự đoán cấu trúc của phức hợp protein thay vì cấu trúc protein đơn lẻ mà AlphaFold có thể xử lý ban đầu. Hơn nữa, giới hàn lâm được bảo vệ tốt hơn khỏi áp lực cạnh tranh của thị trường, vì vậy họ có thể mạo hiểm vượt qua những vấn đề được xác định rõ ràng và những thành công có thể đo lường được đã thu hút DeepMind.

Ngoài việc đạt đến tầm cao mới, AI có thể giúp xác thực những gì chúng ta đã biết bằng cách giải quyết cuộc khủng hoảng về khả năng sao chép khoa học. Khoảng 70% các nhà khoa học báo cáo rằng họ không thể sao chép các thí nghiệm của nhà khoa học khác - một con số đáng buồn. Vì AI giảm chi phí và công sức chạy thử nghiệm nên trong một số trường hợp, việc sao chép kết quả hoặc đưa ra kết luận không thể lặp lại sẽ dễ dàng hơn, giúp cải thiện niềm tin vào khoa học.

Chìa khóa để nhân rộng và tin cậy là tính minh bạch. Trong một thế giới lý tưởng, mọi thứ trong khoa học sẽ mở, từ các bài báo không có tường phí cho đến dữ liệu, mã và mô hình nguồn mở. Thật không may, do những nguy hiểm mà các mô hình như vậy có thể gây ra, không phải lúc nào mã nguồn mở cũng thực tế đối với tất cả các mô hình. Trong nhiều trường hợp, rủi ro của sự minh bạch đầy đủ lớn hơn lợi ích của sự tin cậy và công bằng. Tuy nhiên, miễn là chúng ta có thể minh bạch về các mô hình -- đặc biệt là các mô hình AI cổ điển với số lượng sử dụng hạn chế hơn -- thì chúng ta nên mở mã nguồn cho chúng.

Tầm quan trọng của Quy định

Trong tất cả các lĩnh vực này, cần phải ghi nhớ những hạn chế và rủi ro cố hữu của AI. AI là một công cụ mạnh mẽ như vậy vì nó cho phép con người đạt được nhiều thành tựu hơn với ít thời gian hơn, ít giáo dục hơn và ít thiết bị hơn. Nhưng những khả năng này cũng khiến nó trở thành một vũ khí nguy hiểm có thể rơi vào tay kẻ xấu. Andrew White, giáo sư tại Đại học Rochester, đã ký hợp đồng với OpenAI để tham gia thử nghiệm "đội đỏ", có thể phơi bày những rủi ro của GPT-4 trước khi phát hành. Sử dụng các mô hình ngôn ngữ và cung cấp cho chúng các công cụ, White phát hiện ra rằng GPT-4 có thể gợi ý các hợp chất nguy hiểm và thậm chí đặt hàng chúng từ các nhà cung cấp hóa chất. Để kiểm tra quy trình, anh ấy đã gửi một hợp chất thử nghiệm (an toàn) đến nhà anh ấy vào tuần sau. OpenAI cho biết họ đã sử dụng những phát hiện của White để điều chỉnh GPT-4 trước khi nó được phát hành.

Ngay cả con người với ý định hoàn toàn tốt vẫn có thể khiến AI tạo ra kết quả xấu. Chúng ta nên bớt lo lắng về việc tạo ra Kẻ hủy diệt và, như nhà khoa học máy tính Stuart Russell nói, chúng ta nên lo lắng nhiều hơn về việc trở thành Vua Midas. Nhà vua muốn mọi thứ ông chạm vào đều biến thành vàng, và vì điều này, một cái ôm tình cờ đã giết chết chính con gái ông.

Chúng tôi không có bất kỳ cơ chế nào để khiến AI thay đổi mục tiêu của mình, ngay cả khi nó phản ứng với mục tiêu của mình theo cách mà chúng tôi không thể đoán trước. Một giả định thường được trích dẫn là AI được yêu cầu sản xuất càng nhiều kẹp giấy càng tốt. Quyết tâm hoàn thành mục tiêu của mình, mô hình này đã chiếm quyền điều khiển lưới điện và giết bất kỳ người nào cố gắng ngăn cản nó khi những chiếc kẹp giấy tiếp tục chất đống. Thế giới đã trở thành một mớ hỗn độn. AI vỗ mông và bỏ đi, nó đã hoàn thành nhiệm vụ của mình. (Để tỏ lòng tôn kính với thí nghiệm tưởng tượng nổi tiếng này, nhiều nhân viên của OpenAI mang theo những chiếc kẹp giấy có thương hiệu bên mình).

OpenAI đã quản lý để triển khai một bộ biện pháp bảo vệ ấn tượng, nhưng những biện pháp đó sẽ vẫn được áp dụng miễn là GPT-4 được lưu trữ trên các máy chủ của OpenAI. Có thể sẽ sớm có ngày ai đó quản lý để sao chép mô hình và đặt nó trên máy chủ của riêng họ. Các mô hình tiên tiến như thế này cần được bảo vệ để ngăn kẻ trộm phá bỏ hàng rào bảo mật AI do các nhà phát triển ban đầu cẩn thận thêm vào.

Để giải quyết việc sử dụng AI xấu một cách có chủ ý và không cố ý, chúng ta cần có quy định hợp lý, được thông báo đầy đủ về những gã khổng lồ công nghệ và các mô hình nguồn mở không ngăn cản chúng ta sử dụng AI theo những cách có lợi cho khoa học. Trong khi các công ty công nghệ đang đạt được những bước tiến trong việc đảm bảo an toàn cho AI, các cơ quan quản lý của chính phủ hiện chưa sẵn sàng ban hành các luật thích hợp và cần phải làm nhiều hơn nữa để theo kịp những phát triển mới nhất.

Ngoài quy định, các chính phủ - cùng với hoạt động từ thiện - có thể hỗ trợ các dự án khoa học mang lại lợi ích xã hội cao nhưng lại ít lợi nhuận tài chính hoặc khuyến khích học tập. Một số lĩnh vực đặc biệt cấp bách, bao gồm biến đổi khí hậu, an toàn sinh học và chuẩn bị cho đại dịch. Chính trong những lĩnh vực này, chúng tôi cần nhất tốc độ và quy mô được cung cấp bởi mô phỏng AI và phòng thí nghiệm tự động.

Trong phạm vi các cân nhắc về bảo mật cho phép, các chính phủ cũng có thể giúp phát triển các bộ dữ liệu lớn, chất lượng cao, chẳng hạn như bộ dữ liệu mà AlphaFold dựa vào. Bộ dữ liệu mở là hàng hóa công cộng: chúng mang lại lợi ích cho nhiều nhà nghiên cứu, nhưng các nhà nghiên cứu có rất ít động cơ để tự tạo ra chúng. Chính phủ và các tổ chức từ thiện có thể hợp tác với các trường đại học và công ty để xác định những thách thức lớn trong khoa học sẽ được hưởng lợi từ việc sử dụng cơ sở dữ liệu mạnh mẽ.

Ví dụ, hóa học có một ngôn ngữ thống nhất lĩnh vực này, dường như giúp các mô hình AI phân tích nó một cách dễ dàng. Nhưng không ai có thể tổng hợp chính xác dữ liệu thuộc tính phân tử được lưu trữ trong hàng chục cơ sở dữ liệu, từ chối cho chúng tôi hiểu biết sâu sắc về lĩnh vực mà các mô hình AI có thể đạt được nếu chúng tôi chỉ có một nguồn. Đồng thời, sinh học thiếu dữ liệu đã biết và có thể tính toán được để làm cơ sở vật lý hoặc hóa học, và các lĩnh vực phụ như protein bị rối loạn nội tại vẫn còn là bí ẩn đối với chúng ta. Do đó, sẽ cần nhiều nỗ lực phối hợp hơn để hiểu -- và thậm chí ghi lại -- dữ liệu để xây dựng một cơ sở dữ liệu toàn diện.

Con đường áp dụng rộng rãi AI trong khoa học còn dài và chúng ta phải làm rất nhiều việc, từ xây dựng cơ sở dữ liệu phù hợp đến thực thi các quy định phù hợp, giảm sự thiên vị trong các thuật toán AI, đến đảm bảo quyền truy cập bình đẳng vào tài nguyên máy tính xuyên biên giới.

Tuy nhiên, đây là một thời điểm rất lạc quan. Những thay đổi mô hình khoa học trước đây, chẳng hạn như quy trình khoa học hoặc sự xuất hiện của dữ liệu lớn, đều hướng nội và có thể làm cho khoa học trở nên chính xác và có tổ chức hơn. Đồng thời, AI có khả năng mở rộng, cho phép chúng ta kết hợp thông tin theo những cách mới lạ và thúc đẩy sự sáng tạo và tiến bộ khoa học lên một tầm cao mới.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)