Công ty khởi nghiệp OpenAI đã liên tục cải tiến chatbot AI phổ biến của mình, ChatGPT, kể từ khi phát hành vào ngày 30 tháng 11 năm 2022, một năm trước, nhưng theo những người dùng đã ra mắt trải nghiệm, bản cập nhật mới nhất của ChatGPT hấp thụ tất cả các tính năng trước đó và dường như hợp nhất chúng thành một.
Nhiều người dùng đã chia sẻ một tin nhắn cập nhật được gửi đến tài khoản ChatGPT của họ trên phương tiện truyền thông xã hội, có nội dung như sau:
"GPT-4 của bạn đã được cập nhật:
Tải lên nhiều loại tài liệu: làm việc với PDF, tệp dữ liệu hoặc bất cứ thứ gì bạn muốn phân tích. Chỉ cần tải lên và bắt đầu đặt câu hỏi.
** Không cần chuyển sang sử dụng công cụ **: Duyệt, phân tích dữ liệu nâng cao và DALL-E hiện có thể truy cập tự động. (Lựa chọn thủ công vẫn có sẵn theo GPT-4 nếu bạn muốn.) )"
Và các tính năng này - phân tích và trả lời các câu hỏi về PDF và các tài liệu khác, duyệt web và phân tích dữ liệu và tích hợp với mô hình tạo hình ảnh của OpenAI, DALL-E 3, cho phép người dùng sử dụng lời nhắc văn bản để tạo hình ảnh mới - trước đây đã phải mở từng mục một cách độc lập trong menu thả xuống "GPT-4" trong phiên ChatGPT trong vài tháng qua. Nói cách khác: trước đây người dùng chỉ có thể sử dụng một trong những tính năng ChatGPT này tại một thời điểm.
Điều này có nghĩa là nếu bạn muốn phân tích tài liệu và sau đó tạo hình ảnh về nó, bạn sẽ phải hoàn thành tác vụ đầu tiên trong một phiên trò chuyện, sao chép thủ công văn bản được phân tích được trả về từ ChatGPT, sau đó khởi chạy cửa sổ trò chuyện mới với DALL-E 3 được bật. Sau đó, bạn có thể dán văn bản còn sót lại từ phiên trò chuyện đầu tiên và yêu cầu ChatGPT trong phiên DALL-3 mới tạo hình ảnh. Giờ đây, với bản cập nhật mới nhất từ OpenAI, bạn có thể thực hiện tất cả các tác vụ này trong cùng một phiên trò chuyện, cải thiện đáng kể hiệu quả dịch vụ của bạn.
Người dùng coi bản cập nhật và chế độ này là "Tất cả công cụ".
Phản hồi ban đầu từ người dùng rất tích cực và không kém phần đột phá đối với các công ty khởi nghiệp dựa trên GPT khác
"Breaking Thing: ChatGPT-4 vừa hợp nhất tất cả các công cụ điên rồ khác nhau của nó thành một cuộc trò chuyện duy nhất, giống như phong cách God of War King Kong (Voltron)! Xử lý liền mạch PDF, dữ liệu, DLLE, trực quan, duyệt web. Bạn vừa mới thức dậy", Connor Grennan, giám đốc sinh viên tại Trường Kinh doanh Stern của NYU, viết trong một bài đăng trên LinkedIn, trích dẫn các phim hoạt hình có ảnh hưởng từ những năm 80 của thế kỷ 20, trong đó những con sư tử cơ khí lớn do con người điều khiển được kết hợp thành một chiến binh duy nhất. (Dinosaur Troopers từ những năm 90 của thế kỷ 20 đã thực hiện một cách tiếp cận tương tự trong các chương trình live-action).
Alex Ker, người sáng lập vườn ươm p-AI, tuyên bố trên nền tảng X: "Nhiều công ty khởi nghiệp đã chết ngày hôm nay vì OpenAI đã thêm tính năng trò chuyện PDF. Bạn cũng có thể trò chuyện với các tệp dữ liệu và các loại tài liệu khác. Chúng tôi có một làn sóng các sản phẩm phù hợp hơn là các tính năng hơn là các công ty độc lập. Trình bao bọc đang bị OpenAI siết chặt một mặt và mặt khác bởi những người đương nhiệm. Thế giới ngoài kia thật khó khăn. "
Jim Fan, nhà khoa học AI cấp cao tại Nvidia, đồng ý, đăng trên X: "Trước khi bạn có được tinh thần cao, hãy tự hỏi: OpenAI / Anthropic / Microsoft có thể có 3 kỹ sư thêm tính năng này vào một cuộc thi hackathon không?" Ông cũng gợi ý rằng các công ty khởi nghiệp theo mô hình này sẽ kết thúc trong "nghĩa địa của giấy gói mỏng **".
Ker và Fan đã đề cập đến nhiều công ty đã nổi lên kể từ khi OpenAI cho phép truy cập API vào các mô hình ngôn ngữ lớn GPT-3.5 và GPT-4 (LLM) của họ, làm nền tảng cho các phiên bản ChatGPT khác nhau.
Các công ty bên thứ ba đã có thể truy cập các mô hình này để xây dựng các ứng dụng và sản phẩm hỗ trợ OpenAI của riêng họ, một số trong đó cung cấp phân tích PDF và tài liệu. Các ứng dụng và sản phẩm này được coi là "trình bao bọc" bởi các thành viên của cộng đồng công nghệ, và đôi khi thậm chí bị chế giễu, bởi vì về cơ bản chúng chỉ là các giao diện người dùng khác nhau được "bao bọc" xung quanh công nghệ GPT-3.5 / 4 cơ bản.
Trên thực tế, OpenAI đã mở thư viện các plug-in ChatGPT của bên thứ ba vào tháng Ba năm nay, cũng như một số sản phẩm được cung cấp bởi các nhà phát triển bên thứ ba, bao gồm các công cụ phân tích PDF và tài liệu. Tuy nhiên, trải nghiệm sử dụng chúng thường hơi rườm rà đối với người dùng, đòi hỏi họ phải tải tài liệu lên một trang web riêng và dán URL vào ChatGPT.
Bản cập nhật mới dường như đã làm cho các plugin này về cơ bản đã lỗi thời. Ngoài ra, một số người dùng chỉ ra rằng nhờ chức năng tải lên kết hợp với tạo hình ảnh DALL-E 3 và sự hiểu biết đối thoại hiện có của ChatGPT, bản cập nhật "All Tools" có thể chỉnh sửa hình ảnh do người dùng cung cấp bằng các lệnh ngôn ngữ tự nhiên, cạnh tranh hiệu quả với Photoshop cho tác vụ này.
...... Nhưng một số người có mối quan tâm về an ninh
Để cải thiện hiệu quả và cung cấp cho người dùng trải nghiệm mạnh mẽ hơn, bạn nên gói danh sách các tính năng ngày càng mở rộng của ChatGPT thành một dạng như "God of War (Voltron)". Tuy nhiên, một số đã nêu lên những lo ngại về an ninh.
Simon Willison, đồng sáng tạo khung web Python của Django và là người sáng lập Datasette, một công cụ xuất bản / khám phá dữ liệu, cho biết: "Tôi thực sự ngạc nhiên khi thấy cả trình duyệt và trình thông dịch mã đều có sẵn trong cùng một phiên và nó giống như một vectơ hiệu quả cho các cuộc tấn công tiêm nhanh sáng tạo chống lại sự kết hợp của cả hai. "
"Trình thông dịch mã" là tên của cài đặt "Phân tích dữ liệu nâng cao" trong ChatGPT, cho phép tải lên và phân tích tài liệu.
Tuy nhiên, như nhiều người dùng đã chỉ ra, ChatGPT có thể dễ dàng bị đánh lừa bởi các video tải lên có chứa một số thông tin nhất định, chẳng hạn như văn bản màu trắng đưa ra hướng dẫn bí mật.
Willison đã giải thích chi tiết về mối quan tâm của mình trong một bài đăng X tiếp theo, viết: "Chế độ duyệt web là một phương tiện để tiêm nhanh chóng, vì các hướng dẫn độc hại có thể bị ẩn trong các trang được truy cập bởi chế độ duyệt. Bây giờ các hướng dẫn độc hại này có quyền truy cập vào Python trong hộp cát và đầu ra của chúng có thể bao gồm các hướng dẫn khác kích hoạt duyệt web? "
Quan điểm của Willison rất dễ hiểu: nếu ChatGPT có thể đọc các trang web, thì tin tặc hoặc các tác nhân độc hại sẽ xây dựng các trang web, cung cấp cho họ các hướng dẫn bí mật để lập trình chúng bằng cách sử dụng các khả năng tạo mã có sẵn trong chế độ "Phân tích dữ liệu nâng cao", trước đây bị cô lập với trình duyệt và các hoạt động khác. Những kẻ tấn công có thể khiến ChatGPT làm tất cả mọi thứ vì lợi ích, trò lừa bịp, phá hoại hoặc tệ hơn, bao gồm cả việc nó viết các chương trình về mặt lý thuyết chiếm quyền điều khiển máy tính hoặc thiết bị của một người khi cài đặt.
OpenAI trước đây chưa công bố phiên bản ChatGPT đi kèm mới - tại thời điểm xuất bản, cả blog chính thức của công ty và trang web ghi chú phát hành ChatGPT đều không được cập nhật để bao gồm thông tin mới về các tính năng đi kèm. Giám đốc điều hành OpenAI Sam Altman, CTO Mira Murati và người ủng hộ quan hệ nhà phát triển Logan Kilpatrick cũng không tiết lộ thông tin thông qua tài khoản X của họ.
Tài nguyên:
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Hệ sinh thái plug-in ChatGPT hoàn toàn "không chơi"? Bản cập nhật mới muốn "tất cả trong một" với tất cả các tính năng
Công ty khởi nghiệp OpenAI đã liên tục cải tiến chatbot AI phổ biến của mình, ChatGPT, kể từ khi phát hành vào ngày 30 tháng 11 năm 2022, một năm trước, nhưng theo những người dùng đã ra mắt trải nghiệm, bản cập nhật mới nhất của ChatGPT hấp thụ tất cả các tính năng trước đó và dường như hợp nhất chúng thành một.
Nhiều người dùng đã chia sẻ một tin nhắn cập nhật được gửi đến tài khoản ChatGPT của họ trên phương tiện truyền thông xã hội, có nội dung như sau:
Và các tính năng này - phân tích và trả lời các câu hỏi về PDF và các tài liệu khác, duyệt web và phân tích dữ liệu và tích hợp với mô hình tạo hình ảnh của OpenAI, DALL-E 3, cho phép người dùng sử dụng lời nhắc văn bản để tạo hình ảnh mới - trước đây đã phải mở từng mục một cách độc lập trong menu thả xuống "GPT-4" trong phiên ChatGPT trong vài tháng qua. Nói cách khác: trước đây người dùng chỉ có thể sử dụng một trong những tính năng ChatGPT này tại một thời điểm.
Điều này có nghĩa là nếu bạn muốn phân tích tài liệu và sau đó tạo hình ảnh về nó, bạn sẽ phải hoàn thành tác vụ đầu tiên trong một phiên trò chuyện, sao chép thủ công văn bản được phân tích được trả về từ ChatGPT, sau đó khởi chạy cửa sổ trò chuyện mới với DALL-E 3 được bật. Sau đó, bạn có thể dán văn bản còn sót lại từ phiên trò chuyện đầu tiên và yêu cầu ChatGPT trong phiên DALL-3 mới tạo hình ảnh. Giờ đây, với bản cập nhật mới nhất từ OpenAI, bạn có thể thực hiện tất cả các tác vụ này trong cùng một phiên trò chuyện, cải thiện đáng kể hiệu quả dịch vụ của bạn.
Người dùng coi bản cập nhật và chế độ này là "Tất cả công cụ".
Phản hồi ban đầu từ người dùng rất tích cực và không kém phần đột phá đối với các công ty khởi nghiệp dựa trên GPT khác
"Breaking Thing: ChatGPT-4 vừa hợp nhất tất cả các công cụ điên rồ khác nhau của nó thành một cuộc trò chuyện duy nhất, giống như phong cách God of War King Kong (Voltron)! Xử lý liền mạch PDF, dữ liệu, DLLE, trực quan, duyệt web. Bạn vừa mới thức dậy", Connor Grennan, giám đốc sinh viên tại Trường Kinh doanh Stern của NYU, viết trong một bài đăng trên LinkedIn, trích dẫn các phim hoạt hình có ảnh hưởng từ những năm 80 của thế kỷ 20, trong đó những con sư tử cơ khí lớn do con người điều khiển được kết hợp thành một chiến binh duy nhất. (Dinosaur Troopers từ những năm 90 của thế kỷ 20 đã thực hiện một cách tiếp cận tương tự trong các chương trình live-action).
Alex Ker, người sáng lập vườn ươm p-AI, tuyên bố trên nền tảng X: "Nhiều công ty khởi nghiệp đã chết ngày hôm nay vì OpenAI đã thêm tính năng trò chuyện PDF. Bạn cũng có thể trò chuyện với các tệp dữ liệu và các loại tài liệu khác. Chúng tôi có một làn sóng các sản phẩm phù hợp hơn là các tính năng hơn là các công ty độc lập. Trình bao bọc đang bị OpenAI siết chặt một mặt và mặt khác bởi những người đương nhiệm. Thế giới ngoài kia thật khó khăn. "
Jim Fan, nhà khoa học AI cấp cao tại Nvidia, đồng ý, đăng trên X: "Trước khi bạn có được tinh thần cao, hãy tự hỏi: OpenAI / Anthropic / Microsoft có thể có 3 kỹ sư thêm tính năng này vào một cuộc thi hackathon không?" Ông cũng gợi ý rằng các công ty khởi nghiệp theo mô hình này sẽ kết thúc trong "nghĩa địa của giấy gói mỏng **".
Ker và Fan đã đề cập đến nhiều công ty đã nổi lên kể từ khi OpenAI cho phép truy cập API vào các mô hình ngôn ngữ lớn GPT-3.5 và GPT-4 (LLM) của họ, làm nền tảng cho các phiên bản ChatGPT khác nhau.
Các công ty bên thứ ba đã có thể truy cập các mô hình này để xây dựng các ứng dụng và sản phẩm hỗ trợ OpenAI của riêng họ, một số trong đó cung cấp phân tích PDF và tài liệu. Các ứng dụng và sản phẩm này được coi là "trình bao bọc" bởi các thành viên của cộng đồng công nghệ, và đôi khi thậm chí bị chế giễu, bởi vì về cơ bản chúng chỉ là các giao diện người dùng khác nhau được "bao bọc" xung quanh công nghệ GPT-3.5 / 4 cơ bản.
Trên thực tế, OpenAI đã mở thư viện các plug-in ChatGPT của bên thứ ba vào tháng Ba năm nay, cũng như một số sản phẩm được cung cấp bởi các nhà phát triển bên thứ ba, bao gồm các công cụ phân tích PDF và tài liệu. Tuy nhiên, trải nghiệm sử dụng chúng thường hơi rườm rà đối với người dùng, đòi hỏi họ phải tải tài liệu lên một trang web riêng và dán URL vào ChatGPT.
Bản cập nhật mới dường như đã làm cho các plugin này về cơ bản đã lỗi thời. Ngoài ra, một số người dùng chỉ ra rằng nhờ chức năng tải lên kết hợp với tạo hình ảnh DALL-E 3 và sự hiểu biết đối thoại hiện có của ChatGPT, bản cập nhật "All Tools" có thể chỉnh sửa hình ảnh do người dùng cung cấp bằng các lệnh ngôn ngữ tự nhiên, cạnh tranh hiệu quả với Photoshop cho tác vụ này.
...... Nhưng một số người có mối quan tâm về an ninh
Để cải thiện hiệu quả và cung cấp cho người dùng trải nghiệm mạnh mẽ hơn, bạn nên gói danh sách các tính năng ngày càng mở rộng của ChatGPT thành một dạng như "God of War (Voltron)". Tuy nhiên, một số đã nêu lên những lo ngại về an ninh.
Simon Willison, đồng sáng tạo khung web Python của Django và là người sáng lập Datasette, một công cụ xuất bản / khám phá dữ liệu, cho biết: "Tôi thực sự ngạc nhiên khi thấy cả trình duyệt và trình thông dịch mã đều có sẵn trong cùng một phiên và nó giống như một vectơ hiệu quả cho các cuộc tấn công tiêm nhanh sáng tạo chống lại sự kết hợp của cả hai. "
"Trình thông dịch mã" là tên của cài đặt "Phân tích dữ liệu nâng cao" trong ChatGPT, cho phép tải lên và phân tích tài liệu.
Tuy nhiên, như nhiều người dùng đã chỉ ra, ChatGPT có thể dễ dàng bị đánh lừa bởi các video tải lên có chứa một số thông tin nhất định, chẳng hạn như văn bản màu trắng đưa ra hướng dẫn bí mật.
Willison đã giải thích chi tiết về mối quan tâm của mình trong một bài đăng X tiếp theo, viết: "Chế độ duyệt web là một phương tiện để tiêm nhanh chóng, vì các hướng dẫn độc hại có thể bị ẩn trong các trang được truy cập bởi chế độ duyệt. Bây giờ các hướng dẫn độc hại này có quyền truy cập vào Python trong hộp cát và đầu ra của chúng có thể bao gồm các hướng dẫn khác kích hoạt duyệt web? "
Quan điểm của Willison rất dễ hiểu: nếu ChatGPT có thể đọc các trang web, thì tin tặc hoặc các tác nhân độc hại sẽ xây dựng các trang web, cung cấp cho họ các hướng dẫn bí mật để lập trình chúng bằng cách sử dụng các khả năng tạo mã có sẵn trong chế độ "Phân tích dữ liệu nâng cao", trước đây bị cô lập với trình duyệt và các hoạt động khác. Những kẻ tấn công có thể khiến ChatGPT làm tất cả mọi thứ vì lợi ích, trò lừa bịp, phá hoại hoặc tệ hơn, bao gồm cả việc nó viết các chương trình về mặt lý thuyết chiếm quyền điều khiển máy tính hoặc thiết bị của một người khi cài đặt.
OpenAI trước đây chưa công bố phiên bản ChatGPT đi kèm mới - tại thời điểm xuất bản, cả blog chính thức của công ty và trang web ghi chú phát hành ChatGPT đều không được cập nhật để bao gồm thông tin mới về các tính năng đi kèm. Giám đốc điều hành OpenAI Sam Altman, CTO Mira Murati và người ủng hộ quan hệ nhà phát triển Logan Kilpatrick cũng không tiết lộ thông tin thông qua tài khoản X của họ.
Tài nguyên: