2023-07-18 07:55:43

Theo báo cáo qubit, các học giả từ Viện nghiên cứu Microsoft Châu Á (MSRA) đã đề xuất một kiến trúc mô hình lớn mới Mạng lưu trữ (RetNet) trong bài báo "Mạng lưu trữ: Người kế vị biến thế cho các mô hình ngôn ngữ lớn", được coi là lĩnh vực của mô hình lớn Người kế nhiệm của Transformer. Dữ liệu thử nghiệm cho thấy rằng đối với các tác vụ mô hình hóa ngôn ngữ: RetNet có thể đạt được độ phức tạp tương đương với Transformer, tốc độ suy luận là 8,4 lần, mức sử dụng bộ nhớ giảm 70% và có khả năng mở rộng tốt. Và khi kích thước mô hình lớn hơn một tỷ lệ nhất định, RetNet sẽ hoạt động tốt hơn Transformer.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
1
Chia sẻ

Bình luận

0/400

Rico@jw

· 2024-05-06 08:10

Giữ BUIDL🧐

Xem bản gốcTrả lời0

Chủ đề
1/3
1CandyDrop Airdrop Event 6.0
59k Phổ biến
2White House Crypto Report
56k Phổ biến
3Join Alpha RION Airdrop to Earn $40
43k Phổ biến
4Fed Holds Rates Decision
9k Phổ biến
5July Spark Program TOP 10 Creators Announced
3k Phổ biến

Ghim

sơ đồ trang web