Theo báo cáo qubit, các học giả từ Viện nghiên cứu Microsoft Châu Á (MSRA) đã đề xuất một kiến trúc mô hình lớn mới Mạng lưu trữ (RetNet) trong bài báo "Mạng lưu trữ: Người kế vị biến thế cho các mô hình ngôn ngữ lớn", được coi là lĩnh vực của mô hình lớn Người kế nhiệm của Transformer. Dữ liệu thử nghiệm cho thấy rằng đối với các tác vụ mô hình hóa ngôn ngữ: RetNet có thể đạt được độ phức tạp tương đương với Transformer, tốc độ suy luận là 8,4 lần, mức sử dụng bộ nhớ giảm 70% và có khả năng mở rộng tốt. Và khi kích thước mô hình lớn hơn một tỷ lệ nhất định, RetNet sẽ hoạt động tốt hơn Transformer.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 1
  • Chia sẻ
Bình luận
0/400
Rico@jwvip
· 2024-05-06 08:10
Giữ BUIDL🧐
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)