Laboratorium AI China, DeepSeek, baru-baru ini meluncurkan model inferensi Sumber Terbuka mereka, DeepSeek-R1, yang telah menarik perhatian luas di industri. Model ini disebut sebagai 'model inferensi' dan diklaim memiliki kinerja yang sebanding dengan o1 dari OpenAI dalam beberapa pengujian Benchmark AI. R1 telah dirilis dengan lisensi MIT melalui platform pengembangan AI Hugging Face, sehingga pengguna dapat menggunakannya secara komersial tanpa batasan.
DeepSeek mengklaim bahwa R1 melampaui o1 dalam beberapa uji benchmark, termasuk American Invitational Mathematics Examination (AIME), MATH-500, dan SWE-bench Verified. Di antaranya, AIME menggunakan model lain untuk mengevaluasi kemampuan penalaran, MATH-500 fokus pada soal teks, dan SWE-bench Verified menguji tugas pemrograman.
Model R1 memiliki keunggulan, tetapi terbatas oleh politik
Dikatakan bahwa sebagai model penalaran, R1 memiliki kemampuan verifikasi diri yang unik, membuatnya lebih dapat diandalkan dalam bidang fisika, ilmu pengetahuan, dan matematika daripada model-model tradisional. Meskipun model penalaran biasanya memerlukan waktu komputasi yang lebih lama (beberapa detik hingga beberapa menit), namun akurasi tinggi membuatnya memiliki keunggulan besar dalam menangani masalah yang kompleks.
Laporan teknis menyatakan bahwa R1 mengandung 6710 miliar parameter, jauh lebih banyak dari banyak model yang ada saat ini. Jumlah parameter biasanya sebanding dengan kemampuan model untuk memecahkan masalah, ini membuat R1 menjadi model yang sangat besar. Namun, D
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
AI China mengejar dengan cepat: DeepSeek merilis model R1, menantang posisi teknologi Amerika yang unggul
Laboratorium AI China, DeepSeek, baru-baru ini meluncurkan model inferensi Sumber Terbuka mereka, DeepSeek-R1, yang telah menarik perhatian luas di industri. Model ini disebut sebagai 'model inferensi' dan diklaim memiliki kinerja yang sebanding dengan o1 dari OpenAI dalam beberapa pengujian Benchmark AI. R1 telah dirilis dengan lisensi MIT melalui platform pengembangan AI Hugging Face, sehingga pengguna dapat menggunakannya secara komersial tanpa batasan.
DeepSeek mengklaim bahwa R1 melampaui o1 dalam beberapa uji benchmark, termasuk American Invitational Mathematics Examination (AIME), MATH-500, dan SWE-bench Verified. Di antaranya, AIME menggunakan model lain untuk mengevaluasi kemampuan penalaran, MATH-500 fokus pada soal teks, dan SWE-bench Verified menguji tugas pemrograman.
Model R1 memiliki keunggulan, tetapi terbatas oleh politik
Dikatakan bahwa sebagai model penalaran, R1 memiliki kemampuan verifikasi diri yang unik, membuatnya lebih dapat diandalkan dalam bidang fisika, ilmu pengetahuan, dan matematika daripada model-model tradisional. Meskipun model penalaran biasanya memerlukan waktu komputasi yang lebih lama (beberapa detik hingga beberapa menit), namun akurasi tinggi membuatnya memiliki keunggulan besar dalam menangani masalah yang kompleks.
Laporan teknis menyatakan bahwa R1 mengandung 6710 miliar parameter, jauh lebih banyak dari banyak model yang ada saat ini. Jumlah parameter biasanya sebanding dengan kemampuan model untuk memecahkan masalah, ini membuat R1 menjadi model yang sangat besar. Namun, D