وفقا لتقرير صادر عن Webmaster House في 12 أكتوبر ، طور فريق الذكاء الاصطناعي / ML التابع لشركة Apple وفريق البحث بجامعة كولومبيا نموذجا كبيرا متعدد الوسائط "Ferret" يمكنه العثور بدقة على إشارات المرور في الصور ، والذي يعمل بشكل أفضل من GPT-4V ويحسن دقة النماذج الكبيرة في مهام "النظر والتحدث والإجابة". يكمن ابتكار Ferret الرئيسي في الجمع الوثيق بين الفهم المكاني لكل من الإحالة والتأريض ، مما يمكن النموذج من فهم دلالات منطقة معينة والعثور على الهدف المقابل في نفس الوقت.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت