DeepSeek تطلق نماذج R1 بأداء ينافس نماذج o1 من OpenAI

أعلنت شركة DeepSeek الصينية إطلاق نموذجين جديدين للذكاء الاصطناعي، هما R1 و R1-Zero، مدّعيةً أنهما يضاهيان أداء نماذج التفكير المنطقي o1 من شركة OpenAI الرائدة، وهي النماذج التي تأخذ بعض الوقت في التفكير والتحليل والمقارنة والتقييم قبل توليد الإجابات.

وبالإضافة إلى ذلك، طرحت الشركة الصينية 6 نماذج مفتوحة المصدر أصغر حجمًا، بعضها ينافس أداء نموذج OpenAI-o1-mini.

ويمتاز نموذج DeepSeek-R1-Zero بطريقة تعلم مبتكرة، إذ طوّر مهاراته في الاستدلال باستخدام التعلم المعزز (Reinforcement Learning) دون الاعتماد على أمثلة بشرية. واعتمد النموذج على نظام مكافآت مبسّط وقواعد واضحة لفحص دقة الإجابات، ومنها التحقق من صحة حلول المسائل الرياضية وبرمجية التعليمات.

وطوّرت DeepSeek خوارزمية جديدة تقيّم مجموعات من الإجابات بدلًا من تقييم كل إجابة على حدة، وقد مكّنت هذه التقنية النموذج من تحسين أدائه بكفاءة.

ومع إمكانياته الواعدة، واجه النموذج مشكلتين رئيسيتين، وهما صعوبة قراءة الإجابات وخلط اللغات. ولمواجهة ذلك، أطلقت DeepSeek نموذج R1، الذي يبدأ بتدريب مبدئي على بيانات صغيرة، ثم يخضع لجولات متعددة من التعلم المعزز لتحسين الأداء.

وأظهرت الاختبارات أن نموذج DeepSeek-R1 حقق أداءً يقارب أداء نموذج OpenAI-o1-1217 عبر عدة معايير استدلالية تُختبر بها نماذج الذكاء الاصطناعي.

وطوّرت الشركة 6 نماذج صغيرة تتراوح بين 1.5 و 70 مليار معلمة، وقد استخدمت هذه النماذج 800 ألف مثال تدريبي ولّدها نموذج R1 الأكبر، وقد أظهرت النماذج الصغيرة (النماذج المُقطّرة)، مثل R1-Distill-Llama-70B و R1-Distill-Qwen-32B، قدرات استدلالية قوية، متفوقة على العديد من النماذج الأكبر حجمًا.

وتتوفر نماذج DeepSeek-R1 برخصة MIT، مما يسمح باستخدامها بحرية وتخصيصها وتطويرها. ويمكن الوصول إلى تلك النماذج عبر منصتي GitHub و HuggingFace، أو من خلال واجهة برمجية (API) خاصة بالشركة بأسعار محددة.

ويأتي هذا بعد إطلاق الشركة الصينية نموذجها DeepSeek-V3، الذي يُعدّ من أقوى النماذج المفتوحة المصدر في العالم، مضاهيًا نماذج أخرى مثل GTP-4o.

تم نسخ الرابط

الوسوم

DeepSeek تطلق نماذج R1 بأداء ينافس نماذج o1 من OpenAI

عن الكاتب

رانيا ناجي

عمالقة التكنولوجيا في حفل تنصيب ترامب وجدل حول تبرعاتهم الضخمة

الصين ترد على خطة ترامب لبيع تيك توك

جوال غير قابل للكسر HONOR X9c !!

إيلون ماسك يبحث إعادة إطلاق منصة مشاركة الفيديو Vine

أنباء عن تطوير OpenAI ذكاءً اصطناعيًا خارقًا بمستوى حَمَلة “الدكتوراه”

Motorola تحدث أجهزة Razr+ 2024 بمساعد Gemini Live

إكس وبلوسكاي تسهّلان مشاهدة مقاطع الفيديو العمودية

AMD تطلق المعالج الاقتصادي Ryzen 5 7400F من عائلة Zen 4

التعليقات

اترك تعليقاً إلغاء الرد