BTCC / BTCC Square / AltS3ntry /
إطار عمل NeMo من NVIDIA يتيح تدريب نماذج لغوية قادرة على التفكير خلال عطلة نهاية الأسبوع

إطار عمل NeMo من NVIDIA يتيح تدريب نماذج لغوية قادرة على التفكير خلال عطلة نهاية الأسبوع

Author:
AltS3ntry
Published:
2025-07-23 07:18:41
17
2

لورانس جينجار
23 يوليو 2025 04:12

تقدم NVIDIA طريقة فعالة لتدريب نماذج لغوية قادرة على التفكير خلال عطلة نهاية الأسبوع باستخدام إطار عمل NeMo، مع الاستفادة من مجموعة بيانات Llama Nemotron ومحولات LoRA.

إطار عمل NeMo من NVIDIA يتيح تدريب نماذج لغوية قادرة على التفكير خلال عطلة نهاية الأسبوع

كشفت NVIDIA عن نهج ثوري لتدريب نماذج لغوية قادرة على التفكير خلال عطلة نهاية الأسبوع باستخدام إطار عمل NeMo ومجموعة بيانات Llama NemotRon. وفقًا لمدونة مطوري NVIDIA، تتيح هذه العملية المبتكرة للمطورين بناء نماذج تفكير فعالة على وحدة معالجة رسومية واحدة في حوالي 48 ساعة.

ثورة في نماذج التفكير

يمثل ظهور نماذج اللغة القادرة على التفكير تحولًا كبيرًا في قدرات الذكاء الاصطناعي، خاصة في المهام التي تتطلب تفكيرًا نقديًا مثل الرياضيات والبرمجة. تأتي نماذج Llama Nemotron من NVIDIA، المصممة للتفكير عالي الأداء، في طليعة هذا التحول، حيث تقدم أوضاع تفكير ديناميكية يمكنها التبديل بين الدردشة القياسية والتفكير المتقدم، مما يحسن استخدام الموارد للمهام المعقدة.

تمكين المطورين بمجموعات بيانات مفتوحة

قامت NVIDIA بفتح جزء كبير من مجموعة بيانات Llama Nemotron بعد التدريب، والتي تضم أكثر من 32 مليون عينة عبر مجالات مثل الرياضيات والبرمجة والعلوم. تعد هذه المجموعة حاسمة للمطورين الذين يسعون لتدريب نماذجهم الخاصة بقدرات مشابهة لـ Llama Nemotron.

منهجية التدريب

تتضمن عملية التدريب تنظيم البيانات، الضبط الدقيق، والتقييم. يُنصح المطورون بتنظيم مجموعات فرعية مركزة من مجموعة البيانات، مع التركيز على التفكير، واستخدام نماذج تحتوي على 8 مليارات معلمة على الأقل للتدريب الفعال. تبرز العملية أيضًا استخدام الضبط الدقيق الفعال للمعاملات (PEFT) مع محولات LoRA، مما يسمح بالتدريب على وحدة معالجة رسومية واحدة من نوع NVIDIA H100.

التقييم والنتائج

بعد التدريب، يتم تقييم النماذج باستخدام معايير قياسية مثل MMLU وGPQA. أفادت NVIDIA أن محول LoRA المدرب يتفوق على نموذج التعليمات الأساسي في معايير مختلفة، مما يظهر تحسينات كبيرة في مهام التفكير.

لا يبسط هذا النهج عملية التدريب فحسب، بل يدمقرطة الوصول إلى أدوات الذكاء الاصطناعي القوية، مما يمكن المطورين من إنشاء نماذج خاصة بمجالات معينة بقدرات تفكير محسنة.

مصدر الصورة: Shutterstock
  • nvidia
  • ai
  • llm
  • nemo

ترجمة: AltS3ntry

|Square

احصل على تطبيق BTCC كي تنطلق في رحلتك مع العملات الرقمية

ابدأ اليوم امسح الكود للانضمام إلى أكثر من 100 مليون مستخدم لدينا