Harvey AI تطور إطار عملها لتقييم التطبيقات الخاصة بالمجالات
كارولين بيشوب
27 أكتوبر 2025 14:31
تعمل Harvey AI على تعزيز إطار التقييم الخاص بها للتطبيقات الخاصة بالمجالات، مع التركيز على الرؤى والبحوث والمناهج والسياق لتحسين أداء وفهم الذكاء الاصطناعي.

تطور HARvey AI جهودها في تقييم نماذج اللغة الكبيرة (LLMs) للتطبيقات الخاصة بالمجالات من خلال توسيع عمل التقييم العلني عبر أربعة مجالات حرجة: الرؤى والبحوث والمناهج والسياق، وفقاً لإعلان حديث من الشركة.
الرؤى
تشكل الرؤى الأساس لاستراتيجية التقييم لدى Harvey، حيث توفر مقياساً كمياً لأداء النموذج في مهام محددة. فمثلاً، يقوم تقييم BiglaW Bench (BLB) بتقييم مدى فعالية النماذج في أداء المهام القانونية الواقعية. هذه الرؤى حاسمة لتوصيل مقاييس الأداء بكفاءة وتسهيل المناقشات المستنيرة حول قيمة وتحسين أنظمة الذكاء الاصطناعي مع مرور الوقت.
البحوث
تركز جهود البحث لدى Harvey على تطوير المعايير لتوليد رؤى ذات معنى حول أداء النموذج. تهدف الشركة إلى تحديد المجالات التي تتفوق فيها النماذج وتلك التي تواجه فيها صعوبات، مما يحدد بذلك حدود التطوير المستقبلي للنماذج. تشمل المعايير القادمة مشروع Contract InTELligence وتحدي BLB، المصممين لاختبار النماذج في المهام القانونية الصعبة.
المناهج
لتشغيل التقييمات، تستخدم Harvey مناهج مختلفة تدمج الملاحظات من خبراء المجال والعملاء، مما يضمن أداء الأنظمة بشكل جيد عبر مختلف الولايات القضائية واللغات. يتضمن ذلك تحويل المراجعات الخبيرة إلى أنظمة تقييم آلية، مما يوفر إطاراً للتحسين المستمر.
السياق
يعد السياق أساسياً لفهم ما تكشفه التقييمات حول قدرات الذكاء الاصطناعي. تؤكد Harvey على أهمية التفسيرات بلغة واضحة لإزالة الغموض عن عمليات التقييم، وجعلها قابلة للوصول والتطبيق. تسلط المعايير الحديثة الضوء على القيمة الاقتصادية لنماذج الذكاء الاصطناعي مثل GPT-5 وClaude opus 4.1، مؤكدة على الحاجة لسياق واضح للتنقل في هذه الرؤى.
في الختام، يهدف الإطار الموسع لـ Harvey AI إلى تعزيز الفهم الشامل لتقييم الذكاء الاصطناعي، وضمان ترجمة التطورات في الذكاء الاصطناعي إلى فوائد ملموسة للتطبيقات الخاصة بالمجالات. هذه المبادرة جزء من التزام Harvey ببناء تحالف واسع يمكنه استكشاف ودفع حدود تقييم الذكاء الاصطناعي.
مصدر الصورة: Shutterstock- تقييم الذكاء الاصطناعي
- التطبيقات الخاصة بالمجالات
- هارفي للذكاء الاصطناعي
ترجمة: M1nerV2