تعزيز سرعة علم البيانات في بايثون باستبدالات السبعة المدعومة بوحدة معالجة الرسومات
تيريل ديكي
02 أغسطس 2025 10:05
اكتشف كيفية تسريع سير عمل علم البيانات في بايثون باستخدام مكتبات معززة بوحدة معالجة الرسومات مثل cuDF وcuML وcuGraph لمعالجة البيانات وتدريب النماذج بسرعة أكبر.
لا يمكن إنكار شعبية بايثون في علم البيانات، ولكن مع نمو مجموعات البيانات، تصبح الحاجة إلى السرعة أمرًا بالغ الأهمية. وفقًا لشركة NVIDIA، هناك الآن عدة بدائل جاهزة لتسريع سير عمل علم البيانات في بايثون بشكل كبير، حيث تستفيد من تسريع وحدة معالجة الرسومات مع تغييرات طفيفة في الكود. تعد هذه البدائل بتحويل أداء المكتبات الشهيرة مثل pandas وscikit-leARn وXGBoost.
تعزيز أداء pandas وPolars
يعد إعداد البيانات أساسيًا في مشاريع علم البيانات، ويمكن أن يستغرق وقتًا طويلًا. تقدم مكتبة cuDF من NVIDIA حلاً من خلال تمكين تسريع وحدة معالجة الرسومات لـ pandas. بمجرد تحميل امتداد cudf.pandas، يمكن تنفيذ أوامر pandas على وحدة معالجة الرسومات، مع الحفاظ على نفس الكود مع زيادة السرعة.
يمكن أن يستفيد Polars، المعروف بسرعته، أيضًا من تسريع وحدة معالجة الرسومات. باستخدام محرك cuDF، يمكن لـ Polars الاستفادة من وحدة معالجة الرسومات لعملياته، مما يعزز قدراته الأدائية بشكل أكبر.
تسريع تدريب النماذج باستخدام scikit-learn وXGBoost
يمكن أن يكون تدريب النماذج بمجموعات البيانات الكبيرة عائقًا في سير عمل بايثون. ومع ذلك، يمكن الآن لـ scikit-learn وXGBoost الأداء بشكل أسرع بدعم وحدة معالجة الرسومات. باستخدام cuML، يمكن تدريب نماذج scikit-learn بكفاءة أكبر دون تغيير الكود الحالي. وبالمثل، يمكن تفعيل تسريع وحدة معالجة الرسومات المدمج في XGBoost عن طريق تعيين معلمة بسيطة، مما يقلل وقت التدريب بشكل كبير.
تحسينات في التعلم الآلي الاستكشافي والتجميع
يعد تحليل البيانات الاستكشافي والتجميع خطوات حاسمة قبل تدريب النماذج. يمكن الآن للأدوات مثل UMAP وHDBSCAN، التي يمكن أن تكون بطيئة على مجموعات البيانات الكبيرة، العمل بشكل أسرع مع تسريع وحدة معالجة الرسومات في cuML. عن طريق تحميل امتداد cuml.accel، يمكن لهذه الأدوات التعامل مع مجموعات البيانات الكبيرة بسرعة، مما يسهل الحصول على رؤى أسرع.
تحليل الرسوم البيانية باستخدام NetworkX
تواجه مكتبة NetWorkX، الشهيرة في تحليل الرسوم البيانية، تحديات في الأداء على مجموعات البيانات الكبيرة. يعالج nx-cugraph، وهو خلفية معززة بوحدة معالجة الرسومات، هذه المشكلات من خلال تمكين تسريع وحدة معالجة الرسومات لـ NetworkX دون أي تغييرات في الكود. وهذا يسمح بتحليل فعال للهياكل الرسومية المعقدة.
للمطورين وعلماء البيانات المتحمسين لتعزيز سير عملهم، توفر Nvidia أمثلة شاملة وكود بداية متاح على مدونتها الرسمية. من خلال دمج هذه المكتبات المعززة بوحدة معالجة الرسومات، يمكن لمستخدمي بايثون تحقيق معالجة أسرع للبيانات وتدريب النماذج، مما يحسن عمليات علم البيانات بشكل كبير.
مصدر الصورة: Shutterstock- بايثون
- علم البيانات
- تسريع وحدة معالجة الرسومات
ترجمة: M1nerV2