NVIDIA เปิดตัว NCCL 2.27: ยกระดับประสิทธิภาพการฝึกอบรมและอนุมาน AI
Lawrence Jengar Jul 15, 2025 06:21
NVIDIA เปิดตัว NCCL 2.27 เพื่อปรับปรุงการทำงานของ AI ด้วยการสื่อสารระหว่าง GPU ที่เร็วขึ้น ความหน่วงเวลาที่ลดลง และความทนทานที่เพิ่มขึ้น เพื่อตอบสนองความต้องการของโครงสร้างพื้นฐาน AI ในยุคใหม่

NVIDIA ได้ประกาศเปิดตัว NCCL 2.27 ซึ่งเป็นอัปเกรดของไลบรารีการสื่อสารแบบรวม (Collective Communications Library) ที่มุ่งหมายเพื่อเพิ่มประสิทธิภาพการทำงานของ AI ผ่านการปรับปรุงการสื่อสารระหว่าง GPU เวอร์ชันล่าสุดนี้ถูกออกแบบมาเพื่อตอบสนองความต้องการที่เพิ่มขึ้นทั้งในด้านการฝึกอบรมและงานอนุมาน เพื่อให้มั่นใจว่าการทำงานจะรวดเร็วและเชื่อถือได้ในระดับใหญ่ ตามบล็อกทางการของ NVIDIA
การปรับปรุงประสิทธิภาพหลัก
NCCL 2.27 มุ่งเน้นไปที่การลดความหน่วงเวลาและเพิ่มประสิทธิภาพแบนด์วิธระหว่าง GPU การปรับปรุงหลักรวมถึงเคอร์เนลความหน่วงเวลาต่ำด้วยหน่วยความจำสมมาตร ซึ่งปรับปรุงการทำงานแบบรวมโดยใช้บัฟเฟอร์ที่มีที่อยู่ VIRTUAL เหมือนกัน การอัปเดตเหล่านี้ส่งผลให้ความหน่วงเวลาลดลงอย่างเห็นได้ชัด ถึง 7.6 เท่าสำหรับข้อความขนาดเล็ก ทำให้เหมาะสำหรับไปป์ไลน์การอนุมานแบบเรียลไทม์
คุณสมบัติสำคัญอีกอย่างคือการสนับสนุน Direct NIC ซึ่งช่วยให้สามารถใช้แบนด์วิธเครือข่ายได้เต็มที่สำหรับการสื่อสารระหว่าง GPU ขยายขนาด นี่เป็นประโยชน์อย่างยิ่งสำหรับงานอนุมานและฝึกอบรมที่มีปริมาณงานสูง เพื่อให้มั่นใจว่าประสิทธิภาพเครือข่ายจะไม่ทำให้แบนด์วิธระหว่าง CPU-GPU อิ่มตัว
การสนับสนุนใหม่สำหรับ NVLink และ InfiniBand SHARP
NCCL 2.27 ยังมีการสนับสนุน SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) สำหรับ NVLink และ InfiniBand fabrics โปรโตคอลนี้ช่วยลดภาระงานที่ต้องใช้การคำนวณสูง ช่วยปรับปรุงการฝึกอบรมในระดับใหญ่โดยลดความต้องการในการคำนวณบน GPU และเพิ่มประสิทธิภาพการขยายขนาดและประสิทธิภาพ โดยเฉพาะสำหรับการฝึกอบรมโมเดลภาษาขนาดใหญ่ (LLM)
ความทนทานด้วยฟังก์ชัน Communicator Shrink
เพื่อแก้ไขความท้าทายในการฝึกอบรมแบบกระจายขนาดใหญ่ NCCL 2.27 มีฟังก์ชัน Communicator Shrink ซึ่งช่วยให้สามารถยกเว้น GPU ที่ล้มเหลวหรือไม่จำเป็นได้แบบไดนามิก เพื่อให้กระบวนการฝึกอบรมไม่หยุดชะงัก ฟังก์ชันนี้รองรับทั้งโหมดปกติและโหมดข้อผิดพลาดสำหรับการกำหนดค่าใหม่ที่วางแผนไว้และความล้มเหลวของอุปกรณ์ที่ไม่ได้คาดคิด ตามลำดับ
เครื่องมือสำหรับนักพัฒนาที่ได้รับการปรับปรุง
การอัปเดตนี้ยังนำเสนอคุณสมบัติใหม่สำหรับนักพัฒนา รวมถึง symmetric memory APIs และเครื่องมือการสร้างโปรไฟล์ที่ได้รับการปรับปรุง การปรับปรุงเหล่านี้ช่วยให้นักพัฒนามีเครื่องมือที่แม่นยำยิ่งขึ้นสำหรับการวินิจฉัยประสิทธิภาพการสื่อสารและปรับปรุงงาน AI
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ NCCL 2.27 และความสามารถใหม่ สามารถเยี่ยมชม NVIDIA/nccl GitHub repository
Image source: Shutterstock- nvidia
- nccl
- ai
- gpu
แปลโดย LedgerRavenZ