Nvidia วางแผนพัฒนา Multi-Chip GPU modules เพื่อเลี่ยงข้อจำกัดกฏ Moore’s Law
หากยังจำกฏของ Moore’s Law กันได้เรื่องนี้ไม่ใช่เรื่องใหม่แต่มันเป็นข้อจำกัดทางด้านความหนาแน่นบนชิปตั้งนานมาแล้วอันนี้ผู้ผลิตรู้กันดี.
ทุกวันนี้ผู้ผลิตต่างๆก็หาวิธีที่จะเพิ่มประสิทธิภาพสินค้าของตัวเองให้มันทรงพลังมากยิ่งขึ้นโดยเฉพาะด้าน processing nodes หรือสร้างมันขึ้นมาให้มันมีขนาด silicon ที่ใหญ๋ขึ้นเพื่อเลี่ยงต่อความหนาแน่นบนขนาดชิปหรือ die นั้นๆออกไป, หากสังเกตุให้ดีทาง AMD เป็นผู้ลงมือก่อนและนำเอา Infinity Fabric พัฒนาขึ้นมาใช้.
แน่นอนว่า Nvidia ก็อยากที่จะพัฒนาตัว silicon เพื่อหลีกเลี่ยงของจำกัดเช่นนี้เหมือนกัน, ซึ่งตอนนี้ให้ความสนใจที่จะพัฒนาและสร้าง GPUs ให้ออกมาเป็น multi-GPU complex เพื่อจับมารวมเข้ากันเสมือนเป็นหนึ่งเดียวหรือ single unit และเปี่ยมไปด้วยประสิทธิภาพที่มันจะมากกว่าหากเทียบกับ single, “monolithic” GPU structure หรือโครงสร้างที่มีเพียงชิปเดียว.
การร่วมมือครั้งใหม่ระหว่าง Nvidia, Arizona State University, University of Texas และ Barcelona Supercomputing Centre, ตอนนี้กำลังร่วมกันพัฒนาและสร้าง GPU ใหม่เพื่อให้ไปเป็น MCM (Multi-Chip-Module/โครงสร้างแบบหลายๆตัว), ซึ่งสามารถทำงานร่วมกันและเชื่อมต่อกัน/interconnects และต้องเร็วด้วยและให้มันทำงานได้เสมือนเป็นชิปแค่ตัวเดียว, ขนาดก็ใหญ่ตามไปด้วย GPU design.
ประโยชน์ที่จะได้เห็นได้ชัดมากในรูปแบบ MCM, แน่นอนว่าเรื่องความหนาแน่นและพื้นที่ อันนี้ตัดทิ้งไปได้เลยและสร้าง GPU SKUs ใหม่ที่จะยืนอยู่บนฐานหรือผังเดียวกัน. ซึ่งในแต่ละตัวและองค์ประกอบใหม่จะมีขนาดที่เล็กมากขึ้นและผลประโยชน์ทางด้านธุรกิจก็จะมีมากขึ้นตาม/high-yield, ส่วนทางด้านการผลิตก็จะมีของเสียที่น้อยลงและกำไรมากขึ้นอีกด้วย.
ณ ตอนนี้, Nvidia คิดว่า MCM-GPU สามารถที่จะนำเสนอประสิทธิภาพได้มากเทียบเท่ากับ GPU ที่มีขนาดใหญ๋/hypothetical superscale-GPU ที่ 10 เปอร์เซนต์ด้วยจำนวน CUDA cores และ memory bandwidth ที่เท่าๆกัน, มันจะเป็นไปไม่ได้เลยหากไม่มี MCM technology เข้ามาช่วยในการสร้าง GPU.
เพื่อให้บรรลุในสิ่งที่ตั้งไว้, เราได้แสดงผังที่สามารถสร้าง multiple GPU modules เพื่อสร้าง GPUs ที่สามารถทำได้จริงมีประสิทธิภาพที่คงที่และไร้ข้อจำกัดหากอ้างอิงถึง Moore’s law. ทางด้านรายละเอียด, เรานำเสนอ GPUs ที่แยกออกมาเป็นตัวๆเพื่อง่ายต่อการผลิต GPU Modules (GPMs), และเชื่อมต่อมันไว้บน package เดียวกันและใช้ bandwidth ที่มีค่าสูงและใช้เทคโนโลจีตัวส่งสัญญานพลังงานที่มีประสิทธิภาพสูง/วงจรไฟฟ้า. เราได้วิเคราะห์ถึงความเป็นไปได้และวาดผังรายละเอียดออกมาสำหรับ Multi-Chip-Module GPU (MCM-GPU) design.
และเรายังได้นำเสนอสถาปัตยกรรมออกมาสามรูปแบบที่สามารถเพิ่มประสิทธิภาพได้โดยเฉพาะปรับปรุงตรงส่วนของ GPM data locality/การเก็บคำสั่งหรือข้อมูลที่มีการเรียกใช้บ่อยครั้ง และลดความเสี่ยงหรือสูญหายบน inter-GPM bandwidth. เราสามารถพิสูจน์ได้ว่า MCM-GPU มีประสิทธิภาพและเร็วที่ดีขึ้นถึง 22.8% ลดความเสี่ยงหรือค่าที่ลดลงของ inter-GPM bandwidth ได้ถึงห้าเท่าหากเทียบกับ MCM-GPU architecture ทั่วๆไป.
และสิ่งที่สำคัญที่สุดสำหรับ MCM-GPU design ที่ได้รับการปรับปรุงทางด้านประสิทธิภาพแล้วความเร็วนั้นเร็วกว่าถึง 45.5% หากเทียบกับ monolithic GPU ตัวที่มีขนาดใหญ๋ที่สุดเสียด้วยซ้ำและประสิทธิภาพที่ได้มาอยู่ในระดับ 10% ของ hypothetical (และไม่สามารถสร้างได้) monolithic GPU. สุดท้ายนี้เราได้แสดงถึงตัว MCM-GPU ที่ได้รับการปรับปรุงและเพิ่มประสิทธิภาพสามารถแรงได้มากกว่าถึง 26.8% หากเทียบกับ ระบบ Multi-GPU system ที่มีองค์ประกอบเหมือนๆกันและมีจำนวน SMs และ DRAM bandwidth ที่เท่าๆกัน.
สำหรับใครก็ตามที่มีความคุ้้นเคยกับวงการ PC industry จะร้อว อ้อ ทันทีว่ามันคุ้นๆอยู่, ซึ่งหลังจากสังเกตุดูแล้วมันก็แนวเดียวกันกับ AMD Infinity Fabric tech ซึ่งทำให้ทาง AMD สร้างและพัฒนา MCM-CPU complexes สำหรับ Threadripper และ EPYC series CPUs.
AMD ยังได้นำวีธีเดียวกันนี้ Infinity Fabric ไปใช้กับ Vega GPU architecture ตัวล่าสุด, และยังก้าวไปถึง Navi-GPU hardware และมันจะมาพร้อมขนาดที่สามารถปรับเข้าได้กับทุกเป้าหมายของการนำไปใช้ประโยชน์อีกด้วย “Scalability”, ซึ่งเทคโนโลจีแนวนี้ต้องกล่าวเลยว่าทาง AMD นั้นนำ Nvidia ไปแล้วทางด้านพัฒนา MCM-GPU.
ที่มาเครดิต/Sources:
https://www.overclock3d.net/news/gpu_displays/nvidia_plans_to_move_to_multi-chip_gpu_modules_to_scale_past_moore_s_law/1
You must be logged in to post a comment.