AMD เปิดตัว Radeon Instinct ใช้ VEGA GPU ที่มาขับเคลื่อน MI25 Accelerator
วันนี้ทาง AMD ประกาศเปิดกลยุทธใหม่พร้อมเปิดประวัติศาสตร์หน้าใหม่ให้กับ server computing, เป็นรุ่น MI25 มีประสิทธิภาพทางด้านการประมวลผลด้านคำนวนขนาด 25 TFLOPs (fp16-bit), และใช้ VEGA GPU. มาในชื่อเรียกเต็มแบบเป็นทางการ Radeon Instinct accelerators เพื่อมาตอบสนองประสิทธิภาพทางด้าน GPU-based solutions สำหรับ deep learning inference และ training. (การเรียนรู้เชิงลึก (อังกฤษ: Deep learning) เป็นสาขาของการเรียนรู้ของเครื่อง พื้นฐานของการเรียนรู้เชิงลึกคือ อัลกอริทึมที่พยายามจะสร้างแบบจำลองเพื่อแทนความหมายของข้อมูลในระดับสูงโดยการสร้างสถาปัตยกรรมข้อมูลขึ้นมาที่ประกอบไปด้วยโครงสร้างย่อยๆหลายอัน และแต่ละอันนั้นได้มาจากการแปลงที่ไม่เป็นเชิงเส้น) (การฝึก หรือ training คือฝึกให้เครื่องนั้นหาคำตอบไปเรื่อยๆจนได้คำตอบที่ถูกต้องและแม่นยำที่สุด และก็จะได้สมองหรือเครื่องที่ถูกฝึกมาแล้ว)
ภายใต้ชือ Radeon Instinct ทาง AMD ได้เปิดตัวออกมาทั้งหมดสามรุ่นด้วยกัน MI6, MI8 และ MI25 และมาพร้อมตัวซอร์ฟแวร์แบบเปิดหรือ (open) software applications. ตัวเลขที่เรียกในแต่ละรุ่นของ MI series เปรียบเสมือประสิทธิภาพของมัน เช่น 16-bit floating-point TFLOP performance. Machine Learning (หมายถึงการที่กำหนดให้เครื่อง(คอมพิวเตอร์) สามารถปฏิบัติงานได้ดีขึ้น โดยเรียนรู้จากการกระทำ หรือสิ่งที่ทำไปก่อนหน้านั้น (ใช้หลักการของปัญญาประดิษฐ์หรือ artificial intelligence) หรืออาจเป็นการเรียนรู้จากการถูกสั่งให้ทำ จากตัวอย่าง (example) จากการเปรียบเทียบ (analogy) ฯลฯ ก็ได้) เป็นกลุ่มเป้าหมายของทางบริษัทที่จะนำตัวการ์ดเหล่านี้ไปนำเสนอ, และกลุ่มคนเหล่านี้ก็จะเป็นผู้อยู่เบื้องหลังซึ่งจะทำให้ Mi series เปิดตัวออกมา. การทำงานของมันก็จะสอดคล้องกับ artificial intelligence (AI). GPUs นั้นกล่าวกันตามความเป็นจริงก็เหมาะมากสำหรับ AI และ machine learning applications, เพราะมันจะถูกนำไปใช้ในการประมวลผลและด้านคำนวนซึ่งจะเกี่ยวข้องกับข้อมูลเป็นจำนวนมหาศาลและด้วยความเร็วที่สูงมากๆ.
‘Instinct’ สินค้าตัวนี้ตั้งเป้าหมายการตลาดเอาไว้หลายกลุ่มด้วยกันเช่น self-driving cars/การขับขี่แบบอัตโนมัติ, complex drug development/การพัฒนายาที่ซับซ้อน, fighting diseases/การต่อต้านโรค, prediction of weather models/พยากรณ์อากาศ, robotics/หุ่นยนต์และ financial applications/ด้านการเงิน. Machine Learning aka/หรือรู้จักกันใน Deep Learning เป็นเทคโ่นโลจีอีกแขนงหนึ่งซึ่งจะทำให้การทำงานของคอมพิวเตอร์ฉลาดมากยิ่งขึ้นโดยการวิเคราะห์ข้อมูลอันมหาศาลจากผลลัพท์ที่ต้องคาดเดาและการเลือก. Instinct เป็นตัวฮาร์ดแวร์และซอร์ฟแวร์ซึ่งมาจาก Radeon Open Compute Platform, หรือ ROCm. ก่อนหน้านี้เคยเรียกว่า Boltzmann Initiative. ROCm สามารถกล่าวได้ว่าเป็นโครงสร้างพื้นฐานสำหรับขับเคลื่อน HPC/High-performance computing applications บน MI accelerators และขับเคลื่อนด้วย AMD graphics cards. ROCm สามารถไปกระตุ้น deep-learning frameworks (แบบธรรมดา) เช่น Caffe, Torch 7, และ TensorFlow บน AMD hardware/ฮาร์ดแวร์. ตัวซอร์ฟแวร์นี้จะมาประจำในซีรี่ย์ใหม่ของ Radeon Instinct compute accelerators.
ทาง AMD จะปล่อยออกมาทั้งหมดสามรุ่นด้วยกัน:
- Radeon Instinct MI6 – จาก Polaris ที่เป็น GPU หรือรู้จักกันใน Radeon RX 480 @ 5,7 TFLOPS
- Radeon Instinct MI8 – จาก Fiji-chip หรือรู้จักกันใน R9 Nano / Fury @ 8.2 TFLOPS
- Radeon Instinct MI25 – จาก Vega GPU สามารถทะลุไปถึง 25 TFLOPS
ก่อนที่เราจะลงลึกไปยังแหล่งข่าวที่เปิดเผยออกมา, มีหลายอย่างที่น่าสนใจดังนี้. ในส่วนที่ใช้ VEGA GPU ในฐานหรือ platform นี้. Mi25 เป็นเพียงรุ่นเดียวที่เหมาะกับ VEGA เท่านั้น. มันใช้พลังงานน้อยกว่าหรือ <300 Watt แต่เป็นการเลี้ยงไฟจากตัวบอร์ด. อันที่สองทาง AMD ยังไม่เปิดเผยข้อมูลทางด้านประสิทธิภาพหรือสเป็คสำหรับ VEGA ออกมา. แต่หากคุณสังเกตุให้ดีๆกับรูปที่แสดงทั้งหมดนี้ จะเห็น server clusters ที่แรงถึงสองเท่า:
- K888 G3 พร้อมด้วย Radeon Instinct แรงเป็นสี่เท่าหรือ 4x Radeon Instinct MI2 @ ที่ 100 Teraflops
- Falcon Radeon Instinct cluster แรงเป็น 16x Radeon Instinct MI25 @ ที่ 400 Teraflops
ตัวเลขที่เห็นนั้นสามารถเทียบเคียงได้ง่ายๆก็คือ 25 TFLOPS per/ต่อ GPU. และจากข่าวลือเบื้องต้นได้กล่าวเอาไว้ว่า: “ตัว GPU นี้นั้นมี 64 Compute Units, multiply หรือคูณเข้ากับ 64 shader processors per/ต่อ cluster และคุณก็จะได้ 4096 shader processors. ซึ่งมันจะได้ถึง 24 TFLOP/s 16-bit (half-precision) floating point performance.”
แล้วทำไมตัวเลขหรือรายละเอียดนี้ 16-bit TFLOP ไม่ปรากฏในภาพที่แสดงนี้? ง่ายมาก, เป็นเพราะ AI นั้นส่วนใหญ่จะใช้ 16-bit data. และข่าวลือที่ว่าก็ใกล้เคียงกับตัวหรือรุ่น MI25 ที่จะนำเสนอมาให้ใช้. VEGA สำหรับตลาดผู้บริโภคนั้นน่าจะเป็น 12.5 TFLOP ในรูปแบบ Single precision (fp32-bit) ในด้านประสิทธิภาพในการเล่นเกมส์. หากดูในเวอร์ชั่น reference ที่ทำ clocked ได้ในรุ่น GTX 1080 จะแรงที่ 9 TFLOPs และa GTX Titan X (Pascal) ก็จะไม่หนีหรือประมาณ 11 TFLOPS. และแน่นอน VEGA10 จะมาพร้อม HBM2 memory พร้อมกับ IO gateway รุ่นใหม่และ bandwith Cache ที่สูงและตัว controller/ควบคุม.
ภาพที่แสดงให้เห็นอยู่นี้ คุณจะเห็นได้ว่าประสิทธิภาพนั้นมันมหาศาลมาก, ทาง AMD นั้นคาดหวังเอาไว้สูงมาก. จะเห็นการเปรียบเทียบทางด้านประสิทธิภาพระหว่าง VEGA 10 กับ Nvidia Titan X Maxwell และ Pascal. แต่ถ้าจะเอาแบบสมน้ำสมเนื้อหน่อยก็คงจะเป็น Mi8 (Nano/Fury) กับ Titan X Pascal.
คราวนี้เราดูทางฝั่งของแหล่งข่าวที่ปล่อยออกมาบ้าง:
สำหรับฮาร์ดแวร์ตัวใหม่ๆที่กำลังจะออกมา, ทาง AMD ก็ประกาศเกี่ยวกับตัว MIOpen, ให้แบบฟรีๆ, เป็น open-source library หรือแหล่งข้อมูลสำหรับ GPU accelerators เพื่อให้ high-performance machine intelligence/คอมระดับอัจฉริยะนำไปใช้งาน, และไปเพิ่มประสิทธิภาพให้ deep learning frameworks บน AMD’s ROCm ตัวซอร์ฟแวร์เพื่อไปสร้างพื้นฐานใหม่ๆสำหรับการใช้งานหรือเปลี่ยนหรือปฏิวัติหน้าใหม่ต่อๆไปสำหรับ machine intelligence workloads.
Inexpensive high-capacity storage/ต้นทุนที่ถูกลงและขนาดที่ใหญ่ขึ้นทางด้านเก็บข้อมูล, an abundance of sensor driven data/และการตรวจสอบที่มีหลากหลายมากขึ้นสำหรับการโอนถ่ายข้อมูล, และ and the exponential growth of user-generated content are driving exabytes of data globally/และข้อมูลใหม่ๆที่เกิดขึ้นทั่วโลกที่มีขนาด exabytes ถ่ายโอนไปมา. และล่าสุดคอมที่มีความก้าวหน้าระดับสูงหรือ machine intelligence algorithms ที่เลือกใช้ GPUs ที่มีประสิทธิภาพที่สูงสามารถประมวลผลได้เร็วมากยิ่งขึ้นและเข้าถึงและเข้าใจข้อมูลได้เร็วมากขึ้น, สามารถปฏิบัติงานได้เกือบจะเรียกได้ว่า real time หรือทันทีทันใด. Radeon Instinct นี้เป็นตัวต้นแบบหรือ blueprint สำหรับ open software ecosystem สำหรับเครื่องหรือคอมอัจฉริยา/machine intelligence, สามารถขับเคลื่อนและผลักดันการประมวลผลให้เร็วมากยิ่งขึ้นไปอีกสำหรับ deep learning inference และ training.
“Radeon Instinct นี้สามารถกล่าวได้ว่าเป็นตัวช่วยให้ machine intelligence พัฒนาไปได้แบบก้าวกระโดด โดยอาศัย GPU accelerators ที่มีประสิทธิภาพที่สูง, และยังมาพร้อม open-source software ใน MIOpen และ ROCm,” กล่าวโดย AMD President และ CEO, Dr. Lisa Su ประธานบริษัท. “ด้วยเทคโนโลจีที่ผสมผสานกันของ ประสิทธิภาพทางด้านคำนวนที่สูงหรือ high-performance compute และความสามารถทางด้านกราฟฟิกของเราที่มีประสิทธิภาพที่สูงมากขึ้นนี้และโดยเฉพาะกับแผนโรดแมปของเราที่มีด้วยกันหลายระดับและตัวเลือกที่มี, สามารถกล่าวได้ว่าเราเป็นเพียงบริษัทเดียวที่เพรียบพร้อมและชำนาญทางด้าน GPU และ x86 silicon เพื่อที่จะมาตอบสนองความต้องการของลูกค้าอาทิเช่น datacenter และสิ่งใหม่ๆที่จะเกิดขึ้นอีกในอนาคตของ machine intelligence.”
งาน AMD Technology Summit เมื่ออาทิตย์ที่ผ่านมา, มีทั้งลูกค้าและคู่ค้ากว่า 1026 Labs/แลป, เช่นจาก Inventec, SuperMicro, University of Toronto’s CHIME radio telescope project และ Xilinx ต่างก็ยินดีถึงการมาของ Radeon Instinct, ได้ร่วมกันกล่าวถึงการใช้ประโยชน์ ณ วันนี้สำหรับตัว AMD’s machine intelligence และ deep learning technologies, และผลประโยชน์จากการที่จะใช้ Radeon Instinct ที่จะได้มา. Radeon Instinct accelerators มาพร้อม passive cooling/ระบบทำความเย็นแบบไม่มีส่วนเคลื่อนไหว, AMD MultiGPU (MxGPU) hardware virtualization technology/ตัวฮาร์ดแวร์ สอดคล้องกับหรือรองรับ SR-IOV (Single Root I/O Virtualization) เป็นมาตรฐานอุตสาหกรรม, และ 64-bit PCIe ที่มาพร้อม Base Address Register (BAR) เพื่อมาสนับสนุนสำหรับตัว multi-GPU ในรูปแบบ peer-to-peer (เครือข่ายแบบนี้จะเก็บไฟล์และการเชื่อมต่อกับอุปกรณ์ต่างๆ ไว้ที่เครื่องคอมพิวเตอร์ของผู้ใช้แต่ละคน โดยไม่มีคอมพิวเตอร์ส่วนกลางที่ทำหน้าที่นี้ เรียกได้ว่าต่างคนต่างเก็บ ต่างคนต่างใช้ แต่ผู้ใช้ในเครือข่ายสามารถเรียกใช้ไฟล์จากคอมพิวเตอร์เครื่องอื่นได้ ถ้าคอมพิวเตอร์เครื่องนั้นทำการแชร์ไฟล์เหล่านั้นไว้)
Radeon Instinct accelerators ออกแบบมาเพื่อตอบสนอง machine intelligence applications ได้หลายระดับและรุ่นดังต่อไปนี้:
Radeon Instinct MI6
Radeon Instinct MI6 accelerator นั้นมาจาก Polaris GPU architecture ตัวทำความเย็นเป็นแบบ passively cooled ค่าประมวลผลการคำนวนที่ 5.7 TFLOPS (FP16) เลี้ยงไฟจากบอร์ด 150W และมี 16GB ที่เป็น GPU memory
Radeon Instinct MI8
Radeon Instinct MI8 accelerator, มาจาก “Fiji” Nano GPU, เหมาะมากกับคอมรูปแบบ small form factor HPC และแรงได้ที่ 8.2 TFLOPS (FP16) ค่าพลังงานต่ำกว่า 175W ดึงไฟจากบอร์ดหรือ board power และมี 4GB ที่เป็น High-Bandwidth Memory (HBM).
Radeon Instinct MI25
Radeon Instinct MI25 accelerator มาจาก Vega GPU architecture และทำมาเพื่อ deep learning training, มาเพิ่มประสิทธิภาพทางด้านเวลาหรือ time-to-solution
open source solutions หรือตัวซอร์ฟแวร์ที่มีอยู่ใน Radeon Instinct hardware:
- MIOpen GPU-accelerated library/แหล่งหรือฐานข้อมูล: เพื่อมาช่วย machine intelligence ที่มีประสิทธิภาพที่สูงในการประมวลผล, สามารถเข้าถึงได้อิสระ/the free, open-source MIOpen GPU-accelerated library นี้คาดว่าจะมีมาให้ใช้ในไครมาสแรกของปี 2017 เพื่อให้ GPU-สามารถทำงานตัวมันเองได้ตามแบบอย่างที่เคยหรือตามมาตรฐานที่เป็นเช่น convolution/การผสมผสานทั้งสองสิ่งเพื่อเกิดสิ่งที่สามในด้านการคำนวน, pooling/แหล่งทรัพยากรณ์เช่น ฐานข้อมูล, activation functions/คำสั่งหรือชุดคำสั่ง เช่น “ON” (1) หรือ “OFF” (0) , normalization (เป็นวิธีการลดความซ้ำซ้อนของข้อมูลที่อาจเกิดขึ้นได้ มักใช้ในการออกแบบฐานข้อมูลที่เป็นแบบ Relational Database ซึ่งการทำ Normalization นี้จะช่วยให้ความซ้ำซ้อนของข้อมูลลดลง) และ tensor format
- ROCm deep learning frameworks: ROCm platform เป็นตัวช่วยเพิ่มประสิทธิภาพสำหรับ deep learning frameworks ที่นิยมกันเช่น Caffe, Torch 7, และ Tensorflow*, และยังช่วยให้โปรแกรมเมอร์สามารถที่จะมุ่งพัฒนาไปที่ training neural networks แทน แทนที่จะไปยุ่งกับ low-level performance tuning หรือการพัฒนาแบบธรรมดาๆ โดยผ่านหรือใช้ ROCm ที่มีเทคโนโลจีแบบผสมผสานที่เพรียบพร้อม. ROCm นั้นมีจุดมุ่งหวังที่จะเป็นโครงสร้างพื้นฐานในการพัฒนาเสริมสร้างให้มีการวิจัยและค้นคว้าเพื่อให้ก้าวไปสู่เทคโนโลจีที่ก้าวกระโดดโดยเฉพาะกับการแก้ปัญหาของ machine intelligence, ซึ่งเป็นส่วนหนึ่งในด้านการคำนวนแบบเชิงลึกและซับซ้อนเช่น linear algebra และ tensors และ open compiler และ language runtime.
ทาง AMD ตอนนี้กำลังลงทุนพัฒนาทางด้าน interconnect technologies ซึ่งก้าวหน้าไปมากกว่าปัจจุบันนี้มากสำหรับตัว PCIe Gen3 เพื่อให้มีประสิทธิภาพที่พร้อมสำหรับอนาคตและโดยเฉพาะกับ machine intelligence applications. AMD ยังได้ให้ความร่วมมืออีกหลายตัวทางด้าน open high-performance I/O standards ที่จะมาสนับสนุนการทำงานร่วมกับ broad ecosystem server CPU architectures ซึ่งก็รวมถึง X86, OpenPOWER, และ ARM AArch64. AMD ยังเป็นผู้ริเริ่ม CCIX/Cache Coherent Interconnect for Accelerators, Gen-Z และ OpenCAPI เพื่อไปให้ถึง 25 Gbit/s phi/เป็นสัญลักษณ์หรือหน่วยอย่างหนึ่ง ซึ่งจะมาช่วยทาง accelerator และ rack-level interconnects สำหรับ Radeon Instinct. Radeon Instinct คาดว่าน่าจะมาภายในครึ่งปีแรกของปี 2017.
หาข้อมูลรายละเอียดเพิ่มเติมได้ที่ Radeon.com/Instinct.
ที่มาเครดิต/Sources:
http://www.guru3d.com/news-story/amd-announces-radeon-instinct-including-vega-based-mi25-accelerator.html
You must be logged in to post a comment.