เปรียบเทียบกันระหว่าง AMD Vega และ NVIDIA Pascal GP100 GPU

เปรียบเทียบกันระหว่าง AMD Vega และ NVIDIA Pascal GP100 GPU

 

สเป็คและรายละเอียดของ AMD Vega GPU นั้นได้หลุดออกมาแล้ว, ทำให้รับรู้ได้ว่าพลังการขับเคลื่อนในด้านการคำนวณในอนาคตมันจะแรงได้ขนาดไหน. อ้างอิงจากระบวนการผลิตหรือ FinFET architecture ณ ปัจจุบัน, ตัวชิปใหม่นี้น่าจะแข่งได้กับฝั่งเขียวได้อย่างสบายๆ. วันนี้, เราจะดูข้อเปรียบเทียบและประสิทธิภาพของทั้งฝ่ายแดงและเขียวไปพร้อมๆกัน.

สเป็คเปรียบเทียบของ Vega และ GP100

NVIDIA และ AMD ได้เปิดตัวสินค้าใหม่โดยใช้กรรมวิธีกระบวนการผลิตใหม่หรือ FinFET process nodes. ตัว GPUs ที่เราจะทำการเปรียบเทียบนี้ถือว่าเป็นรุ่นท๊อปของทั้งคู่และต่างก็มีเป้าหมายที่ตลาด HPC/High-performance computing. ยกตัวอย่างเช่น, Pascal GP100 GPU ออกสู่ตลาดตั้งแต่เดือน มิถุนายน 2016 แต่ ณ ตอนนี้ก็ยังไม่มีรุ่นจำหน่ายสำหรับตลาดทั่วไป. ส่วน AMD Vega GPU ที่กำลังจะออกมานั้นก็เช่นกันเน้นไปที่กลุ่ม HPC accelerator แต่ว่าจะมีรุ่นสำหรับตลาดทั่วไปในไตรมาสแรกปี 2017. เรามาดูกันว่าสเป็คของทั้ง  NVIDIA’s Pascal GP100 GPU และ AMD’s Vega GPU.

NVIDIA Pascal GP100 – ที่มาขับเคลื่อน Tesla P100 Accelerator – แรงได้ถึง 12 TFLOPs

Tesla P100 มาจาก Pascal GP100 GPU. และมีขนาด  FinFET GPU ที่ใหญ่ที่สุด ณ ปัจจุบันที่เคยสร้างกันมา, วัดขนาดได้  600mm2 (610mm2 แบบแป๊ะๆ). GP100 GPU เปิดตัวตั้งแต่งาน GTC 2016 และเริ่มทำตลาดตั้งแต่ มิถุนายน 2016. ตั้งแต่นั้นมา, ทาง NVIDIA ได้ส่ง DGX-1 units หลายตัวเพื่อนำไปใช้กับ Tesla P100 cards ให้กลุ่ม HPC / Datacenter customers/ศูนย์ข้อมูล. Tesla P100 accelerators ยังใช้ใน NVIDIA’s DGX SaturnV super-computer ซึ่งนำมาออกแบบและใช้ในรถอัจฉริยะหรือ smarter cars และกับ GPUs รุ่นต่อๆไป. และประสิทธิภาพของมันดีเยี่ยมในระดับ super computer ใน 500 อันดับที่ดีที่สุด.

ซึ่งก็เหมือนกับ Tesla GPUs ในรุ่นที่แล้ว, GP100 นั้นจะประกอบไปด้วย Graphics Processing Clusters (GPCs)/เป็นแถวๆ, Streaming Multiprocessors (SMs), และ memory controllers. ตัวชิปนั้นมีพลังมหาศาลเนื่องจากมี GPCs ถึงหกชุด, SMs มากถึง 60 ชุด, และมี 512-bit memory controllers แปดชุด (เท่ากับจำนวนเต็ม 4096 bits).

Pascal architecture ประสิทธิภาพทางด้านคำนวณนั้นแรงกว่าที่หลายคนคิดกันเอาไว้: ประสิทธิภาพที่มีมากขึ้นนี้ได้จากการเพิ่ม SMs มากขึ้นกว่า GPUs รุ่นที่แล้วๆมา, แต่การที่จะทำให้แต่ละชุดของ SM นั้นมาพร้อมการใช้พลังงานอย่างมีประสิทธิภาพที่มากขึ้น. แต่ละ SM จะมี 64 CUDA cores และ texture units สี่ชุด, ทั้งหมดก็เป็น 3840 CUDA cores และ 240 texture units. SM units เหล่านี้จะถูกเรียงเข้าไปใน 32 TPCs ซึ่งจะประกอบไปด้วย SMs สองชุด.

NVIDIA Pascal GP100 ที่อยู่ใน Tesla P100 นั้นยังแค่เด็กๆหรือเริ่มต้นเท่านั้น

เพราะว่าด้วยความสำคัญของ high-precision computation for technical computing/เทคโนโลจีทางด้านการประมวลผลการคำนวณแบบแม่นยำสูงและ HPC codes, เป็นกุญแจสำคัญในการออกแบบสำหรับ Tesla P100 เป็น high double-precision performance. ในแต่ละ GP100 SM มี 32 FP64 units, ซี่งจะมีค่าเฉลี่ย 2:1 ratio ในรูปแบบ single- to/ไปเป็น double-precision. เมื่อเปรียบเทียบกับ 3:1 ratio ใน Kepler GK110 GPUs, ซึ่งจะทำให้ Tesla P100 สามารถกระทำหรือประมวลผล FP64 workloads ได้อย่างมีประสิทธิภาพมากยิ่งขึ้น. Pascal architecture ยังสามารถประมวลผลในรูปแบบ half precision compute ได้เป็นสองเท่าในด้านความเร็วหากเทียบกับ single precision และ INT8/ตัวแปร สามารถกระทำได้เร็วเป็นสีเท่า.

ตัว GPU นั้นยังมาพร้อม HBM2 memory อีกสี่ชั้นหรือ stacks. เพราะฉนั้นจำนวนของ VRAM บนชิปตัวนี้ก็จะเป็น 16 GB ซึ่งจะถูกอัพเกรดเป็น 32 GB หาก HBM2 นั้นได้เข้าสู่สายพานผลิตในปี 2017. ตัวชิปมี 720 GB/s bandwidth. ตอนนี้ Tesla P100 ยังคงเป็นรุ่นที่สดทอนลงมาสำหรับ GP100 chip แต่รุ่นเต็มๆจะออกมาพร้อมกับทาง AMD ที่จะนำ Vega ทำตลาดในเวลาเดียวกัน.

P100 นั้นมีค่าการคำนวณที่ 5.3 TF (FP64), 10.6 TF (FP32), 21.2 TF (FP16). และในรุ่นเต็มๆของ GP100 สามารถกระโดดไปได้มากกว่า 24 TF (HP), 12 TF (SP) และ 6.0 TF (DP) ในด้านการคำนวณ/compute performance (ขึ้นอยู่กับ clock speeds). NVIDIA GP102 GPU ที่เป็น GP100 ที่ไม่ได้เกี่ยวข้องกับหรือไม่ใช้ NVLINK หรือ Dual Precision hardware จะมีปริมาณงานต่อหน่วยที่ 12 TFLOPs บน Quadro P6000 solution.

GP102 GPU ถูกออกแบบออกมาเพื่อใช้ในระดับมืออาชีพหรือผู้ที่ชอบของแรง ซึ่งจะไม่เกี่ยวข้องกับในระดับ AI / Deep learning / Data Center เลย คนละเป้าหมาย. GP100 ต่างหากที่ใช่และเราจะได้เห็น GP100 solution ที่จะออกแบบมาได้เร็วกว่านี้เพื่อประโยชน์ทางกลุ่ม AI ส่วน GP102 หรือ GP104 อันนี้ต่างหากที่เป็นตัวเล่นหลักใน HPC market.

สเป็ค AMD Vega 10  – เป็นตัวขับเคลื่อน Instinct MI25 Accelerator – แรงได้ถึง 12.5 TFLOPs

AMD Vega 10 GPU นั้นแรงสุดในด้านการคำนวณที่ 12.5 TFLOPs ในรูปแบบ single precision mode. และยังสามารถทวีคูณขึ้นไปสองเท่าหรือแบบ mixed precision compute performance หรือประสิทธิภาพการคำนวณแบบผสมไปที่ 25 TFLOPs. เราคาดเดาได้ว่าชิปตัวนี้ก็มีแบบ dual precision performance ที่ 6.25 TFLOPs หากมันมีค่าเฉลี่ยที่ 2:1 ratio จาก single- to/ไปเป็น double-precision ในปริมาณงานต่อหน่วยเหมือนกับทางคู่แข่ง.

ตัวแรกที่ใช้ชิปตัวนี้ก็คือ Instinct MI25 HPC accelerator. AMD ได้เพิ่มเทคโนโลจีอีกหลายอย่างเช่น NCU หรือ “Next Compute Unit”. และยังไปเพิ่มตรงส่วนของ high band width cache และ controller/ควบคุมอีก. ตัวการ์ดนั้นใช้พลังงานต่ำกว่า 300W ซึ่งต่ำกว่า P100.

ตัวสินค้าที่ดูอยู่ตอนนี้มี่ memory bandwidth ที่ 512 GB/s บน HBM2 interface. ซึ่งเรากำลังเห็น 2048-bit memory bus (2 HBM2 stacks) ที่ 1000 MHz หรือ 4096-bit memory bus (4 HBM2 stacks) ที่ 500 MHz. ความจุตัวการ์ดนั้น 16 GB และแน่นอนจะต้องใช้ second generation high-bandwidth memory interface หรือ HBM2 .

มีข่าวลือออกมาว่าจำนวนของแกนและ clock speed บน MI25 Vega GPU card. ทาง Videocardz นั้นมีตารางตัวเลขโชว์เอาไว้อยู่ซึ่งอาจจะเป็นไปได้ก็ได้. หากจำนวนแกนมีอยู่ที่ 4096 SPs ที่เป็น Vega GPU ความเร็ว clocked น่าจะอยู่ที่ 1.5 GHz เพื่อสามารถทำการประมวลผลทางด้านการคำนวณได้อย่างมีประสิทธิภาพ. ก็เหมือนกับ, 5000 cores/แกน ที่ทำ clocked ที่1.25 GHz และ 6250 cores ที่่ 1.00 GHz ก็จะได้ประสิทธิภาพที่พอๆกันออกมา. ตัวการ์ดเป็นแบบ passively cooled และดึงไฟด้วยกันถึงสองชุดหรือ power inputs (8+6 Pin?).

การเปรียบเทียบระหว่าง AMD Vega GPU และ NVIDIA Pascal GP100 GPU

คราวนี้มาดูการเปรียบเทียบของชิปท้้งคู่ ซึ่งครั้งนี้จะไม่ใชเฉพาะตัวฮาร์ดแวร์อย่างเดียวแต่จะลงไปถึงตัวซอร์ฟแวร์ด้วย . ตัวซรอร์ฟแวร์นั้นสามารถกล่าวได้ว่่ามีความสำคัญไม่น้อยไปกว่าตัวฮาร์ดแวร์ในตลาดของ deep learning เช่นกัน. ทาง NVIDIA นั้นมี cuDNN (Libraries + Frameworks) ออกแบบมาเพื่อตลาด deep neural learning และทาง AMD ก็มีวิธีของตัวเองเช่นกันหรือตัว MIOpen จาก ROCmSoftware. ทาง AMD ได้แสดงประสิทธิภาพของตัว MI25 ซึ่งแรงได้เป็นสองเท่าหากเทียบกับ Titan X (Maxwell) graphics card และยังเร็วกว่า Titan X (Pascal) รุ่นใหม่อีกด้วย.

เป็นอะไรที่เข้าใจได้ดีว่าตัวซอร์ฟแวร์นี้หรือตัวข้อมูลนี้มันขัดเกลาได้ดีสำหรับ Instinct cards ก็จะเหมือนกับทาง cuDNN ที่จะทำงานเข้ากับ NVIDIA cards ได้ดีเช่นกัน. เหตุผลที่ทางเราไม่กล่าวถึงประสิทธิภาพทางด้านเล่นเกมส์เพราะการ์ดเหล่านี้ถูกออกแบบมาเพื่อตลาด HPC. และทาง AMD ยังไม่ได้นำเอามาเปรียบเทียบกับทาง NVIDIA’s GP100 GPU ในด้านประสิทธิภาพ ซึ่งเป็นคู่แข่งที่เหมาะสมและโดยตรงกับ Vega.

อย่างที่กล่าวไปข้าง, GP102 ก็คือ GP100 นั้นถูกออกแบบมาเพื่อตลาดทั่วไปโดยเฉพาะ. ทาง AMD ได้ออกมาโชว์อ๊อฟตัว 8 GB Vega GPU ที่งานของ AMD tech Summit 2016 ซึ่งสามารถหารายละเอียดได้จากที่นี้ here. อันนีันมันคนละตัวกันกับที่กำลังกล่าวถึงทั้งสองชิปนี้. ข้อมูลและรายละเอียดสามารถดูได้จากตารางด้านล่างนี้:

AMD Vega Instinct Graphics Card จะเป็น FirePro S Series ตัวใหม่

AMD Vega GPU ที่ถูกนำมาโชว์นี้ข้างในของ Instinct MI25 นั้นมีประสิทธิภาพทางด้านกราฟฟิกมหาศาล. ซึ่งจะเป็นคนละแนวกับทาง NVIDIA ที่เลือกเอา GP100/GP102 มาเล่น, ทาง AMD นั้นใช้ Vega chip ตัวเดียวกันมาเล่นทั้งสองตลาด HPC และตลาดทั่วไป. เหตุผลเพราะว่าทาง AMD นั้นไม่มีทรัพยากรที่พอหรือกล่าวตรงๆก็คือไม่มีเงินมากพอเพื่อจะออกแบบออกมาเพื่อตลาด high-end chip โดยเฉพาะสำหรับตลาด HPC ส่วนทาง NVIDIA นั้นเงินเต็มกระเป๋าสามารถออกแบบแยกแยะแบบตรงๆเลยทั้งชิปของตลาดทั่วไปและตลาด HPC.

NVIDIA GP102 ที่เป็น P6000 นี้แหละคือรุ่น unlocked GP100 แบบจัดเต็ม. มันสามารถกระโดดเข้าไปและแรงได้แบบ AMD’s Vega GPU ได้ไม่ยาก แต่ทางเราก็ยังไม่รู้แน่ชัดว่า MI25 นั้นจะเป็นรุ่น Vega 10 chip แบบมาเต็มๆไม่ลดทอนหรือไม่หรือจะมาสไตล์เดียวกันกับ Tesla P100. หากเป็นเช่นนั้นจริง, ในรุ่นเต็มหรือ full Vega 10 chip นั้นก็สามารถเร็วได้มากกว่านี้. Pascal นั้นออกตัวมาตั้งแต่ไตรมาสที่สองปี 2016, ส่วน Vega จะเปิดตัวจริงๆสำหรับ HPC ก็น่าจะเป็นครึ่งปีแรกของ 2017 และเวลานั้นแหละจะมันมากระหว่างคู่ชกที่ต่างก็ไม่ยอมซึ่งกันและกัน. ทาง AMD อาจจะแข่งทางด้านราคาสำหรับตัว Vega 10 กับ GP100 ในตลาด HPC market เหมือนกับที่เคยทำกับ Polaris กับตลาดทั่วไป.

ตอนนี้ทาง AMD ก็เผชิญกับปัญหาเดียวกันของ HBM2 ที่ผลิตออกมาไม่พอแบบเดียวกันกับฝั่งเขียว. NVIDIA cards นั้นสามารถทำได้ 720 GB/s ส่วนทาง AMD cards นั้นได้แค่ 512 GB/s กับตัว HBM2 interface ซึ่งต่ำกว่าที่เคยยืนยันเอาไว้ที่ 1 TB/s. NVIDIA นั้นใช้ชิปทาง Samsung ส่วนทาง AMD นั้นใช้ของ SK Hynix. สิ่งหนึ่งที่ทำให้ HBM2 ออกมาล่าช้าในตลาดผู้บริโภคทั่วไปเพราะมีการผลิตที่ไม่เพียงพอแต่ตอนนี้ดูเหมือนกำลังจะตามทันแล้ว. ซึ่งก็จะทำให้ทาง AMD สามารถเปิดตัว Vega พร้อมกับ HBM2 memory ไม่น่าเกินครึ่งปีแรกของปี 2017 สำหรับตลาดทั่วไป.

AMD Radeon Pro SSG พร้อมกับ Vega GPU จะมีมาแน่ปีหน้า

นอกเหนือไปจากตัว Instinct MI25 และสำหรับตลาดทั่วไปกับตัว Vega graphics card แล้ว, ทาง AMD ยังมีอีกรุ่นที่จะเปิดโชว์ Radeon Pro SSG. เมื่อครั้งที่แล้วทาง AMD ได้ออกมาโชว์ให้เห็นกันแล้วสำหรับ Radeon Pro SSG, ซึ่งจริงๆมันก็มาจาก Fiji GPU. ส่วนล่าสุดเห็นว่าเปลี่ยนไปเป็น Vega GPU ซึ่งยืนยันแล้วว่าทาง AMD กำลังวางแผนให้กับ Pro SSG cards อีกยาวๆ. รายละเอียดเพิ่มเติมได้ที่นี้ here.

สิ่งหนึ่งที่น่าประหลาดใจก็คือทาง AMD ได้ออกมาโชว์สินค้าที่เกี่ยวกับ server racks ตามรูปด้านล่าง ซึ่งใช้ Instinct MI25 GPU, ออกแบบโดยคู่ค้าของทางบริษัท. ตัว racks หรือชั้นนี้มีประสิทธิภาพตั้งแต่ 100 TFLOP (4 Instinct MI25) จนถึง 3 PetaFlops (120 Instinct MI25) server accelerator units.

AMD Vega 10 พร้อมด้วย 8 GB HBM2 – ยืนยันแล้วว่า Device ID หรือรหัสสินค้าเป็น “687F:C1”

สำหรับใครที่กำลังงงอยู่ว่า เลขรหัสนี้ 687F:C1 คืออะไร ได้มีการเปิดเผยใน AOTS database เมื่อไม่กี่อาทิตย์ที่ผ่านมานี้เอง, มันเป็น graphics card จาก Vega 10 GPU. ซึ่งจริงๆแล้วก็เป็นการ์ดตัวเดียวกันนี้แหละที่โชว์ในงาน AMD’s demo PC ที่ Tech Summit conference. รุ่นนี้มี 8 GB ที่เป็น HBM2 aและดูเหมือนจะพุ่งเป้าไปที่ desktop PCs มากกว่าตลาด HPC. และไม่แน่การ์ดจอตัวนี้อาจจะแรงพอๆกับ GeForce GTX 1080 แต่ตัวไดรฟเวอร์ยังไม่เห็นวี่แวว.

ทางเราหวังเอาไว้ว่าจะได้ข้อมูลรายละเอียดเพิ่มเติมได้มากกว่านี้สำหรับ AMD’s Zen และ Vega GPUs, โดยเฉพาะกับรุ่น desktop PCs ซึ่งแน่นอนต้องมีให้เห็นในงาน “New Horizon” แน่นอน.

ที่มาเครดิต/Sources:

http://wccftech.com/amd-vega-gpu-nvidia-pascal-gp100-gpu-comparison/

Related articles

Qualcomm งานเข้า !! อาจโดนห้ามขายชิปตระกูล Snapdragon Elite

arm ประกาศจะยกเลิกไลเซนส์ที่อนุญาตการปรับแต่งชิปของ Qualcomm ภายใน 60 วันนี้ หากยกเลิกแล้ว จะกระทบชิป Snapdragon...

บิทคับ กรุ๊ป จัดใหญ่ BITKUB SUMMIT 2024 ก้าวสู่อนาคตแห่งเทคโนโลยีการเงินดิจิทัล คนร่วมคึกคักกว่า 10,000 คน

บริษัท บิทคับ แคปปิตอล กรุ๊ป โฮลดิ้งส์ จำกัด ผู้นำด้านเทคโนโลยีบล็อกเชนและสินทรัพย์ดิจิทัลของไทย จัดงานสัมมนาระดับประเทศ "BITKUB...

เลือกซื้อ “ซิลิโคน” ทา CPU เว็บนี้ช่วยได้ เปรียบเทียบข้อดี-ข้อเสียแบบโคตรละเอียด !!

ใครมีปัญหาในการเลือกซื้อ "ซิลิโคน" (Thermal Paste) ไม่รู้จะเลือกซื้อตัวไหนดีมันมีให้เลือกเยอะ ผมมีเว็บไซต์แนะนำมาฝาก ให้เราเปรียบเทียบซิลิโคนแต่ละตัวได้ง่ายขึ้น และเลือกซื้อตัวที่ดีที่สุดมาใช้กันแบบสบายใจ Igor's Lab...

Extreme History: ATi เคยชนะ NVIDIA ด้วยนะ รู้หรือไม่ตอนนั้นเกิดอะไรขึ้น !!

ตลอดเวลา 20 ปี การ์ดจอ NVIDIA ครองส่วนแบ่งการตลาดการ์ดจอมาโดยตลอด เราเห็นจากกราฟได้เลยว่าค่ายแดง AMD/ATi ไม่สามารถสู้ได้เลย แต่ถ้าย้อนกลับไปช่วงต้นปี...

รีวิวสอบ CompTIA CySA+ เกือบหลับแต่กลับมาได้ พร้อมแชร์แหล่งเรียนรู้ ใครอยากสอบต้องดู

ก่อนหน้านี้ผมเคยสอบ CompTIA Security+ ไปแล้ว (ย้อนอ่านได้ที่ ลิงก์นี้) ด้วยความที่สนใจสาย Blue Team...

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • เปิดใช้งานตลอด

บันทึกการตั้งค่า