NVIDIA Pascal GP100 GPU จะเป็น 12 T-FLOPs (เป็นหน่วยวัดสมรรถนะในการทำงานของคอมพิวเตอร์) of Single Precision Compute, และ 4 T-FLOPs of Double Precision Compute Performance

NVIDIA Pascal GP100 GPU จะเป็น 12 T-FLOPs (เป็นหน่วยวัดสมรรถนะในการทำงานของคอมพิวเตอร์) of Single Precision Compute, และ 4 T-FLOPs of Double Precision Compute Performance

ในวันนี้ สิ่งที่วงการคอมพิวเตอร์จำจ้องการเคลื่อนอยู่ก็จะเป็น Pascal GPU โดยใช้ชื่อรหัสว่า GP100 ซึ่งจะเป็น chip เรือธงของทางบริษัทเลยที่เดียวที่จัดอยู่ในกลุ่มประเภทเดียวกัันของ Tesla, Quadro และ GeForce graphics cards. ตัว chip เป็นโครงสร้างจาก 16nm FinFET process ที่มีประสิทธิภาพด้านพลังงานที่ดีขึ้น และความสามารถที่เพิ่มขึ้นเมื่อเทียบกันแบบ วัตถ์ ต่อ วัตถ์  ส่วน  Pascal, ที่เป็น double precision compute นี้ซิเหนือขึ้นไปกว่าอีก ในด้านรุ่น Maxwell ที่เป็น processor รุ่นปัจจุบันของทาง NVIDIA’s ก็ไม่ได้น้อยหน้าไปกว่าใครหากวัด ความสามารถกันที่ วิตถ์ ต่อ วัตถ์

ในตอนนี้มีข่าวออกมาบางอย่างเกี่ยวกับ processors อาจจะมีการเปลี่ยนแปลงบางอย่างดังต่อไปนี้

  • Tesla: 0.5
  • Fermi: 2
  • Kepler: 5.5
  • Pascal: 14
  • Volta: 22

nene2ne3ne4

หากมาดูภาพด้านบนแล้วจะสังเกตุได้ว่า ในรุ่น Pascal จะเป็น GFLOPs ต่อ watt ส่วน Volta iจะเป็น  22 GFLOPs ต่อ watt. โดยในรูปบ่งบอกว่าทั้งสองรุ่นจะเป็น Dual Precision or DGEMM (Dual Precision Floating General Matrix Multiply) GFLOPS/Watt และไม่ใช่ single precision อ้างอิงถึงรุ่น Maxwell ที่ไม่ได้อยู่ในชาร์ต เป็นเพราะไม่ได้มีตัว FP64 hardware ประกอบอยู่ด้วย ในรุ่น Tesla K40X ที่ใช้โครงสร้างของ Kepler based นั้น Tesla K40X มาพร้อม  6.1 GFLOPs/W และเป็น dual-chip ส่วนด้าน Tesla K80X มาพร้อม 6.2 GFLOPs/W. ตัวของ Pascal คาดว่าน่าจะเป็น 14 GFLOPs/W ซึ่งเป็นสองเท่าของ Dual Precision GFLOPs/W.

ลองมาดูที่ Single Precision หรือ  SGEMM (Single precision floating General Matrix Multiply) GFLOPs/W มาพร้อม 42 GFLOPs/W สำหรับ for Pascal.ส่วน Maxwell มาพร้อม 23 GFLOPs/W ที่เป็น dual-chip ที่สามารถดันไปถึง  25 GFLOPs/W ส่วน  Volta มาพร้อม 73 GFLOPs/W. และหากสังเกตุเข้าไปอีก ในรูปแสดงให้เห็นว่า HGEMM (Half Precision floating General Matrix Multiply). เรารู้อยู่แล้ว Pascal และรุ่นอื่นๆที่จะตามมานั้น เป็น GPUs ที่มีการผสมผสานกันของ precision compute ที่จะสามารถเพิ่มประสิทธิภาพได้เป็น สองเท่า หากอยู่ในโหมด FP16 work loads หากเปรียบเทียบกับ FP32 ที่การทำงานหรือคำนวนผลที่ 16-bit ที่จะให้ความแม่นยำกว่า FP32. และในด้าน Maxwell ที่มี 26 half precision GFLOPs/W, ในตัว Pascal จะสามารถมาพร้อมได้ถึง 85 GFLOPs/W ส่วน Volta ก็จะเป็น 145 GFLOPs /W.

ne5

ne6

หากย้อนกลับมาดูชาร์ตของปี 2014 นี้นจะเห็นได้ว Pascal GPUs. ได้เปลี่ยนการออกแบบจาก HMC (Hybrid Memory Cube) based solutions ไปเป็น  HBM2 based solutions ในปี 2015

ในตัวต้นแแบบของ Pascal board นั้น จากที่เป็น HMC แล้วมาเปลี่ยนเป็นและมีตัว memory (HBM2) ที่เป็นส่วนประกอบอยู่ใน GPU die ในปี 2015 สามารถที่จะแสดงให้เห็นว่า ทาง NVIDIA กำลังที่จะให้มี HBM2 ร่วมอยู่ด้วย และเป็น 16nm GPU ที่จะอยู่ในตัว die เดียวกัน หรือ อาจจะใช้ตัวต้นแบบของ Fury cards จาก ทาง AMD ที่จะให้ GPU และ HBM chips อยู่เข้าด้วยกัน และจะกลายมาเป็นตัวต้นแบบที่เป็น SOC (system on Chip)

สิ่งที่น่าจะเป็นใน Nvidia’s flagship Pascal GP100 GPU :

  • Pascal graphics architecture.
  • มีประสิทธิภาพเป็น สองเท่า ต่อ watt ที่เหนือกว่า Maxwell.
  • ออกวางตลาดปี  2016, ช่วงท้ายของปี
  • DirectX 12 จะเป็นในระดับ 12_1 หรือมากกว่า
  • ใช้พื้นฐานออกแบบแบบเดียวกับตัว GM200 GPU ที่เจอใน GTX Titan X และ GTX 980 Ti.
  • สร้างบน 16nm FinFET และผลิตมาจาก TSMC.
  • มีตัว transistors ทั้งสิ้น 17 billion transistors มากกว่าสองเท่าของตัว GM200.
  • และจะมี 4-Hi HBM2 stacks, พร้อมด้วย  16GB ของตัว VRAM และ 8-Hi stacks พร้อมด้วย  32GB สำหรับ ระดับ professional compute SKUs.
  • มี 4096-bit memory bus interface เหมือนทาง AMD’s Fiji GPU power the Fury series.
  • มี NVLink (ที่จะรองรับได้เฉพาะ IBM PowerPC server processors ในรุ่นต่อไป)
  • รองรับ half precision FP16 compute ด้วยความเร็วสองเทา ของ full precision FP32.

ne7

ne8

ne9

We have seen several slides but there’s one from an independent researcher who’s also a CUDA fellow who posted the compute performance for several platforms in his presentation. อีกจุดที่น่าสังเกตุอีกก็คือ NVIDIA Pascal GPU ที่เป็นระบบ Stacked DRAM (1 TB/s) จะเป็น 4 TFLOPs of Double Precision (FP64) และ12 TFLOPs of Single Precision (FP32) compute performance นั้น หากดูในชาร์ตแล้ว จากปี 2014, หากมีการปล่อย Pascal GPUs ออกสู่ตลาดจนมาถึงรุ่นที่สอง ก้น่าจะมีมาอีกรุ่นคือ ตัว GPU ที่มีรหัสชื่อ Pascal-Solo  จากการสังเกตุแผนการทางตลาด  The Pascal-Solo GPU ที่มีเพียง  1 GPU และมี  235W TDP. และมี PCI-e ที่เป็นทั้ง Active/Passive cooling ที่จะให้เลือก options และคาดเอาไว้ว่าจะวางสู่ตลาดในปี 2016 เช่นกัน และจะตามด้วย ตัว Tesla GPU อีกหนึ่งรุ่น ที่จะมารองรับตลาด 3D ในปี  2016 ของไตรมาศที่ 2
ne10เป็นที่ไมน่าสงสัยเลยว่าสำหรับ  Pascal GPUs ที่จะมาพร้อมประสิทธิภาพที่เพิ่มมากขึ้น น่าจะอยู่ในตลาดเดียวกันกับ Tesla และ  Quadro markets. โดยในรุ่นใหม่ของโครงสร้างที่เป็น FinFET based graphics cards จะนำเสนอความสามารถที่มากและยังเป็นระบบที่สามารถเข้าหาหรือทำงานได้สะดวกมากยิ่งขึ้น  จะช่วยการทำงานที่สลับซ้อนที่มีมากขึ้น  HPC workloads ได้รวดเร็ว เราจะได้เห็นกันแน่ในงาน  GTC 2016 ที่กำลังจะมาถึง

ne11

ที่มาเครดิต wccftech.com

Related articles

แรมบัสสูง vs. แรม CL แน่น ๆ – จะประกอบคอมเล่นเกม ต้องใช้แรมบัสสูง ๆ จริงหรือไม่?

เรื่องตัวเลขความเร็วในวงการคอมพิวเตอร์มันเป็นของคู่กันนะครับ แต่ในอุปกรณ์บางอย่าง ความเร็วอาจไม่ใช่คำตอบเสมอไป และแรมก็เป็นหนึ่งในตัวอย่างที่เราไม่สามารถมองได้แค่ตัวเลขของความเร็วหรือบัสแรมเพียงอย่างเดียวครับ ทำไมเป็นอย่างนั้น ผมจะพาไปหาคำตอบครับ รายละเอียดของการทดสอบและผลทดสอบขอหยิบยกมาจากเว็บไซต์ Techspot ซึ่งได้มีการทดสอบประสิทธิภาพของแรม DDR5 ที่บัส 5600MHz,...

แอลจีเปิดตัวภาพยนตร์โฆษณาใหม่ “เทคโนโลยีที่เข้าใจคุณมากขึ้น” ภายใต้แนวคิด AI ความอัจฉริยะที่มีเสน่ห์

แอลจี อีเลคทรอนิคส์ (แอลจี) เปิดตัวภาพยนตร์โฆษณาใหม่ล่าสุดภายใต้แนวคิด “เทคโนโลยีที่เข้าใจคุณมากขึ้น” (Less Artificial, More Human)...

[Extreme History] – ELIZA แชตบ็อตนักบำบัด (จอมปลอม) สร้างขึ้นเพื่อทดสอบจิตใจมนุษย์

จากหัวเรื่องผมไม่ได้กล่าวเกินจริงแต่อย่างใด เพราะ ELIZA ถูกสร้างขึ้นมาเพื่อทดสอบจิตใจ (หลอกลวง) มนุษย์ ถึงขนาดทำให้นักจิตบำบัดยังหลงเชื่อว่ามันคือ AI ที่สามารถบำบัดจิตได้จริง...

“realme 14 Series 5G” X “Bacon Time” ผนึกกำลังทีมอีสปอร์ตระดับโลก เปิดตัว Performance Dominator คนใหม่ สัมผัสนวัตกรรมเกมมิ่งโฟนสุดยิ่งใหญ่ 27 มีนาคมนี้ พร้อมกัน!

realme (เรียลมี) แบรนด์เทคโนโลยีเพื่อคนรุ่นใหม่ที่เติบโตเร็วที่สุดในโลก ประกาศแผนกลยุทธ์ปี 2568 เดินหน้าสู่การเป็นสมาร์ตโฟนที่สมบูรณ์แบบทั้งในด้านประสิทธิภาพ ดีไซน์ และคุณภาพการใช้งาน ประกาศจับมือ...

ศัพท์การ์ดจอต้องรู้ – TDP, TGP และ TBP ตัวย่อบอกการใช้พลังงาน แต่ละอันคืออะไรกันนะ ??

ไม่ว่าใครที่เข้าวงการคอมพิวเตอร์มาทั้งหน้าเก่าและหน้าใหม่ น่าจะคุ้นเคยกับตัวย่อ TDP, TGP และ TBP โดยเฉพาะการ์ดจอ แต่ผมก็เชื่อว่ามีคนจำนวนไม่น้อยที่สงสัยว่าจริง ๆ...

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • เปิดใช้งานตลอด

บันทึกการตั้งค่า