ข่าวอย่างเป็นทางการตัว NVIDIA GeForce GTX 1080 เกี่ยวกับ– Async Compute, SMTP และลูกเล่นอื่นๆที่เด่นๆ
การทำรีวิวตัว NVIDIA GeForce GTX 1080 จะตามมาเรื่อยๆกับการเปิดตัวในวันทที่ 27 พฤษภาคม ที่จะถึงนี้ ตัว GeForce GTX 1080 จะวางจำหน่ายทั่วโลกทั้งแบบ reference และ non-reference การ์ด. โดยทาง NVIDIA ได้ตั้งราคารุ่น Founders Edition อยู่ที่ $699 US ส่วนรุ่น non-reference ราคาจะเริ่มอยู่ที่ $599 US. NVIDIA GeForce GTX 1080 นั้นจะมีราคาที่แพงกว่า GTX 980 ถึง $50 ตอนช่วงเปิดตัว และ ถูกกว่า $50 กับตัว GeForce GTX 980 Ti แต่ประสิทธิภาพที่ได้มานั้นดีกว่าทั้ง GTX Titan X และ GTX 980 ที่เป็นระบบ SLI.
ประสิทธิภาพที่เพิ่มขึ้นมาอย่างก้าวกระโดดนี้ไม่ใช่แค่เพียงได้ตัวชิพเซ็ตใหม่เท่านั้น (FinFET process) แต่ด้วยโครงสร้างการออกแบบใหม่ของตัวสถาปัตยกรรม/architecture นี้ด้วย. GeForce 10 series cards ได้ใช้ NVIDIA’s Pascal architecture มาขับเคลื่อนตัวการ์ดจออยู่ก็หลายรุ่นด้วยกัน เช่น GP100, GP106 และมาตอนนี้ก็มีมาเพิ่ม GP104. NVIDIA GP104 GPUs จะเป็นสายพันธ์แรกที่จะมาขับเคลื่อนตัวการ์ดจอเพื่อมาตอนสนองความต้องการของผู้ที่ชื่นชอบความแรงเป็นพื้นฐานด้วย NVIDIA GPU architecture รุ่นใหม่นี้
รายละเอียดของ NVIDIA GP104 GPU Block Diagram/แผนผังความต่อเนื่องอย่างละเอียด – มีตัวไดซ์ขนาด 314mm2 เป็นตัวขับเคลื่อน GeForce 10 Series Graphics Cards
NVIDIA GeForce 10 series graphics cards ขับเคลื่อนด้วย Pascal GPU หรือเรียกอีกอย่างว่า GP104. ตัว GPU มี SKUs อยู่หลายรูปแบบที่เป็นส่วนประกอบอยู่ในการ์ดจอของแต่ละรุ่น GP104 GPU มีส่วนประกอบของ transistors จำนวนทั้งหมด 7.2 Billion และมี 2560 CUDA cores. ด้วยการออกแบบมาลักษณะนี้สามารถทำให้มีส่วนประกอบของแกน 128 cores ต่อ/per streaming multiprocessor ซึ่งเทียบเท่ากับตัว GM204 แต่เมื่อเปรียบเทียบกับตัว GP100 GPU จะไม่เหมือนกันเพราะว่ามีแค่ 64 CUDA Cores ต่อ/per SM unit
คราวนี้มาดูรายละเอียดปลีกย่ยอของแผนผัง ตัว GP104 block diagram, จะเห็นได้วามี graphics processing clusters/การประมวลผลทางกราฟฟิก 4 กลุ่มด้วยกันใน GP104 GPU. แต่ละ GPC มี 5 streaming multiprocessor units. ตัว streaming multi processor units มีจำนวนแกน 128 cores, 8 ROPs และแต่ละ GPC ของการคำนวณมี 16 TMUs/texture mapping unit/จำนวนหน่วยควบคุมการสร้างโพลิกอน ของทั้งหมด ทั้งหมดนี้จึงมาเป็นจำนวนแกน 2560 CUDA cores, 160 TMUs และ 64 ROPs/Render Output Units/ขั้นตอนสุดท้ายของการจ่ายภาพ ที่เป็นองค์ประกอบทั้งหมดบน chip. มี memory controllers ทั้งหมด 8 ตัว แตละตัวมี 32-bit ที่อยู่ในการ์ดจอที่จะมาขับเคลื่อน GDDR5 และ GDDR5X memory
รุ่นที่ดีที่สุดของ GP104 GPU สามารถทำความเร็วในด้านคำนวณได้ที่ 9 TFLOPs ของการตั้งค่าหรือเซ็ตค่าแบบปรกติ/stock configuration. ตัววงจรทั้งหมดถูกติดตั้งบนไดซ์ขนาด 314mm2 die size ซึ่งเป็นที่น่าทึ่งมาก เพราะได้มาทั้งประสิทธิภาพและขีดความสามารถทางด้านประหยัดพลังงาน หากเปรียบเทียบกับตัวการ์ดจอรุ่น Titan X ซึ่งสร้างอยู่บนฐานขนาด 601mm2 die และมีจำนวน transistors อยู่ถึง 8 Billion transistors. ความหนาแน่นของตัว transistor นั้น หากมองดูกันที่ ตารางมิลลิเมตรนั้น จาก 10 million กระโดดไปถึง 23 million ต่อตารางมิลลิเมตรเลยทีเดียว
รายละเอียดทางเทคนิคของ NVIDIA GeForce GTX 1080 อย่างเป็นทางการ – 8 GB GDDR5X, 2560 Cores, 180W TDP และระบบทำความเย็น
NVIDIA GeForce GTX 1080 ใช้ GP104-400-A1 GPU เป็นตัวขับเคลื่อน มีตัว transistors ทั้งหมด 7.2 Billion ตัว GPU มี 2560 CUDA cores, 160 Texture Mapping Units และ 64 Raster Operation Units. ตัวการ์ดสามารถทำ clock ได้ที่ 1604 MHz และ 1733 MHz และแตะระดับความเร็วการคำนวณที่ 9 TFLOPs ในรูปแบบ single precision compute performance และยังสามารถทำ boost clockได้เร็วมากกว่านี้ โดยใช้ GPU Boost 3.0 algorithm รุ่นใหม่่
ตัว NVIDIA GPU Boost 3.0 สามารถดึงพลังออกมาได้เต็มที่เล่นกันแบบวัตท์ต่อวัตท์เลยที่เดียว ประโยชน์ที่ได้ก็คือความเร็วทางด้าน clock speeds นั้นสามารถทำได้มากกว่าการตั้งค่าแบบปรกติได้มากกว่าการ์ดจอที่ทำ boost clocks เสียอีก ( reference boost clocks). ตัว GPU หากมองกันตามทฤษฎีแล้ว สามารถ boost ได้เพิ่มถึง 2 GHz โดยการทำ overclock ด้วยวิธีแบบเดียวกันนี้ (ดูรูปด้านล่าง)
NVIDIA มี 8 GB ที่เป็น GDDR5X memory ประกอบอยู่ในตัว GeForce GTX 1080 graphics card. ตัว GDDR memory รุ่นใหม่นี้ทำความเร็วได้ที่ 10 GB/s คงที่พร้อมด้วยกับตัว 256-bit bus. และค่า bandwidth ได้ที่ 320 GB/s. ตัวการ์ดมีค่าความเร็วพิกเซลที่ 102.8 GPixels/s และค่า texture อยู่ที่ 257.1 GTexels/s. ค่าพลังงานใช้อยู่ที่ 180W TDP ซึ่งอาศัยเพียง 8-Pin connector เพียงเส้นเดียว. Display outputs ก็มี 3 Display Port 1.4a, HDMI 2.0b และ DVI-D port.
หากกล่าวถึงขีดความสามารถของทางด้านจ่ายภาพ GeForce GTX 1080 สามารถทำได้ถึง 6 จอภาพในเวลาเดียวกันด้วยความละเอียดที่ 7680×4320 อยู่ที่ 60 Hz. ตัวการ์ดมี H.264 Encode/รหัส(2x 4K @ 60 Hz)/Decode/ถอดรหัส (2x 4K @ 120 Hz up 240 Mbps) , HEVC Encode (2x 4K @ 60 Hz)/ Decode (2x 4K @ 120 Hz / 8K @ 30 Hz up 320 Mbps), 10-bit HEVC Encode และ HEVC 10-bit Decode และ VP9 Decode. ตัวการ์ดจอรุ่นใหม่นี้ยังรองรับระบบ HDR compliant และยังสามารถจ่ายภาพไปยังเครื่องรับภาพที่เป็นระบบ HDR ด้วย gamestream technology
รายละเอียดปลีกย่อยของ NVIDIA GeForce 10 Series “Pascal”
คราวนี้จะกล่าวถึงการทำงานของระบบ Async compute ใน NVIDIA’s Pascal architecture และ Pascal’s dynamic load balancing system
NVIDIA Pascal GeForce 10 Series – Async Compute / Preemption/หยุดชั่วคราวและแทรกแซง (Pixel/Instruction Level):
เรื่มแรก, ทาง NVIDIA ได้กล่าวถึง Asynchronous compute ในงานเปิดตัวซึ่งดูแล้วลูกเล่นนี้เหมือนกับตัว DirectX 12 API. ซึ่ง GeForce 10 series cards จะใช้ Async compute กับ applications หลายชนิดด้วยกันที่รวมถึง Physics, VR และ post processing/ปรับปรุงแก้ไขรูปให้ดียิ่งขึ้นในด้าน ความลึก/แสงจ้า/คมชัด ของภาพ
ด้วยลูกเล่นใหม่นี้จะทำให้ทาง NVIDIA สามารถนำขีดความสามารถทางด้านการคำนวณของตัว Pascal chips ไปใช้ได้หลายด้านด้วยกัน ซึ่งตัว Async compute นั้นจะสามารถมีผลต่อกับตัว architecture ใหม่นี้ในด้านประสิทธิภาพได้มากขนาดไหนโดยเฉพาะในด้านเกมส์ เรามาดูพร้อมกันในบทความนี้
ทาง NVIDIA ลงทุนในการพัฒนาเทคนิคทางด้าน preemption techniques/แทรกแซง ในตัว Pascal สำหรับ VR อยู่ไม่น้อย . Preemption ใน VR นั้นสามารถทำให้การดีเลย์นั้นดีมากขึ้น/latency, ความเร็วดีขึ้นและเวลาที่ไม่ต่อเนื่องทำได้ดีต่อเนื่องขึ้นใน VR titles. ทาง NVIDIA เรียกวิธีนี้ว่า first Pixel-level graphics preemption ซึ่งจะทำให้ตัวต้นทางกราฟฟิกสามารถแทรกแซง command buffer, pixels และ triangles. ตัว Pixel level graphics และ thread level compute preemption ก็จะให้ sub-100us preemption ในเกมส์ ส่วน instruction level compute preemption จะมีประสิทธิภาพที่เพิ่มขึ้นในด้านงานคำนวณทั่วไป
NVIDIA Pascal GeForce 10 Series – Dynamic Load Balancing:
อีกลูกเล่นหนึ่งที่มีส่วนเกี่ยวข้องโดยตรงกับ Async compute ก็คือ Pascal’s dynamic load balancing system. โดยปรกติแล้ว ตัวต้นน้ำ/ทรัพยากรของ GPU resources เช่นตัวกราฟฟิกและคำนวณจะนำมาใช้ที่แตกต่างกัน ตัวกราฟฟิก สามารถทำงานและถ่ายโอนได้เร็วกว่าชนิดแบบไม่เหลืออะไรที่คั่งค้างเอาไว้ แต่ การคำนวณนั้นจะช้ากว่าๆที่จะนำไปใช้หมดหรือแม้กระทั้งการถ่ายโอนตัวกราฟฟิกถูกนำไปใช้หมดแล้วแต่ทางคำนวณก็ยังหลงเหลืออยู่
Dynamic balancing สามารถทำให้การคำนวณนั้นถูกนำไปใช้ได้อย่างเต็มที่หลังจากที่ตัวกราฟฟิกนั้นจบงานไปแล้ว ด้วยวิธีนี้สามารถทำให้ตัว GPU ทำงานมีประสิทธิภาพดียิ่งขึ้นในด้าน applications และจะไม่มีช่องว่างหรือพื้นที่ว่างเปล่าให้เสียของอีกต่อไป คำตอบก็คือทำให้ กราฟฟิกและการคำนวณสามารถทำเวลาได้ระยะพอๆกันหหรือเทียบเท่า
NVIDIA Pascal GeForce 10 Series – Simultaneous Multi-Projection:
เทคนิคทางด้าน Simultaneous Multi-Projection ตัวการ์ดจอจะสามารถทำหน้าที่ได้อย่างเต็มที่ในระบบ VR applications ได้โดยการมุ่งเน้นไปที่การจ่ายภาพหรือเนื้อหาที่ผู้ใช้จะได้รับรู้หรือเห็นดีกว่าที่จะรักษาหรือหน่วงประสิทธิภาพหรือขีดความสามารถเอาไว้
คราวนี้มาดูตัว Oculus Rift สามารถจ่ายภาพออกมาได้ละเอียดที่ 4.2 MPixels แต่ไม่ใช่ต่อข้าง (ตาทั้งคู่) SMTP renders สามารถจ่ายภาพอย่างต่อเนื่องได้ที่ 2.8 MPixels ซึ่งใช้ขีดความสามารถที่เหลือปัจจุบันจากที่กล่าวมาข้างต้น เพื่อมาขับดันประสิทธิภาพในด้านภาพต่อเฟรมให้ได้เร็วยิ่งขึ้นในการมองเห็น SMTP ยังสามารถสร้างภาพหรือให้ภาพที่เป็นรูปร่างหรือสิ่งแดวล้อมของภาพได้เร็วเป็น 2 เท่า โดยการคำนวณและสร้างไดเมนชั่นของภาพก่อนที่จะจ่ายออกไป ทั้งหมดนี้จึงมาซึ่ง ประสิทธิที่ทำงานได้ดีขึ้นด้วยศักยภาพใหม่ของตัว Pascal พร้อมกับนวัตกรรมและความคิดโครงสร้างฐานใหม่ไปพร้อมๆกันเพื่อที่จะได้ประสบการ์ณที่ดีในการเล่น VR gaming
SMTP นั้นอาจจะรองรับการทำงานร่วมกับโครงสร้างฐานเก่าของ NVIDIA architectures แต่ไม่ดีเทียบเท่ากับตัว Pascal. เพราะว่าทาง NVIDIA ได้ทำการอัพเดท Polymorph Engine 4.0 เพื่อที่มารองรับการทำงานร่วมกับ SMTP. ด้วยผังใหม่ที่ถูกสร้างและออกแบบมา จะทำให้ GeForce 10 series และการ์ดจอรุ่นต่อๆไปสามารถทำหน้าที่ของตัวเองได้ดียิ่งขึ้นเป็น 2 เท่า กับตัว predecessors.
NVIDIA Pascal GeForce 10 Series – กับ Memory Compression ในรุ่นที่ 4:
จะว่าไปแล้ว NVIDIA’s Maxwell architecture ได้นำเสนอนวัตกรรมใหม่ๆเพื่อมารองรับและตอบสนองกับเทคโนโลจีโลกปัจจุบันได้ดีไม้น้อย โดยเฉพาะกับตัว memory compression technique แต่ Pascal ได้ก้าวข้ามไปอีกหนึ่งขั้น GeForce 10 series มาพร้อมวิธีการใหม่ในด้านบีบอัด memory ซึ่งทำให้ตัว bandwidth ทำหน้าที่ได้ดีขึ้นถึง 1.7 เท่า เมื่อเทียบกับ Maxwell. ด้วยเหตุนี้ตัว GPU และ application จะไม่ทำให้ตัว memory bandwidth นั้นมีสภาพแบบคอขวดอีกต่อไป
NVIDIA Pascal GeForce 10 Series – กับลูกเล่นใหม่ High-Bandwidth SLI Bridges:
NVIDIA ได้เสนอแนวคิดหรือเทคโนดลจีใหม่กับตัว Pascal cards (GTX 1080 and GTX 1070) รู้กันในชื่อ HB SLI (High Bandwidth Scale Link Interface). เมื่อเปรียบเทียบกับ SLI ทั่วไป, ตัว HB SLI solution สามารถทำให้ bandwidth ทำงานได้ดีขึ้นเป็นสองเท่า โดยการนำ SLI connectors ทั้งคู่ ที่อยู่บนบอร์ด GeForce Pascal boards มาต่อเชื่อมกันแบบไม่รู้สึกเลยว่าคุณกำลังอยู่ในโหมด multi-GPU setup พร้อมด้วยการจ่ายภาพที่มีความละเอียดสูงอยู่
ด้วยเทคนิคใหม่นี้ HB SLI bridges สามารถจ่ายภาพได้ดีขึ้นดีเลย์น้อยลง และได้ความละเอียดของภาพได้สมจริงมากขึ้น สิ่งแวดล้อมในการเล่นเกมส์ดูมีสีสันและกราฟฟิกที่ละเอียด ด้วยเหตุที่ว่าคุณกำลังอยู่ในโหมด multi-GPU setup แบบไม่รู้ตัว
รุ่นแรก NVIDIA GeForce GTX 1080 Graphics Card มาพร้อมบล๊อคระบบทำความเย็นด้วยน้ำ พร้อมด้วยความแรงระดับ 2 GHz หรือมากกว่า
GeForce GTX 1080 graphics card มาพร้อมตัวบล๊อคระบบทำความเย็นด้วยน้ำ ซึ่งสามารถทำให้ตัวการ์ดนั้น ทำความเร็วทะลุผ่าน 2 GHz ได้แบบง่ายๆ (รุปข้างล่างเป็นตัวอย่างหนึ่งที่ทางประเทศจีได้ผลิตตัวบล๊อคระบบทำความเย็นด้วยน้ำสำหรับใช้กับตัว GeForce GTX 1080)
และอีกเพียงแค่อาทิตย์เดียวเท่านั้น ก็จะมีงานแสดงเกี่ยวกับการ์ดจอ และบรรดาคายต่างๆที่เป็นตัวแทนทั้งหลายก็จะมาอวดโฉมการ์ดจอของตัวเอง
ที่มาเครดิต
http://wccftech.com/nvidia-geforce-gtx-1080-official-slides-leak/
You must be logged in to post a comment.