ทำไม GPU ของ NVIDIA และ AMD จึงไม่แบน

ตายของ NVIDIA และ AMD GPUs

แน่นอนว่าในหลาย ๆ ครั้งเราเคยสงสัยว่ามันเป็นไปได้อย่างไรที่เหมือนกันและเหมือนกัน GPU แบบจำลองมีอุณหภูมิและความดังที่แตกต่างกัน มันควรจะเท่ากันที่อุณหภูมิห้องและความชื้นสัมพัทธ์ไม่ใช่เหรอ? ทฤษฎีล้มเหลวเนื่องจากในทางปฏิบัติมีปัญหามากมายที่ต้องแก้ไขซึ่งมีผลต่อพารามิเตอร์สุดท้ายเหล่านี้ซึ่ง ได้แก่ ความโค้งของ เอเอ็มดี และ NVIDIA ตาย. พวกเขาไม่ได้ทำจากซิลิกอนโดยสิ้นเชิงหรือ?

ด้วยความร้อนและการใช้พลังงานที่เพิ่มขึ้นของทั้ง AMD RX 6000 และ NVIDIA RTX3000 GPU ผู้ผลิตประสบปัญหาอย่างมากในการรักษาอุณหภูมิและสัญญาณรบกวนให้อยู่ในระดับต่ำและคงที่ สันนิษฐานว่าด้วยความแม่นยำที่อุตสาหกรรมมีในการผลิตชิปจึงหลีกเลี่ยงข้อผิดพลาดที่หยาบคายพอ ๆ กับความโค้ง แต่ในความเป็นจริงนั้นแตกต่างกันโดยสิ้นเชิงและมีขนาดที่ใหญ่กว่าความทนทานต่อความผิดพลาดมากกว่า

NVIDIA RTX ที่มีค่าความคลาดเคลื่อนสูงกว่า Turing

ไม่มีรายงานที่แท้จริงเกี่ยวกับ RX 6000 ใหม่มันใหม่เกินไป แต่ขนาดของเมทริกซ์ของ AMD ทำให้เราคิดว่าปัญหาจะคล้ายกันมากโดยส่วนใหญ่เป็นเพราะทั้ง TSMC และ ซัมซุง มีความแตกต่างกันหรือไม่เมื่อพูดถึงการผลิตเวเฟอร์

เราคำนึงถึงความสมบูรณ์แบบของกระบวนการผลิตอยู่เสมอ แต่โดยปกติเราจะไม่คำนึงถึงปัจจัยอื่น ๆ เนื่องจากแม้ว่าชิปจะมาจากผู้ผลิตรายใดรายหนึ่งในสองรายนี้ แต่ก็ต้องรวมอยู่ในสิ่งที่เรียกว่า " แพ็คเกจ "

กระบวนการนี้ง่ายมาก: คุณเชื่อมและนั่นคือจุดที่มีปัญหาเราเริ่มจากฐานอย่างที่บอกไปว่าซิลิกอนไม่สมบูรณ์แบบ แต่เกือบ การตัดแผ่นเวเฟอร์ทำด้วยความแม่นยำสูงมาก แต่การรวมบรรจุภัณฑ์จะทำให้เกิดความแตกต่างของความสูง

NVIDIA-AMD-GPU-3d-สเกล

เรากำลังพูดถึงสูงแค่ไหน? เป็นระยะทางที่น่าหัวเราะจริงๆสำหรับมนุษย์ทั่วไป แต่สำหรับวิศวกรของ AIB มันทำให้พวกเขาเป็นหัวหน้า ต้องเน้นย้ำว่านี่ไม่ใช่สิ่งที่เป็นเอกสิทธิ์ของ RTX 3000 หรือ RX 6000 แต่เกิดขึ้นกับชิปใด ๆ รวมถึงโปรเซสเซอร์เท่านั้นในกรณีของกราฟิกการ์ดรุ่นล่าสุดเหล่านี้เนื่องจากขนาดของแม่พิมพ์ความแตกต่างคือ ชัดเจนมากขึ้น

ในการทดสอบความโค้งของชิปอุณหภูมิเฉลี่ยของ 20ºค ถูกกำหนดขึ้นตามกฎและใช้เครื่องสแกน 3 มิติซึ่งใช้แผนที่ภูมิประเทศของพื้นผิว จะมีระยะทางเท่าใดจากจุดที่ราบที่สุดถึงจุดสูงสุด?

ทั้ง NVIDIA และ AMD มีความอดทนต่อข้อผิดพลาดสูง

ในตัวอย่างที่เกี่ยวข้องกับเราความโค้งของเมทริกซ์คือ 0.068 มม แต่คุณจะพบชิปที่มีความคลาดเคลื่อนมากกว่าและถึงแม้จะอยู่ในระดับที่ NVIDIA เห็นว่าเหมาะสมกับ GA102 (ชิปในภาพ)

ภาพด้านล่างแสดงความโค้งอย่างแม่นยำไม่น้อยกว่า 0.08 มม. ซึ่งยังอยู่ในข้อกำหนด แต่เป็นเรื่องที่ท้าทายสำหรับผู้ที่ออกแบบบล็อกหรือฮีทซิงค์ ปัญหาที่เกิดขึ้นคือการเสียรูปเกิดขึ้นที่มุมตามกฎทั่วไปโดยปล่อยให้ขั้นตอนที่ใหญ่กว่ามากในบางส่วนของชิปที่สัมผัสกับฮีทซิงค์

ในตัวอย่างด้านล่างคุณจะเห็นได้อย่างชัดเจนว่าในมุมหนึ่งแม่พิมพ์สัมผัสกับสิ่งที่จะเป็นฮีทซิงค์ได้อย่างไรซึ่งแสดงด้วยรูปสี่เหลี่ยมผืนผ้าสีดำและแบนอย่างสมบูรณ์แบบซึ่งจะทำให้เรามีระยะห่างมากกว่าสองเท่าในมุมตรงข้ามหากอยู่ในระดับ: 0.156 มม .

หากเพียงพอแล้วในเรื่องนี้ NVIDIA จะระบุช่วงความทนทานสูงถึง 0.3 มม ในจุดที่แตกต่างกันบน PCB และชิปดังนั้นเรากำลังพูดถึงความป่าเถื่อนที่แท้จริงของ GAP ที่ไม่ควรเกิดขึ้นตามเหตุผลหากเราต้องการการติดต่อขั้นต่ำ

แต่ถ้าวิเคราะห์ PCB ทั้งหมดจะเห็นได้ชัดเจนว่าความแตกต่างของความสูงคงที่และแทบจะไม่มีพื้นที่ราบที่สมบูรณ์แบบเลย ในภาพด้านล่างมีเพียงสิ่งที่ทาสีเขียวเท่านั้นที่ระบุความแตกต่าง 0.00 มม. นั่นคือความตรงทั้งหมด

NVIDIA-AMD-GPU-3d-สเกล-8

ส่วนที่เหลือเป็นที่ถกเถียงกันระหว่างเว้ามากหรือนูนมากโดยมีจุดที่น่าเป็นห่วงรวมอยู่ในตัวชิป

ปัญหา PCB และการติดตั้ง

NVIDIA-AMD-GPU-3d-สเกล-4

ลองจินตนาการว่าเรามีช่องว่าง 0.2 หรือ 0.3 มม. ในส่วนต่างๆของ PCB หรือชิปจะเกิดอะไรขึ้นเมื่อเป็นหลักประกันความเสียหาย? ฮีทซิงค์กับ PCB จะมีระยะห่างเท่านี้ในบางจุดดังนั้นเมื่อขันเข้าเราจะบังคับ PCB ที่จุดนั้น การแก้ไขปัญหา? มันเป็นเพียงการประคับประคองและไม่มีอะไรให้ทำมากนัก: ใช้แผ่นความร้อนและแผ่นความร้อนที่หนาแน่นมาก

เป็นวิธีที่ถูกที่สุดและง่ายที่สุดในการแก้ไขปัญหา แต่ในเชิงเหตุผลก็หมายถึงการสูญเสียความร้อนหลายวัตต์โดยการสัมผัสที่ไม่ดี ยิ่งแผ่นความร้อนมีความหนามากเท่าไหร่ประสิทธิภาพก็จะยิ่งแย่ลงเท่านั้นดังนั้นสิ่งที่ทำให้เย็นจะมีอุณหภูมิแย่ลง ด้วยเหตุนี้ผู้ผลิตจึงไม่ใช้ฮีทซิงค์เป็นกฎสำหรับส่วนประกอบทั้งหมดอีกต่อไป แต่มีบางส่วนที่เฉพาะเจาะจงนอกเหนือจากตัวฮีทซิงค์เอง

ตัวอย่างเช่นมิดเพลทเป็นอุปกรณ์ระดับกลางที่แก้ไข VRAM และในบางกรณี MOSFET จะเหลือ GPU ไว้สำหรับสกรูสี่ตัวของบล็อกหลักของฮีทซิงค์และช่วยให้การเชื่อมต่อที่ดีขึ้น น่าเสียดายที่สิ่งนี้ไม่ได้เกิดขึ้นในบล็อกน้ำตัวอย่างเช่นที่ทุกอย่างเป็นของแข็งและเป็นชิ้นเดียวซึ่งผลักดันให้วิศวกรระบายความร้อนด้วยของเหลวต้องเผชิญกับความคลาดเคลื่อนเหล่านั้นที่ขยายขอบเขตมากขึ้น

NVIDIA-AMD-GPU-3d-สเกล-9

กรณีที่มีชื่อเสียงมากของปัญหานี้คือ อัสซุส และ AMD ซึ่ง GPU ของพวกเขาได้รับความนิยมอย่างมากเนื่องจากข้อเท็จจริงง่ายๆที่ว่าแบรนด์ได้รับคำแนะนำจาก AMD ในเรื่องความสูง ผลลัพธ์ที่เราทุกคนรู้: เครื่องซักผ้าใหม่เพื่อเพิ่มแรงดันสูงสุดเนื่องจาก ASUS ได้ปรับทุกอย่างตามความคลาดเคลื่อนของ AMD แต่ในทางปฏิบัติฮีทซิงค์แทบจะไม่แตะต้องและ GPU จะเพิ่มขึ้นในอุณหภูมิ

หรือในกรณีของแผ่นความร้อนแกรไฟต์ 45 วัตต์ของฮิตาชิสำหรับ Radeon VII เป็นต้นซึ่งความแตกต่างของความสูงกับ HBM2E ทำให้การใช้แผ่นระบายความร้อนล้าสมัย

NVIDIA-AMD-GPU-3d-สเกล-10

In ซีพียู มันคล้ายกันเล็กน้อยโดยที่ ISH จะเว้าที่ด้านหนึ่งและ IHS อีกด้านหนึ่งส่วนใหญ่จะถูกเชื่อมดังนั้นความทนทานต่อความผิดพลาดจึงสูงกว่า