HBM2 กับ HBM3: การเปรียบเทียบและการวิเคราะห์ VRAMs เหล่านี้

แม้ว่าบิ๊ก Navi ที่มีสถาปัตยกรรม RDNA2 และชิป Navi 2x นั้นยังไม่ได้เข้าสู่ตลาดเช่นนี้ความจริงก็คือ เอเอ็มดี (และในระดับที่น้อยกว่า NVIDIA) กำลังดำเนินการใช้ตัวตายตัวแทนของสิ่งนี้อยู่แล้ว (ซึ่งจะไม่ใช่ HBM2E): HBM3 . แม้ว่าวันนี้เราจะไม่ทราบมากนัก แต่ข้อมูลชุดเปรียบเทียบได้รั่วไหลออกมา HBM2 มันค่อนข้างน่าสนใจและสามารถสร้างความสมดุลระหว่างสมรรถนะของทั้งสอง บริษัท ได้เท่าไหร่

อย่างที่เรารู้ HBM2 และ HBM2E เป็น VRAM สองประเภทที่มีข้อ จำกัด ที่สำคัญหลายประการในการใช้งานและการพัฒนาสำหรับ GPU ชิป พวกเขามีข้อได้เปรียบมากมายจากมุมมองของประสิทธิภาพและการบริโภคพวกเขาเป็นปัจจุบันที่ไม่จำเป็น แต่จะไม่ใช่อนาคตเช่นนี้

สำหรับเรื่องนี้ HBM3 มาถึงซึ่งภายในไม่กี่ครั้งที่เรารู้เกี่ยวกับมันจะจบปัญหาของสองรุ่นก่อนหน้านี้ จนถึงทุกวันนี้เรายังไม่รู้ประสิทธิภาพและเหนือสิ่งอื่นใดเราสามารถพูดคุยเกี่ยวกับการปรับปรุงได้ดีกว่ารุ่นที่แทนที่

hbm2 เทียบกับ hbm3

HBM2 กับ HBM3: การเปรียบเทียบและการจำลองประสิทธิภาพครั้งแรกมาถึง

HBM3-7

ดังที่เรากล่าวว่าข้อมูลแรกมีอยู่ที่นี่แล้วยกเว้นว่าตามปกติจะเกิดขึ้นในกรณีเหล่านี้ข้อมูลเหล่านี้ไม่ได้ถูกเสนอผ่านแบนด์วิดท์ FPS หรือตัวชี้วัดทั่วไปอื่น ๆ ภายในภาคการเล่นเกม

ในฐานะที่เป็นหน่วยความจำ TOP ที่มีประสิทธิภาพสูงโลกธุรกิจมีความสนใจในการเรียนรู้เกี่ยวกับการปรับปรุง HBM2 ใน เอ็กซาสเกล สภาพแวดล้อมเซิร์ฟเวอร์ซึ่งท้ายที่สุดแล้วเป็นผู้นำของโลกในด้านพลังอันมหาศาล ดังนั้นข้อมูลที่เราจะเห็นสะท้อนให้เห็นถึงสถานการณ์นี้และมุ่งเน้นไปที่การเขียนข้อสรุปสำหรับองค์กรแบนด์วิดธ์ความล่าช้าความจุและพลังงาน

HBM3-5

คำถามนั้นชัดเจนและสำคัญ: พีซีในอนาคตจะได้ประโยชน์จาก HBM3 กับ HBM2 ในระดับใด ข้อมูลค่อนข้างชัดเจน

ดังที่เราเห็นการเพิ่มประสิทธิภาพของ HBM3 จะเป็นเสาหลักที่สำคัญในระบบ Exascale และนั่นเป็นไปได้ที่จะบรรลุถึง เพิ่มความเร็ว 1.7x ในระบบมากกว่า HBM2 ที่มีจำนวนแกนประมวลผลและแคชระบบย่อยน้อยกว่าเล็กน้อย

ใน HPCG ประสิทธิภาพของแบนด์วิดท์สามารถถ่ายได้สูงสุด 600 GB / s ในสภาพแวดล้อมเหล่านี้จาก 300 GB / s ซึ่งเวอร์ชันแรกเริ่มต้นด้วยความเร็วต่ำสถานการณ์จำลองที่ซ้ำในสตรีมเช่น

HBM3-6

ปัญหาหลักที่ HBM3 กำลังจะทำการลากคือเครือข่าย NoC ซึ่งแบนด์วิดท์เป็นคอขวดอย่างแม่นยำ กลุ่มจะมีการปรับปรุงเล็กน้อยในกรณีเหล่านี้ตราบใดที่ไม่มีคอขวดดังกล่าว แต่มันไม่ใช่ประเภทของหน่วยความจำที่น่าจะเหมาะสมที่สุดสำหรับระบบที่ไม่ได้ปรับให้เหมาะสมอย่างแม่นยำ

จำนวนเธรดประเภทและขนาดของแคชรวมถึงไดเรกทอรีคือกุญแจ

HBM3

ความถี่และจำนวนคอร์ยังมีจำนวนมากที่ต้องพูดเนื่องจากแบนด์วิดท์ที่เพิ่มขึ้นจาก 1 ถึง 2 GHz ใน 300 GB / s เป็น 600 GB / s หากความถี่เครือข่ายเป็น 5 GHz สิ่งที่ตอนนี้อยู่ไกลเกินเอื้อม ของเซิร์ฟเวอร์เกือบทั้งหมดในโลก

สถานการณ์ที่สมจริงที่สุดคือความถี่ 4 GHz ซึ่งมีแบนด์วิดธ์ในการทำงานลดลงเล็กน้อยโดยเฉพาะอย่างยิ่งในสเกลและการคัดลอก แต่เป็นที่ยอมรับได้เมื่อพิจารณากระแสไฟฟ้าในปัจจุบัน

จำนวนเธรดขนาดของแคช L1 และ L2 เช่นเดียวกับจำนวนไดเรกทอรี ยังมีความจำเป็นโดยเฉพาะอย่างยิ่งในแคช L1 ความสามารถในการปรับขยายได้เกือบ 80% เมื่อเปลี่ยนจาก 12 ถึง 24 ซึ่งเป็นสิ่งที่ไม่ได้สะท้อนให้เห็นในพารามิเตอร์อื่น ๆ แต่บ่งบอกถึงความสำคัญที่สถาปัตยกรรมในอนาคตจะมีในตอนนี้ซึ่งเป็นสิ่งที่ AMD ดำเนินการมาระยะหนึ่งแล้ว อินเทล จริงจังกับตัวเองเมื่อกว่าปีที่แล้ว

HBM3-2

ในระยะสั้น HBM3 สำหรับเซิร์ฟเวอร์นั้นขึ้นอยู่กับทรัพยากรของ NoC เป็นอย่างมากการเพิ่มประสิทธิภาพสูงสุดจะต้องใช้ประโยชน์จากมันอย่างเต็มที่ในแง่ของแบนด์วิดธ์ (ยิ่งเมื่อเพิ่มความเร็วสุดท้ายใน JEDEC) และในที่สุดมันเป็นหน่วยความจำประเภทขึ้นอยู่กับความยืดหยุ่น ทรัพยากร

ในการเล่นเกมมันจะเป็นหน่วยความจำที่มีราคาแพงมากโดยไม่มีผลประโยชน์เป็นศูนย์อีกต่อไปซึ่งมันมีอยู่หลายครั้งที่ไม่มีประโยชน์ใด ๆ เมื่อใช้ความละเอียดสูงและเฮิรตซ์ อย่างไรก็ตามมันจะถูกใช้อย่างแน่นอนโดย AMD ใน GPU ระดับสูงเมื่อการบริโภคพุ่งสูงขึ้นและ GDDR6 คือ ไม่ใช่ตัวเลือกเนื่องจากแรงดันไฟฟ้าซึ่งเรามีความหวังเท่านั้น RDNA 2 จะ มีประสิทธิภาพมากขึ้นและหลีกเลี่ยงการใช้งานและค่าใช้จ่ายในอุปกรณ์ของ Lisa Su

ในทางกลับกัน NVIDIA ไม่ได้ใช้งานเทสลา GPU ของคุณจนเกินไปและจะเน้นไปที่ GDDR6 ความทรงจำ 18 Gbps เพื่อเพิ่มแบนด์วิดท์ในขณะที่รักษาการใช้งานการ์ดโดยรวมโดยเฉพาะการใช้ประโยชน์จากโหนดใหม่ 7 นาโนเมตรและ 8 นาโนเมตร จาก TSMC และ ซัมซุง.