คุณจะกำหนดประสิทธิภาพของพีซีหรือคอนโซลอย่างไร แต่ละคนจะมีมุมมองที่แตกต่างกันเกี่ยวกับสิ่งที่พวกเขาคาดหวังจากอุปกรณ์ทั้งสอง แต่อย่างที่เราทราบ พวกเขามีความคล้ายคลึงกันมากขึ้นเรื่อยๆ ทั้งในด้านคุณธรรมและข้อบกพร่อง วันนี้เราจะจัดการกับส่วนหลัง เนื่องจากข้อจำกัดที่เราจะได้เห็นในปีต่อๆ ไป จะเป็นตัวกำหนดอนาคตของอุตสาหกรรมที่เน้นไปที่เกมมากขึ้น และทำให้การสร้างเนื้อหาและงานด้าน AI และ DL มีไว้สำหรับภาคส่วนมืออาชีพ นี่จะเป็นประสิทธิภาพเนื่องจากเวลาแฝงส่งผลต่อส่วนประกอบพีซีและคอนโซล
ในความเป็นจริง ไม่ว่าเราจะมองไปทางไหนในอุตสาหกรรม สถาปัตยกรรมแม้จะแตกต่างกัน แต่ก็มุ่งเน้นไปที่ภาคส่วนที่เฉพาะเจาะจงมากขึ้น ใช่แล้ว แต่ก็มีพื้นฐานเหมือนกัน ปัญหาเดียวกัน ข้อดีเหมือนกัน นั่นคือเหตุผลที่เราจะเห็นปัญหาคอขวดของฮาร์ดแวร์หลักและการพัฒนาเพื่อทำความเข้าใจว่าเรากำลังจะไปที่ใด
ส่วนประกอบต่าง ๆ ข้อจำกัด ประสิทธิภาพ และเวลาแฝงต่างกัน
ตามตรรกะแล้ว ข้อจำกัดหรือคอขวดมีความแตกต่างกันในแต่ละองค์ประกอบ แต่มีบางอย่างที่เหมือนกันในทุกกรณีที่มีความสำคัญมากกว่าหรือน้อยกว่า: ความหน่วงแฝง ในบางกรณีสิ่งสำคัญคือต้องเขย่งเขย่งเท้า แต่จะแสดงให้เห็นประสิทธิภาพในปีต่อๆ ไปอย่างไม่ต้องสงสัย นอกจากนี้ยังไม่ชัดเจนสำหรับพีซีหรือคอนโซลที่บันทึกลักษณะเฉพาะของพวกเขาก็จะได้รับผลกระทบเช่นกัน
เพื่อให้เราทราบว่าเวลาแฝงมีความสำคัญอย่างไร เรามีแผนภูมินี้ซึ่งเริ่มมีชื่อเสียงในขณะนั้นและแสดงให้เห็นได้ค่อนข้างดีถึงความหมายของมันในองค์ประกอบต่างๆ นาโนวินาที มิลลิวินาทีและวินาที เมื่อเทียบกับเวลาตามปกติที่เรารับรู้ในฐานะมนุษย์
ดังที่คุณเห็นใน a หน่วยประมวลผล 3 GHz ความล่าช้าของรอบนาฬิกาเพียง 0.3 ns จะบ่งบอกถึงการรับรู้ 1 วินาทีสำหรับเรา การเข้าถึง L3 ซึ่งโดยเฉลี่ยประมาณ 12 ns ขึ้นอยู่กับสถาปัตยกรรมของโปรเซสเซอร์ แสดงถึง 43 วินาทีในชีวิตของเรา
การกระทำ | เวลาแฝงเฉลี่ย | เวลาที่สมบูรณ์สำหรับคนคนเดียว |
---|---|---|
เวลาของรอบสัญญาณนาฬิกาที่ 3 GHz | 0.3ns | ที่สอง 1 |
เข้าถึงเวลาไปยังแคช L1 ของ CPU | 0.9ns | วินาที 3 |
เวลาเข้าถึงแคช CPU L2 | 2.8ns | วินาที 9 |
เวลาเข้าถึง L3 | 12.9ns | วินาที 43 |
เวลาเข้าถึง RAM | ระหว่าง 70 ถึง 100 ns | ระหว่าง 3.5 นาที ถึง 5.5 นาที |
ไทม์มิ่ง I/O ของ NVMe SSD | ระหว่าง 7 ถึง 150 picoseconds | ระหว่าง 2 ชั่วโมงถึง 2 วัน |
เวลาอินพุตและเอาต์พุตของ HDD | ระหว่าง 1 ถึง 10ms | ระหว่าง 11 วัน ถึง 4 เดือน |
อินเทอร์เน็ต เวลาเข้าใช้จากซานฟรานซิสโกไปนิวยอร์ก | 40ms | |
เวลาอินเทอร์เน็ตระหว่างซานฟรานซิสโกถึงออสเตรเลีย | 183ms | |
การรีสตาร์ทการจำลองเสมือนของ OS | วินาที 4 | |
รีสตาร์ทการจำลองเสมือน | วินาที 40 | |
รีบูตระบบทางกายภาพ | วินาที 90 | 3 พันปี |
หากเราอนุมานสิ่งนี้กับ แรม และสูงถึง 100 ns ก็เท่ากับเดินทางไกลถึงจุดหมาย 5.5 นาที บางทีที่สะดุดตาที่สุดคือเวลาแฝงของอินเทอร์เน็ต ซึ่งเป็นเรื่องทั่วไปที่ทุกคนสามารถเข้าใจได้ และนั่นคือถ้าเรามีเวลา 40 มิลลิวินาทีระหว่างซานฟรานซิสโกและนิวยอร์ก มันจะเทียบเท่ากับการสูญเสียชีวิต 1.2 ปีของเราและหากเราเปลี่ยนแปลง ปลายทางไปออสเตรเลียไม่น้อยกว่า 6 ปี
ดังนั้นเวลาแฝงจึงมีความสำคัญมากบนพีซีหรือบนคอนโซล ซึ่งอย่างที่เราเห็น แต่ละรุ่นต่อสู้กันมานานกว่า 40 ปีเพื่อลดความเร็วลงเพื่อเพิ่มประสิทธิภาพตามคำสั่งและวงจร ที่กล่าวว่าเราจะดูว่ามันส่งผลกระทบต่อองค์ประกอบหลักอย่างไรและมีการปรับปรุงในด้านนี้ในระยะสั้นหรือระยะยาว
เวลาในการตอบสนองของโปรเซสเซอร์
เป็นองค์ประกอบที่ทนทุกข์ทรมานมากที่สุด อดีต เอเอ็มดี หัวหน้าสถาปนิก จิม เคลเลอร์ นิยามไว้อย่างยอดเยี่ยมในขณะนั้น:
ขีดจำกัดประสิทธิภาพคือความสามารถในการคาดการณ์ของคำสั่งและข้อมูล
นั่นคือ หากคุณสามารถคาดการณ์ได้ว่าทรัพยากรใดที่จำเป็นสำหรับแต่ละคำสั่งและข้อมูล คุณก็จะสามารถจัดการได้ดีขึ้น ดังนั้นจึงทำให้ใช้เวลาระหว่างคำสั่งและข้อมูลน้อยลงหรือเพิ่มประสิทธิภาพการทำงาน
เวลาแฝงอีกครั้งที่นี่และเป็นที่ที่ AMD เห็นปัญหาก่อนและตอนนี้ อินเทล จะแก้ปัญหาในส่วนนี้ใน Raptor Lake: เพิ่มขนาดของแคชเพื่อลดเวลาในการเข้าถึงและข้อความของคำสั่งและข้อมูลในลำดับชั้นของแคช
สิ่งที่พยายามจะไม่เข้าถึง RAM หรือจำกัดรอบการเข้าถึงให้มากที่สุด AMD ทำกับ Ryzen และ Zen 2 ถึง Zen 3 แล้ว Intel จะทำตอนนี้ในสถาปัตยกรรมถัดไป
หน่วยความจำ RAM และ GDDR6
อาจเป็นส่วนสำคัญที่สุดในองค์ประกอบทั้งสองนี้ หน่วยความจำ RAM เป็นปัญหาเสมอเนื่องจากเวลาแฝง แต่สิ่งที่ต้องการจริงๆ คือแบนด์วิดท์ที่มากขึ้น ความถี่ที่มากขึ้น ความเร็วที่มากขึ้นโดยไม่ลดทอนอัตราส่วนกับการกำหนดเวลา DDR5 ได้ปลดปล่อยสิ่งนี้ออกมาอย่างดี และถึงแม้ว่าเราจะไม่สังเกตเห็นมันมากเท่าบนพีซีเช่นเดียวกับบนเซิร์ฟเวอร์ แต่ก็เป็นเทคโนโลยีที่จำเป็นสำหรับภาคส่วนโดยทั่วไป
สำหรับ GDDR6 เวลาแฝงไม่สำคัญเท่ากับแบนด์วิดท์ที่เป็นผล เนื่องจากความสามารถในการประมวลผลของ GPU เพิ่มขึ้นและจำเป็นต้องจัดหาข้อมูลจากหน่วยความจำที่เกี่ยวข้อง ดังนั้นเวลาในการตอบสนองจึงเป็นเรื่องรอง แม้ว่าจะห่างไกลจากความเล็กน้อยก็ตาม
นอกจากนี้ยังไม่มีการปรับปรุงใด ๆ เมื่อเทียบกับ GDDR6X ที่ความเร็วและความถี่เพิ่มขึ้นในขณะที่ยังคงความหน่วงไว้ที่รอบสัญญาณนาฬิกาเดียวกัน
SSD ประสิทธิภาพและเวลาแฝงบนพีซี
สิ่งเหล่านี้ขึ้นอยู่กับปัจจัยนี้น้อยที่สุด แต่เวลาแฝงจำเป็นสำหรับการดำเนินการสุ่มแบนด์วิดท์สูง ตัวควบคุมจำเป็นต้องแลกเปลี่ยนข้อมูลกับเซลล์มากขึ้นเรื่อยๆ ดังนั้นประสิทธิภาพจะไม่สูญหายไปกับรอบสัญญาณนาฬิกาที่ส่งผลต่อแบนด์วิดท์ดิบตาม IOPS
โดยสรุป คอร์ของโปรเซสเซอร์ได้รับผลกระทบมากที่สุดจากแคช ซึ่งจะเกิดขึ้นกับ GPU ไม่นานเกินไป เนื่องจากพวกมันยังเพิ่มขนาดและส่งออกออกจากกลุ่ม Shaders อย่างที่ AMD ทำกับ Infinity Fabric และ อินฟินิตี้แคชโดยตั้งใจที่จะไม่พึ่งพา GDDR ความเร็วสูงกว่าบน GPU และในขณะเดียวกันก็ไม่กินพื้นที่ในหน่วย CU
มีแอนิเมชั่นที่อยากรู้อยากเห็นมาก ๆ ที่เพียงแค่คลิกที่องค์ประกอบต่าง ๆ ที่แสดง ความสำคัญของเวลาแฝงของระบบในองค์ประกอบต่าง ๆ ก็เข้าใจได้อย่างสมบูรณ์ คุณเพียงแค่ต้องเข้าถึง เว็บไซต์ และเริ่มคลิกเพื่อดูภาพเคลื่อนไหวของการทำงานขององค์ประกอบ
เป็นเรื่องที่น่าสนใจเป็นพิเศษเมื่อเราคลิกที่หน่วยความจำของระบบ จากนั้นไปที่ L2 และ L1 เพื่อดูองค์กรและการไหลของประสิทธิภาพและเวลาแฝงระหว่างกัน อยากรู้อยากเห็นและให้ความรู้จริงๆ ดังนั้นการผ่านของ AMD กับ Zen 2 และ Zen 3 จึงมีความสำคัญอย่างยิ่งที่จะสามารถเผชิญหน้ากับ Intel ได้ในราคาของพื้นที่ขนาดใหญ่มากใน DIE ซึ่งเป็นสิ่งที่ Intel จะต้องทำซ้ำในตอนนี้และไม่ควรทำมาก่อนเนื่องจาก กระบวนการพิมพ์หิน .
อุณหภูมิรุนแรงกว่าเวลาแฝงและประสิทธิภาพบนพีซี?
ตามหลักเหตุผล ปัจจัยกำหนดประสิทธิภาพของชิปคืออุณหภูมิ ปัญหาคือสิ่งนี้มีอยู่ในเทคโนโลยี เนื่องจากชิปใดๆ ที่มีแรงดันไฟฟ้าจะมีอุณหภูมิที่สูงขึ้นหรือต่ำลงด้วยการใช้งานที่เรียบง่าย ยิ่งชิปมีความซับซ้อนมากเท่าใด จำนวนคอร์และยูนิตที่มีก็จะยิ่งมากขึ้น ความถี่และแรงดันตามหลักเหตุผลก็ยิ่งต้องการมากขึ้น ตามหลักการแล้วมันจะร้อนขึ้น
ตามที่คาดไว้ สิ่งนี้ค่อนข้างคลุมเครือ เนื่องจากมันจะเป็นปัจจัยจำกัดเสมอ แต่ในขณะเดียวกัน ความร้อนก็ไม่ใช่ปัจจัยทางเทคโนโลยี และเราก็ต้องอยู่กับมันเหมือนที่เราทำมาตั้งแต่สร้างชิปตัวแรก
กล่าวโดยย่อ เวลาแฝงในพีซีและประสิทธิภาพของส่วนประกอบต่าง ๆ เป็นปัจจัยสำคัญที่จำกัดและจะจำกัด (ประสิทธิภาพ) นี้มากกว่าสิ่งอื่นใด เนื่องจากไม่มีค่าอะไรที่จะมีความเร็วทั่วไปที่สูงขึ้นหากเวลาในการเข้าถึงและ การถ่ายโอนข้อมูลระหว่างส่วนประกอบต่างๆ ล่าช้ามากขึ้น