เทคโนโลยีก้าวหน้าแต่แทนที่จะลดค่าไฟ กลับมีแต่จะสูงขึ้น

หนึ่งในประเด็นที่เกิดขึ้นบ่อยที่สุดในช่วงไม่กี่ปีที่ผ่านมาคือการใช้พลังงานที่เพิ่มขึ้นของชิปต่างๆ ในเวลาเดียวกันเราได้เห็นความคิดเห็นมากมายที่ผู้คนมักพูดว่าการเพิ่มพลังงานเป็นเรื่องไร้สาระ จะเป็นอย่างไรหากความจริงที่ว่า ชิปใหม่เพิ่มค่าไฟฟ้า เป็นสิ่งที่ผ่านไม่ได้และเป็นผลมาจากความก้าวหน้าของโปรเซสเซอร์หรือไม่? นั่นคือเหตุผลที่เราตัดสินใจอธิบายปรากฏการณ์นี้ให้คุณฟัง

ไม่ต้องสงสัยเลยว่าค่าไฟฟ้าจะเพิ่มขึ้นเพราะความโลภของนักการเมืองและมาตรการของพวกเขา พูดง่าย ๆ แต่ทำด้วยเงินทั้งหมดของเรา อย่างไรก็ตาม เราไม่ได้พูดถึงประเด็นเหล่านี้ และแม้ว่าเราจะรู้ว่าค่าไฟฟ้าเพิ่มขึ้นเกินจริง แต่สิ่งที่เราสนใจคือการอธิบายว่าเหตุใดกราฟิกการ์ดจึงกินไฟมากขึ้น เช่น โปรเซสเซอร์ แรม ความทรงจำ นั่นคือส่วนประกอบทั้งหมดภายในพีซีของเรา

ความก้าวหน้าทางเทคโนโลยี

การที่ชิปใหม่เพิ่มบิลเป็นสิ่งที่หลีกเลี่ยงไม่ได้

หากเราดูที่สถาปัตยกรรมโปรเซสเซอร์ใดๆ ทั้งแบบทั่วไปหรือแบบเฉพาะ เราจะตระหนักว่ามากกว่าครึ่งหนึ่งของวงจร (หากไม่เกินสองในสาม) ไม่มีอยู่เพื่อประมวลผลข้อมูล แต่มีไว้เพื่อสื่อสารระหว่างส่วนต่างๆ และเราต้องไม่ลืมว่าชิปในปัจจุบันสามารถมีหนึ่งหรือหลายฟังก์ชันในเวลาเดียวกัน แต่สามารถสรุปได้เป็นสามฟังก์ชันหลัก:

  • เพื่อประมวลผลข้อมูล
  • ส่งข้อมูล
  • จัดเก็บข้อมูล

แม้ว่ามันอาจจะดูไม่มีประโยชน์สำหรับหลาย ๆ คน แต่ความเป็นจริงของข้อมูลการประมวลผลนั้นมีค่าใช้จ่ายทั้งในด้านจำนวนของทรานซิสเตอร์ภายในโปรเซสเซอร์และในด้านต้นทุนด้านพลังงานที่เล็กน้อยมาก และส่วนที่ดีของการออกแบบโปรเซสเซอร์คือการนำข้อมูลไปยังหน่วยดำเนินการเพื่อให้สามารถประมวลผลได้ ปัญหาคือเนื่องจากกฎของฟิสิกส์ การขนส่งบิตจึงมีราคาแพงกว่าสิ่งอื่นใดในปัจจุบัน และหนึ่งในผลที่ตามมาคือชิปจะเพิ่มค่าไฟฟ้า ซึ่งเห็นได้ชัดว่าสิ้นเปลืองมากขึ้น

สิ่งนี้เรียกว่ากำแพง Von Neumann เนื่องจากมันมีอยู่ในสถาปัตยกรรมทั้งหมด ไม่ว่าเราจะพูดถึงเซิร์ฟเวอร์ โทรศัพท์มือถือ หรือคอนโซลวิดีโอเกมก็ตาม และมันกลายเป็นปัญหาใหญ่ที่สุดสำหรับวิศวกรในปัจจุบัน . และยิ่งต้องลดคาร์บอนฟุตพรินต์

ไมโครโอเปร่า CPU

อธิบายปัญหาในเชิงปริมาณ

โดยปกติเรามักจะให้ค่าการใช้พลังงานของชิปเป็นวัตต์ (W) ซึ่งก็คือจูลต่อวินาที เนื่องจากแบนด์วิธเป็นไบต์หรือบิตต่อวินาที เพื่อไม่ให้สับสนกับทั้งสองคำ วิธีหนึ่งในการวัดการถ่ายโอนข้อมูลอย่างง่ายคือการดูว่าใช้กี่จูล เราเป็นหนี้กราฟต่อไปนี้ให้กับ Bill Dally NVIDIAหัวหน้านักวิทยาศาสตร์และหนึ่งในผู้เชี่ยวชาญชั้นแนวหน้าของโลกในด้านสถาปัตยกรรมคอมพิวเตอร์:

Bill Dally Coste Transferencia subida บริโภคชิป suban factura

ถ้าอย่างนั้น เราต้องเริ่มจากความจริงที่ว่า nJ หรือ nanoJoules หนึ่งตัวมีค่าเท่ากับ 1000 pJ หรือ picoJoules นั่นคือ หากเมื่อประมวลผลการคำนวณเลขทศนิยมที่มีความแม่นยำสองเท่าหรือ 64 บิต ขึ้นอยู่กับตำแหน่งของข้อมูล ปริมาณการใช้เพื่อดำเนินการเดียวกันจะแตกต่างกันไป:

  • หากข้อมูลอยู่ในบันทึก จะมีราคาเพียง 20 pJ หรือ 0.02 nJ
  • หากเราต้องเข้าถึงแคชเพื่อค้นหาสิ่งนั้นจะมีค่าสูงถึง 50 pJ หรือ 0.05 nJ
  • ในทางกลับกัน หากข้อมูลอยู่ใน RAM ปริมาณการใช้จะเพิ่มขึ้นเป็น 16 nJ หรือ 16000 pJ

กล่าวอีกนัยหนึ่ง การเข้าถึง RAM ใช้พลังงานมากกว่า 1000 เท่าในการดำเนินการเดียวกันมากกว่าข้อมูลที่อยู่ในโปรเซสเซอร์ หากเราเพิ่มการสื่อสารภายในระหว่างส่วนประกอบของโปรเซสเซอร์กับส่วนประกอบภายนอก เราก็จะได้ชิปที่สามารถประมวลผลข้อมูลจำนวนมากได้ แต่ในขณะเดียวกันก็ต้องใช้พลังงานจำนวนมากในการทำงาน

เราจะเห็นทางออกอะไรบ้างในอนาคต?

ในขณะนี้เป็นเพียงโซลูชันในห้องปฏิบัติการ แต่ได้รับการพิสูจน์แล้วและสามารถเปลี่ยนวิธีที่เราเข้าใจพีซีได้ โดยหลักแล้ว เรามีวิธีแก้ปัญหาที่แตกต่างกันสองวิธี

ใกล้การประมวลผลหน่วยความจำ

ประการแรกคือการประมวลผลหน่วยความจำใกล้ ซึ่งประกอบด้วยการย้ายหน่วยความจำให้ใกล้กับโปรเซสเซอร์มากขึ้น แนวคิดนี้ไม่ใช่สิ่งอื่นนอกจากการใส่หน่วยความจำไว้ใกล้กับโปรเซสเซอร์มาก น่าเสียดายที่เราไม่สามารถใส่ RAM หลายสิบกิกะไบต์ที่เราจะเห็นในระยะสั้นในพีซีได้ แต่เพิ่มระดับแคชขนาดใหญ่ที่เพิ่มความจุอย่างมากเพื่อให้สามารถ ค้นหาข้อมูลในนั้นและลดการบริโภค

น่าแปลกที่กลยุทธ์ในการเพิ่มขนาดของแคชเป็นกลยุทธ์ที่ดำเนินการโดย NVIDIA ด้วยสถาปัตยกรรม Lovelace โดยเพิ่ม L2 จากรุ่นหนึ่งไปอีกรุ่นหนึ่งถึง 16 เท่า อย่างไรก็ตาม นี่ยังไม่เพียงพอ ซึ่งนำเราไปสู่ข้อสรุปว่าจำเป็นต้องมีหน่วยความจำระดับใหม่ ใกล้กับโปรเซสเซอร์มากขึ้นและใช้พลังงานน้อยลง นั่นคือในอีกไม่กี่ปีข้างหน้าเราจะพูดถึง RAM ที่เร็วและ RAM ที่ช้าบนพีซีของเรา หลังอาจใช้อินเทอร์เฟซ CXL

วีแคช ISSCC 2022

การประมวลผลในหน่วยความจำ

สิ่งที่สองคือสิ่งที่เราเรียกว่า PIM ไม่ใช่ตัวประมวลผล แต่เป็นชิปหน่วยความจำที่มีความสามารถในการประมวลผลภายใน กล่าวคือยังคงเป็นความทรงจำ แต่อัลกอริทึมเฉพาะบางอย่างสามารถเรียกใช้ได้ ตัวอย่างเช่น ลองนึกภาพว่าเราต้องทำคำขอหลายครั้งไปยังฐานข้อมูลที่อยู่ใน RAM เพื่อค้นหา อีเมล ที่อยู่ของลูกค้า ในกลไกแบบเดิม เราจำเป็นต้องเข้าถึงหน่วยความจำภายนอกที่ใช้ปริมาณน้อยหลายครั้ง ด้วยวิธีนี้ RAM เองจะค้นหาข้อมูลเองโดยใช้ปริมาณน้อยมากเนื่องจากไม่จำเป็นต้องเข้าถึงจากภายนอกและต้องส่งข้อมูลไปยังโปรเซสเซอร์เท่านั้น

พีไอเอ็ม คอนเซ็ปต์

ด้วยวิธีนี้ เราจึงสามารถลดจำนวนการถ่ายโอนข้อมูลระหว่าง RAM และโปรเซสเซอร์ได้อย่างมาก และด้วยเหตุนี้จึงช่วยลดการใช้พลังงาน ข้อเสียคือต้องออกแบบแอพพลิเคชั่นสำหรับกระบวนทัศน์นี้ แม้ว่าจะมีความจำเป็นเพื่อลดการใช้พลังงานและป้องกันไม่ให้ชิปรุ่นใหม่เพิ่มค่าไฟฟ้าให้สูงขึ้น