หน่วยปฏิบัติการแรสเตอร์ไรเซชัน (ROP) อัตราการส่ง (อัตราการส่ง)

💖 ชอบไหม?แชร์ลิงก์กับเพื่อนของคุณ

ในส่วนแรกของคำแนะนำเกี่ยวกับการ์ดวิดีโอสำหรับผู้เริ่มต้น เราได้ดูองค์ประกอบสำคัญ: อินเทอร์เฟซ เอาต์พุต ระบบระบายความร้อน GPU และหน่วยความจำวิดีโอ ในส่วนที่สองเราจะพูดถึงฟังก์ชั่นและเทคโนโลยีของการ์ดแสดงผล

ส่วนประกอบพื้นฐานของการ์ดแสดงผล:

  • ออก;
  • อินเทอร์เฟซ;
  • ระบบทำความเย็น
  • จีพียู;
  • หน่วยความจำวิดีโอ

ส่วนที่ 2 (บทความนี้): เทคโนโลยีกราฟิก:

  • พจนานุกรม;
  • สถาปัตยกรรม GPU: คุณสมบัติ
    หน่วยจุดยอด/พิกเซล, เชเดอร์, อัตราการเติม, หน่วยพื้นผิว/แรสเตอร์, ไปป์ไลน์;
  • สถาปัตยกรรม GPU: เทคโนโลยี
    กระบวนการทางเทคนิค, ความถี่ GPU, หน่วยความจำวิดีโอในเครื่อง (ปริมาตร, บัส, ประเภท, ความถี่), โซลูชันที่มีการ์ดแสดงผลหลายตัว
  • ฟังก์ชั่นการมองเห็น
    DirectX, ช่วงไดนามิกสูง (HDR), การป้องกันนามแฝงแบบเต็มหน้าจอ, การกรองพื้นผิว, พื้นผิวที่มีความละเอียดสูง

อภิธานคำศัพท์กราฟิกพื้นฐาน

อัตราการรีเฟรช

เช่นเดียวกับในโรงภาพยนตร์หรือโทรทัศน์ คอมพิวเตอร์ของคุณจำลองการเคลื่อนไหวบนจอภาพโดยการแสดงลำดับของเฟรม อัตรารีเฟรชของจอภาพจะระบุจำนวนครั้งต่อวินาทีที่ภาพบนหน้าจอจะอัปเดต ตัวอย่างเช่น ความถี่ 75 Hz สอดคล้องกับการอัปเดต 75 รายการต่อวินาที

หากคอมพิวเตอร์ประมวลผลเฟรมได้เร็วกว่าที่จอภาพสามารถส่งออกได้ ปัญหาอาจเกิดขึ้นในเกม ตัวอย่างเช่น หากคอมพิวเตอร์เรนเดอร์ 100 เฟรมต่อวินาที และอัตราการรีเฟรชของจอภาพคือ 75 Hz เนื่องจากการซ้อนทับกัน จอภาพจึงสามารถแสดงภาพได้เพียงบางส่วนเท่านั้นในระหว่างช่วงรีเฟรช เป็นผลให้สิ่งประดิษฐ์ทางการมองเห็นปรากฏขึ้น

วิธีแก้ปัญหา คุณสามารถเปิดใช้งาน V-Sync (การซิงค์แนวตั้ง) โดยจำกัดจำนวนเฟรมที่คอมพิวเตอร์สามารถส่งออกไปยังอัตรารีเฟรชของจอภาพ เพื่อป้องกันข้อผิดพลาด หากคุณเปิดใช้งาน V-Sync จำนวนเฟรมที่คำนวณในเกมจะไม่เกินอัตราการรีเฟรช นั่นคือที่ 75 Hz คอมพิวเตอร์จะส่งออกไม่เกิน 75 เฟรมต่อวินาที

คำว่า “พิกเซล” ย่อมาจาก “ รูปแน่นอน เอล ement" คือ องค์ประกอบภาพ เป็นจุดเล็กๆ บนจอแสดงผลที่สามารถเรืองแสงเป็นสีใดสีหนึ่งได้ (โดยส่วนใหญ่แล้วเฉดสีจะแสดงด้วยสีพื้นฐาน 3 สีผสมกัน ได้แก่ สีแดง สีเขียว และสีน้ำเงิน) หากความละเอียดของหน้าจอ คือ 1024x768 จากนั้นคุณจะเห็นเมทริกซ์ที่มีความกว้าง 1024 พิกเซลและความสูง 768 พิกเซล พิกเซลทั้งหมดรวมกันเป็นภาพ และข้อมูลที่ส่งออกจากการ์ดวิดีโอ จอภาพ CRT จะอัปเดตการแสดงผลทีละบรรทัด และจอภาพ LCD แบบจอแบนสามารถรีเฟรชแต่ละพิกเซลแยกกันได้

วัตถุทั้งหมดในฉาก 3 มิติประกอบด้วยจุดยอด จุดยอดคือจุดหนึ่งในปริภูมิสามมิติที่มีพิกัด X, Y และ Z จุดยอดหลายจุดสามารถจัดกลุ่มเป็นรูปหลายเหลี่ยมได้ โดยส่วนใหญ่แล้วจะเป็นสามเหลี่ยม แต่สามารถมีรูปร่างที่ซับซ้อนกว่าได้ จากนั้นพื้นผิวจะถูกนำไปใช้กับรูปหลายเหลี่ยม ซึ่งทำให้วัตถุดูสมจริง คิวบ์ 3 มิติที่แสดงในภาพประกอบด้านบนประกอบด้วยจุดยอดแปดจุด วัตถุที่ซับซ้อนมากขึ้นมีพื้นผิวโค้งซึ่งแท้จริงแล้วประกอบด้วยจุดยอดจำนวนมาก

พื้นผิวเป็นเพียงภาพ 2 มิติในขนาดที่กำหนดเองซึ่งแมปลงบนวัตถุ 3 มิติเพื่อจำลองพื้นผิว ตัวอย่างเช่น ลูกบาศก์ 3 มิติของเราประกอบด้วยจุดยอดแปดจุด ก่อนจะลงเท็กซ์เจอร์จะดูเหมือนกล่องธรรมดาๆ แต่เมื่อเราลงพื้นผิว กล่องก็จะกลายเป็นสี


โปรแกรม Pixel Shader ช่วยให้การ์ดแสดงผลสร้างเอฟเฟกต์ที่น่าประทับใจ เช่น น้ำใน Elder Scrolls: Oblivion

ปัจจุบันมีเชเดอร์สองประเภท: จุดยอดและพิกเซล โปรแกรม Vertex shader สามารถแก้ไขหรือแปลงวัตถุ 3 มิติได้ โปรแกรม Pixel shader ช่วยให้คุณสามารถเปลี่ยนสีของพิกเซลตามข้อมูลบางส่วนได้ ลองจินตนาการถึงแหล่งกำเนิดแสงในฉาก 3 มิติที่ทำให้วัตถุที่ได้รับแสงสว่างเรืองแสงสว่างขึ้น ขณะเดียวกันก็ทำให้เกิดเงาบนวัตถุอื่นๆ ทั้งหมดนี้ทำได้โดยการเปลี่ยนข้อมูลสีของพิกเซล

Pixel Shader ใช้เพื่อสร้างเอฟเฟกต์ที่ซับซ้อนในเกมที่คุณชื่นชอบ ตัวอย่างเช่น โค้ดเชเดอร์สามารถทำให้พิกเซลที่อยู่รอบๆ ดาบ 3 มิติเรืองแสงสว่างขึ้น อีกเชเดอร์หนึ่งสามารถประมวลผลจุดยอดทั้งหมดของวัตถุ 3 มิติที่ซับซ้อนและจำลองการระเบิดได้ นักพัฒนาเกมหันมาใช้โปรแกรมเชเดอร์ที่ซับซ้อนมากขึ้นเพื่อสร้างกราฟิกที่สมจริง เกือบทุกเกมสมัยใหม่ที่มีกราฟิกที่สวยงามต้องใช้เชเดอร์

ด้วยการเปิดตัว Application Programming Interface (API) ถัดไป Microsoft DirectX 10 จะมีการเผยแพร่เชเดอร์ประเภทที่สามที่เรียกว่าเชเดอร์เรขาคณิต ด้วยความช่วยเหลือของพวกเขา คุณจะสามารถทำลายวัตถุ ดัดแปลง และแม้แต่ทำลายมันได้ ขึ้นอยู่กับผลลัพธ์ที่ต้องการ ประเภทที่สามของเชเดอร์สามารถตั้งโปรแกรมได้ในลักษณะเดียวกับสองประเภทแรก แต่บทบาทของมันจะแตกต่างออกไป

อัตราการเติม

บ่อยครั้งในกล่องที่มีการ์ดแสดงผลคุณจะพบค่าอัตราการเติม โดยพื้นฐานแล้ว อัตราการเติมจะบ่งบอกว่า GPU สามารถส่งออกพิกเซลได้เร็วแค่ไหน การ์ดแสดงผลรุ่นเก่ามีอัตราการเติมรูปสามเหลี่ยม แต่ในปัจจุบันอัตราการเติมมีสองประเภท: อัตราการเติมพิกเซลและอัตราการเติมพื้นผิว ดังที่ได้กล่าวไปแล้ว อัตราการเติมพิกเซลสอดคล้องกับอัตราการส่งออกพิกเซล คำนวณโดยจำนวนการดำเนินการแรสเตอร์ (ROP) คูณด้วยความถี่สัญญาณนาฬิกา

อัตราการบรรจุพื้นผิวคำนวณแตกต่างกันโดย ATi และ nVidia Nvidia เชื่อว่าความเร็วนั้นได้มาจากการคูณจำนวนไปป์ไลน์พิกเซลด้วยความถี่สัญญาณนาฬิกา และ ATi จะคูณจำนวนหน่วยพื้นผิวด้วยความเร็วสัญญาณนาฬิกา โดยหลักการแล้ว ทั้งสองวิธีนั้นถูกต้อง เนื่องจาก nVidia ใช้หนึ่งหน่วยพื้นผิวต่อหน่วยเชเดอร์พิกเซล (นั่นคือ หนึ่งต่อหนึ่งไปป์ไลน์พิกเซล)

เมื่อคำนึงถึงคำจำกัดความเหล่านี้แล้ว ให้เราดำเนินการต่อและหารือเกี่ยวกับฟังก์ชันที่สำคัญที่สุดของ GPU สิ่งที่พวกเขาทำ และเหตุใดจึงมีความสำคัญมาก

สถาปัตยกรรม GPU: คุณสมบัติ

ความสมจริงของกราฟิก 3D ขึ้นอยู่กับประสิทธิภาพของการ์ดแสดงผลเป็นอย่างมาก ยิ่งพิกเซลเชเดอร์บล็อกโปรเซสเซอร์มีมากเท่าใด และยิ่งความถี่สูงเท่าใด เอฟเฟ็กต์ต่างๆ ก็สามารถนำไปใช้กับฉาก 3D ได้มากขึ้นเพื่อปรับปรุงการรับรู้ทางสายตา

GPU มีบล็อกการทำงานที่แตกต่างกันมากมาย จากจำนวนส่วนประกอบบางส่วน คุณสามารถประมาณได้ว่า GPU มีประสิทธิภาพเพียงใด ก่อนที่จะไปต่อ ให้เราตรวจสอบบล็อกการทำงานที่สำคัญที่สุดก่อน

โปรเซสเซอร์ Vertex (หน่วยเชเดอร์จุดยอด)

เช่นเดียวกับหน่วยเชเดอร์พิกเซล โปรเซสเซอร์จุดยอดเรียกใช้โค้ดเชเดอร์ที่สัมผัสกับจุดยอด เนื่องจากงบประมาณจุดยอดที่มากขึ้นทำให้สามารถสร้างวัตถุ 3 มิติที่ซับซ้อนมากขึ้นได้ ประสิทธิภาพของตัวประมวลผลจุดยอดจึงมีความสำคัญมากในฉาก 3 มิติที่มีวัตถุที่ซับซ้อนหรือมีจำนวนมาก อย่างไรก็ตาม หน่วย vertex shader ยังคงไม่ส่งผลกระทบที่ชัดเจนต่อประสิทธิภาพเช่นเดียวกับโปรเซสเซอร์พิกเซล

โปรเซสเซอร์พิกเซล (หน่วยเชเดอร์พิกเซล)

โปรเซสเซอร์พิกเซลเป็นส่วนประกอบของชิปกราฟิกที่ใช้เพื่อประมวลผลโปรแกรมตัวเชเดอร์พิกเซลโดยเฉพาะ โปรเซสเซอร์เหล่านี้ทำการคำนวณที่เกี่ยวข้องกับพิกเซลเท่านั้น เนื่องจากพิกเซลมีข้อมูลสี พิกเซลเชเดอร์จึงช่วยให้คุณได้เอฟเฟกต์กราฟิกที่น่าประทับใจ ตัวอย่างเช่น เอฟเฟกต์น้ำส่วนใหญ่ที่คุณเห็นในเกมนั้นสร้างขึ้นโดยใช้ตัวเชเดอร์พิกเซล โดยทั่วไปแล้ว จำนวนโปรเซสเซอร์พิกเซลจะใช้เพื่อเปรียบเทียบประสิทธิภาพพิกเซลของการ์ดแสดงผล หากการ์ดใบหนึ่งมีแปดหน่วยเชเดอร์พิกเซลและอีกการ์ดหนึ่งมี 16 หน่วยก็สมเหตุสมผลที่จะถือว่าการ์ดวิดีโอที่มี 16 ยูนิตจะเร็วกว่าในการประมวลผลโปรแกรมเชเดอร์พิกเซลที่ซับซ้อน ควรคำนึงถึงความเร็วสัญญาณนาฬิกาด้วย แต่ในปัจจุบันการเพิ่มจำนวนโปรเซสเซอร์พิกเซลเป็นสองเท่านั้นประหยัดพลังงานมากกว่าการเพิ่มความถี่ของชิปกราฟิกเป็นสองเท่า

เชเดอร์แบบครบวงจร

Unified shaders ยังมาไม่ถึงในโลกพีซี แต่มาตรฐาน DirectX 10 ที่กำลังจะมาถึงนั้นใช้สถาปัตยกรรมที่คล้ายกัน นั่นคือ โครงสร้างโค้ดของโปรแกรมจุดยอด เรขาคณิต และพิกเซลจะเหมือนกัน แม้ว่าเชเดอร์จะทำงานต่างกันก็ตาม ข้อมูลจำเพาะใหม่สามารถดูได้ใน Xbox 360 ซึ่ง GPU ได้รับการออกแบบเป็นพิเศษโดย ATi สำหรับ Microsoft น่าสนใจมากที่จะเห็นว่า DirectX 10 ใหม่มีศักยภาพเพียงใด

หน่วยการแมปพื้นผิว (TMU)

ควรเลือกและกรองพื้นผิว งานนี้ดำเนินการโดยหน่วยการแมปพื้นผิว ซึ่งทำงานร่วมกับหน่วยเชเดอร์พิกเซลและจุดยอด งานของ TMU คือการใช้การดำเนินการกับพื้นผิวกับพิกเซล จำนวนหน่วยพื้นผิวใน GPU มักใช้เพื่อเปรียบเทียบประสิทธิภาพพื้นผิวของการ์ดวิดีโอ มีเหตุผลที่จะสรุปได้ว่าการ์ดกราฟิกที่มี TMU มากกว่าจะให้ประสิทธิภาพพื้นผิวที่ดีกว่า

หน่วยปฏิบัติการแรสเตอร์ (ROP)

โปรเซสเซอร์แรสเตอร์มีหน้าที่เขียนข้อมูลพิกเซลลงในหน่วยความจำ ความเร็วในการดำเนินการนี้คืออัตราการเติม ในช่วงแรกของตัวเร่งความเร็ว 3D ROP และอัตราการเติมเป็นคุณลักษณะที่สำคัญมากของการ์ดแสดงผล ในปัจจุบัน งาน ROP ยังคงมีความสำคัญ แต่ประสิทธิภาพของการ์ดแสดงผลไม่ได้ถูกจำกัดด้วยบล็อกเหล่านี้เหมือนแต่ก่อนอีกต่อไป ดังนั้นประสิทธิภาพ (และจำนวน) ของ ROP จึงไม่ค่อยถูกนำมาใช้ในการประเมินความเร็วของการ์ดแสดงผล

สายพานลำเลียง

ไปป์ไลน์ใช้เพื่ออธิบายสถาปัตยกรรมของการ์ดแสดงผลและให้แนวคิดที่ชัดเจนเกี่ยวกับประสิทธิภาพของ GPU

สายพานลำเลียงไม่สามารถถือเป็นคำศัพท์ทางเทคนิคที่เข้มงวดได้ GPU ใช้ไปป์ไลน์ที่แตกต่างกันซึ่งทำหน้าที่ต่างกัน ในอดีต ไปป์ไลน์หมายถึงโปรเซสเซอร์พิกเซลที่เชื่อมต่อกับ Texture Mapping Unit (TMU) ตัวอย่างเช่น การ์ดแสดงผล Radeon 9700 ใช้โปรเซสเซอร์แปดพิกเซล ซึ่งแต่ละตัวเชื่อมต่อกับ TMU ของตัวเอง ดังนั้นการ์ดจึงถือว่ามีแปดไปป์ไลน์

แต่โปรเซสเซอร์สมัยใหม่นั้นยากมากที่จะอธิบายด้วยจำนวนไปป์ไลน์ เมื่อเทียบกับการออกแบบก่อนหน้านี้ โปรเซสเซอร์ใหม่ใช้โครงสร้างแบบแยกส่วนและกระจัดกระจาย ATi ถือได้ว่าเป็นผู้ริเริ่มในด้านนี้ซึ่งเปลี่ยนมาใช้โครงสร้างโมดูลาร์ด้วยการ์ดวิดีโอกลุ่ม X1000 ซึ่งทำให้สามารถบรรลุประสิทธิภาพที่เพิ่มขึ้นผ่านการเพิ่มประสิทธิภาพภายใน บล็อก CPU บางตัวถูกใช้มากกว่าบล็อกอื่นๆ และเพื่อปรับปรุงประสิทธิภาพของ GPU ATi ได้พยายามค้นหาการประนีประนอมระหว่างจำนวนบล็อกที่ต้องการและพื้นที่ดาย (ซึ่งไม่สามารถเพิ่มขึ้นได้มากนัก) ในสถาปัตยกรรมนี้ คำว่า "ไปป์ไลน์พิกเซล" ได้สูญเสียความหมายไปแล้ว เนื่องจากโปรเซสเซอร์พิกเซลไม่ได้เชื่อมต่อกับ TMU ของตัวเองอีกต่อไป ตัวอย่างเช่น ATi Radeon X1600 GPU มีหน่วยเชเดอร์พิกเซล 12 หน่วยและมีหน่วยการแมปพื้นผิว TMU เพียงสี่หน่วย ดังนั้นจึงเป็นไปไม่ได้ที่จะบอกว่าสถาปัตยกรรมของโปรเซสเซอร์นี้มีไปป์ไลน์ 12 พิกเซลเช่นเดียวกับที่เป็นไปไม่ได้ที่จะบอกว่ามีเพียงสี่เท่านั้น อย่างไรก็ตาม ตามธรรมเนียมแล้ว ท่อพิกเซลยังคงถูกกล่าวถึงอยู่

เมื่อพิจารณาตามสมมติฐานข้างต้น มักใช้จำนวนไปป์ไลน์พิกเซลใน GPU เพื่อเปรียบเทียบการ์ดแสดงผล (ยกเว้นบรรทัด ATi X1x00) ตัวอย่างเช่นหากคุณใช้การ์ดแสดงผลที่มีไปป์ไลน์ 24 และ 16 ก็ค่อนข้างสมเหตุสมผลที่จะถือว่าการ์ดที่มี 24 ไปป์ไลน์จะเร็วกว่า

สถาปัตยกรรม GPU: เทคโนโลยี

กระบวนการทางเทคนิค

คำนี้หมายถึงขนาดขององค์ประกอบเดียว (ทรานซิสเตอร์) ของชิปและความแม่นยำของกระบวนการผลิต การปรับปรุงกระบวนการทางเทคนิคทำให้ได้องค์ประกอบที่มีขนาดเล็กลง ตัวอย่างเช่น กระบวนการ 0.18 ไมครอนให้คุณสมบัติที่ใหญ่กว่ากระบวนการ 0.13 ไมครอน ดังนั้นจึงไม่ได้มีประสิทธิภาพเท่าที่ควร ทรานซิสเตอร์ขนาดเล็กทำงานที่แรงดันไฟฟ้าต่ำ ในทางกลับกัน แรงดันไฟฟ้าที่ลดลงจะส่งผลให้ความต้านทานความร้อนลดลง ซึ่งส่งผลให้ปริมาณความร้อนที่เกิดขึ้นลดลง การปรับปรุงกระบวนการทางเทคนิคทำให้สามารถลดระยะห่างระหว่างบล็อคการทำงานของชิปได้ และการถ่ายโอนข้อมูลใช้เวลาน้อยลง ระยะทางที่สั้นลง แรงดันไฟฟ้าที่ลดลง และการปรับปรุงอื่นๆ ช่วยให้สามารถบรรลุความเร็วสัญญาณนาฬิกาที่สูงขึ้นได้

สิ่งที่ทำให้ความเข้าใจค่อนข้างซับซ้อนก็คือ ปัจจุบันมีการใช้ทั้งไมโครเมตร (μm) และนาโนเมตร (nm) เพื่อกำหนดกระบวนการทางเทคนิค ในความเป็นจริง ทุกอย่างง่ายมาก: 1 นาโนเมตรเท่ากับ 0.001 ไมโครเมตร ดังนั้นกระบวนการ 0.09 μm และ 90 นาโนเมตรจึงเหมือนกัน ตามที่ระบุไว้ข้างต้น เทคโนโลยีกระบวนการที่เล็กลงช่วยให้ความเร็วสัญญาณนาฬิกาสูงขึ้นได้ ตัวอย่างเช่น หากเราเปรียบเทียบการ์ดวิดีโอกับชิป 0.18 ไมครอนและ 0.09 ไมครอน (90 นาโนเมตร) ก็ค่อนข้างสมเหตุสมผลที่จะคาดหวังความถี่ที่สูงกว่าจากการ์ด 90 นาโนเมตร

ความเร็วสัญญาณนาฬิกาของ GPU

ความเร็วสัญญาณนาฬิกาของ GPU วัดเป็นเมกะเฮิรตซ์ (MHz) ซึ่งเป็นล้านรอบสัญญาณนาฬิกาต่อวินาที

ความเร็วสัญญาณนาฬิกาส่งผลโดยตรงต่อประสิทธิภาพของ GPU ยิ่งสูงเท่าไรก็ยิ่งสามารถทำงานได้มากขึ้นในไม่กี่วินาที สำหรับตัวอย่างแรก ลองใช้การ์ดวิดีโอ nVidia GeForce 6600 และ 6600 GT: โปรเซสเซอร์กราฟิก 6600 GT ทำงานที่ 500 MHz ในขณะที่การ์ด 6600 ปกติทำงานที่ 400 MHz เนื่องจากโปรเซสเซอร์มีความเหมือนกันทางเทคนิค ความเร็วสัญญาณนาฬิกาที่เพิ่มขึ้น 20% ของ 6600 GT จึงส่งผลให้ประสิทธิภาพสูงขึ้น

แต่ความเร็วสัญญาณนาฬิกาไม่ใช่ทุกอย่าง โปรดทราบว่าประสิทธิภาพได้รับอิทธิพลอย่างมากจากสถาปัตยกรรม สำหรับตัวอย่างที่สอง ลองใช้การ์ดแสดงผล GeForce 6600 GT และ GeForce 6800 GT GPU 6600 GT ทำงานที่ 500 MHz แต่ 6800 GT ทำงานที่ 350 MHz ตอนนี้ให้เราคำนึงว่า 6800 GT ใช้ไปป์ไลน์ 16 พิกเซล ในขณะที่ 6600 GT ใช้เพียงแปดช่องเท่านั้น ดังนั้น 6800 GT ที่มี 16 ไปป์ไลน์ที่ 350 MHz จะให้ประสิทธิภาพโดยประมาณเหมือนกับโปรเซสเซอร์ที่มีแปดไปป์ไลน์และเพิ่มความเร็วสัญญาณนาฬิกาเป็นสองเท่า (700 MHz) ด้วยเหตุนี้ ความเร็วสัญญาณนาฬิกาจึงสามารถใช้เพื่อเปรียบเทียบประสิทธิภาพได้อย่างง่ายดาย

หน่วยความจำวิดีโอในเครื่อง

หน่วยความจำการ์ดแสดงผลมีผลอย่างมากต่อประสิทธิภาพการทำงาน แต่พารามิเตอร์หน่วยความจำที่แตกต่างกันจะมีผลต่างกัน

ขนาดหน่วยความจำวิดีโอ

จำนวนหน่วยความจำวิดีโออาจเรียกได้ว่าเป็นพารามิเตอร์ที่ประเมินค่าสูงเกินไปที่สุดของการ์ดแสดงผล ผู้ใช้ที่ไม่มีประสบการณ์มักใช้ความจุของหน่วยความจำวิดีโอเพื่อเปรียบเทียบการ์ดที่แตกต่างกัน แต่ในความเป็นจริงแล้ว ความจุมีผลเพียงเล็กน้อยต่อประสิทธิภาพเมื่อเทียบกับพารามิเตอร์ต่างๆ เช่น ความถี่บัสหน่วยความจำและอินเทอร์เฟซ (ความกว้างของบัส)

ในกรณีส่วนใหญ่ การ์ดที่มีหน่วยความจำวิดีโอ 128 MB จะทำงานเกือบจะเหมือนกับการ์ดที่มี 256 MB แน่นอนว่ามีบางสถานการณ์ที่หน่วยความจำมากขึ้นจะปรับปรุงประสิทธิภาพ แต่โปรดจำไว้ว่าหน่วยความจำที่มากขึ้นจะไม่ทำให้ความเร็วในการเล่นเกมเร็วขึ้นโดยอัตโนมัติ

สิ่งที่ปริมาณจะมีประโยชน์คือในเกมที่มีพื้นผิวที่มีความละเอียดสูง นักพัฒนาเกมได้เตรียมพื้นผิวหลายชุดสำหรับเกม และยิ่งมีหน่วยความจำบนการ์ดแสดงผลมากขึ้นเท่าใด พื้นผิวที่โหลดก็จะมีความละเอียดสูงขึ้นเท่านั้น พื้นผิวที่มีความละเอียดสูงให้ความชัดเจนและรายละเอียดในเกมที่สูงขึ้น ดังนั้นจึงค่อนข้างสมเหตุสมผลที่จะนำการ์ดที่มีหน่วยความจำจำนวนมากหากตรงตามเกณฑ์อื่นทั้งหมด เราขอเตือนคุณอีกครั้งว่าความกว้างของบัสหน่วยความจำและความถี่ของมันมีผลกระทบต่อประสิทธิภาพมากกว่าจำนวนหน่วยความจำกายภาพบนการ์ดมาก

ความกว้างบัสหน่วยความจำ

ความกว้างบัสหน่วยความจำเป็นหนึ่งในส่วนที่สำคัญที่สุดของประสิทธิภาพของหน่วยความจำ บัสสมัยใหม่มีความกว้างตั้งแต่ 64 ถึง 256 บิต และในบางกรณีอาจมีขนาดถึง 512 บิตด้วยซ้ำ ยิ่งบัสหน่วยความจำกว้างขึ้น ข้อมูลก็ยิ่งสามารถถ่ายโอนต่อรอบสัญญาณนาฬิกาได้มากขึ้นเท่านั้น และสิ่งนี้ส่งผลโดยตรงต่อประสิทธิภาพการผลิต ตัวอย่างเช่น หากคุณใช้บัสสองตัวที่มีความถี่เท่ากัน ในทางทฤษฎีแล้ว บัส 128 บิตจะถ่ายโอนข้อมูลเป็นสองเท่าต่อรอบสัญญาณนาฬิกาของบัส 64 บิต และบัส 256 บิตก็ใหญ่เป็นสองเท่า

แบนด์วิธบัสที่สูงขึ้น (แสดงเป็นบิตหรือไบต์ต่อวินาที 1 ไบต์ = 8 บิต) ทำให้ประสิทธิภาพของหน่วยความจำสูงขึ้น นี่คือสาเหตุที่เมมโมรีบัสมีความสำคัญมากกว่าขนาดของมันมาก ที่ความถี่เท่ากัน บัสหน่วยความจำ 64 บิตจะทำงานที่ความเร็วเพียง 25% ของบัส 256 บิต!

ลองมาตัวอย่างต่อไปนี้ การ์ดแสดงผลที่มีหน่วยความจำวิดีโอขนาด 128 MB แต่มีบัส 256 บิต ให้ประสิทธิภาพหน่วยความจำที่สูงกว่ารุ่น 512 MB ที่มีบัส 64 บิตมาก สิ่งสำคัญที่ควรทราบคือสำหรับการ์ดบางรุ่นจากสาย ATi X1x00 ผู้ผลิตจะระบุข้อกำหนดของบัสหน่วยความจำภายใน แต่เราสนใจในพารามิเตอร์ของบัสภายนอก ตัวอย่างเช่น X1600 มีริงบัสภายในที่มีความกว้าง 256 บิต แต่บัสภายนอกที่มีความกว้างเพียง 128 บิต และในความเป็นจริงแล้ว บัสหน่วยความจำทำงานที่ประสิทธิภาพ 128 บิต

ประเภทหน่วยความจำ

หน่วยความจำสามารถแบ่งออกเป็นสองประเภทหลัก: SDR (การถ่ายโอนข้อมูลเดี่ยว) และ DDR (การถ่ายโอนข้อมูลสองครั้ง) ซึ่งข้อมูลจะถูกถ่ายโอนเร็วขึ้นสองเท่าต่อรอบสัญญาณนาฬิกา ปัจจุบันเทคโนโลยี SDR สำหรับการส่งสัญญาณเดี่ยวล้าสมัยไปแล้ว เนื่องจากหน่วยความจำ DDR ถ่ายโอนข้อมูลได้เร็วเป็นสองเท่าของ SDR จึงเป็นสิ่งสำคัญที่ต้องจำไว้ว่าการ์ดแสดงผลที่มีหน่วยความจำ DDR มักจะระบุความถี่เป็นสองเท่า ไม่ใช่ความถี่ทางกายภาพ ตัวอย่างเช่น หากระบุหน่วยความจำ DDR ไว้ที่ 1000 MHz นี่คือความถี่ที่มีประสิทธิภาพซึ่งหน่วยความจำ SDR ปกติต้องทำงานเพื่อให้ได้ปริมาณงานเท่ากัน แต่จริงๆ แล้วความถี่ทางกายภาพคือ 500 MHz

ด้วยเหตุนี้หลายคนจึงแปลกใจเมื่อมีการระบุความถี่ 1200 MHz DDR สำหรับหน่วยความจำของการ์ดแสดงผลและยูทิลิตี้รายงาน 600 MHz ดังนั้นคุณจะต้องทำความคุ้นเคย หน่วยความจำ DDR2 และ GDDR3/GDDR4 ทำงานบนหลักการเดียวกัน นั่นคือ มีการถ่ายโอนข้อมูลสองครั้ง ความแตกต่างระหว่างหน่วยความจำ DDR, DDR2, GDDR3 และ GDDR4 อยู่ที่เทคโนโลยีการผลิตและรายละเอียดบางอย่าง DDR2 สามารถทำงานที่ความถี่ที่สูงกว่าหน่วยความจำ DDR และ DDR3 สามารถทำงานที่ความถี่ที่สูงกว่า DDR2 ได้

ความถี่บัสหน่วยความจำ

เช่นเดียวกับโปรเซสเซอร์ หน่วยความจำ (หรือถ้าให้เจาะจงกว่านั้นคือบัสหน่วยความจำ) ทำงานที่ความเร็วสัญญาณนาฬิกาที่กำหนด โดยมีหน่วยเป็นเมกะเฮิรตซ์ ที่นี่ การเพิ่มความเร็วสัญญาณนาฬิกาส่งผลโดยตรงต่อประสิทธิภาพของหน่วยความจำ และความถี่บัสหน่วยความจำเป็นหนึ่งในพารามิเตอร์ที่ใช้ในการเปรียบเทียบประสิทธิภาพของการ์ดแสดงผล ตัวอย่างเช่นหากคุณสมบัติอื่น ๆ ทั้งหมด (ความกว้างบัสหน่วยความจำ ฯลฯ ) เหมือนกันก็ค่อนข้างสมเหตุสมผลที่จะบอกว่าการ์ดแสดงผลที่มีหน่วยความจำ 700 MHz นั้นเร็วกว่าการ์ดที่มีหน่วยความจำ 500 MHz

ขอย้ำอีกครั้งว่าความเร็วสัญญาณนาฬิกาไม่ใช่ทุกอย่าง หน่วยความจำ 700 MHz พร้อมบัส 64 บิตจะช้ากว่าหน่วยความจำ 400 MHz พร้อมบัส 128 บิต ประสิทธิภาพของหน่วยความจำ 400 MHz บนบัส 128 บิต เทียบเท่ากับหน่วยความจำ 800 MHz บนบัส 64 บิตโดยประมาณ คุณควรจำไว้ว่าความถี่ของ GPU และหน่วยความจำเป็นพารามิเตอร์ที่แตกต่างกันโดยสิ้นเชิงและมักจะแตกต่างกัน

อินเตอร์เฟซการ์ดวิดีโอ

ข้อมูลทั้งหมดที่ถ่ายโอนระหว่างการ์ดแสดงผลและโปรเซสเซอร์ผ่านอินเทอร์เฟซของการ์ดแสดงผล ปัจจุบันมีการใช้อินเทอร์เฟซสามประเภทสำหรับการ์ดแสดงผล: PCI, AGP และ PCI Express แตกต่างกันในด้านแบนด์วิธและคุณลักษณะอื่นๆ เป็นที่ชัดเจนว่ายิ่งปริมาณงานสูง ความเร็วการแลกเปลี่ยนก็จะยิ่งสูงขึ้นตามไปด้วย อย่างไรก็ตาม เฉพาะการ์ดที่ทันสมัยที่สุดเท่านั้นที่สามารถใช้แบนด์วิธสูงและเพียงบางส่วนเท่านั้น เมื่อถึงจุดหนึ่ง ความเร็วของอินเทอร์เฟซก็หยุดเป็นคอขวดแล้ว แต่ปัจจุบันก็เพียงพอแล้ว

บัสที่ช้าที่สุดที่ผลิตการ์ดแสดงผลคือ PCI (Peripheral Components Interconnect) โดยไม่ต้องเข้าสู่ประวัติศาสตร์แน่นอน PCI ลดประสิทธิภาพของการ์ดแสดงผลลงอย่างมาก ดังนั้นพวกเขาจึงเปลี่ยนไปใช้อินเทอร์เฟซ AGP (Accelerated Graphics Port) แต่แม้แต่ข้อกำหนด AGP 1.0 และ 2x ก็ยังจำกัดประสิทธิภาพ เมื่อมาตรฐานเพิ่มความเร็วเป็นระดับ AGP 4x เราเริ่มเข้าใกล้ขีดจำกัดในทางปฏิบัติของแบนด์วิธที่การ์ดแสดงผลสามารถรองรับได้ ข้อมูลจำเพาะ AGP 8x เพิ่มปริมาณงานเป็นสองเท่าอีกครั้งเมื่อเทียบกับ AGP 4x (2.16 GB/s) แต่เราไม่ได้รับการเพิ่มประสิทธิภาพกราฟิกที่เห็นได้ชัดเจนอีกต่อไป

บัสใหม่ล่าสุดและเร็วที่สุดคือ PCI Express โดยทั่วไปกราฟิกการ์ดใหม่จะใช้อินเทอร์เฟซ PCI Express x16 ซึ่งรวมเลน PCI Express 16 เลนเข้าด้วยกันเพื่อปริมาณงานรวม 4 GB/s (ทิศทางเดียว) นี่เป็นสองเท่าของปริมาณงานของ AGP 8x บัส PCI Express ให้แบนด์วิธดังกล่าวในทั้งสองทิศทาง (การถ่ายโอนข้อมูลเข้าและออกจากการ์ดแสดงผล) แต่ความเร็วของมาตรฐาน AGP 8x ก็เพียงพอแล้ว ดังนั้นเราจึงยังไม่พบสถานการณ์ที่การเปลี่ยนมาใช้ PCI Express ทำให้ประสิทธิภาพเพิ่มขึ้นเมื่อเทียบกับ AGP 8x (หากพารามิเตอร์ฮาร์ดแวร์อื่นเหมือนกัน) ตัวอย่างเช่น เวอร์ชัน AGP ของ GeForce 6800 Ultra จะทำงานเหมือนกับ 6800 Ultra สำหรับ PCI Express

วันนี้ทางที่ดีควรซื้อการ์ดที่มีอินเทอร์เฟซ PCI Express แต่จะยังคงอยู่ในตลาดไปอีกหลายปี การ์ดที่ทรงพลังที่สุดไม่ได้ผลิตด้วยอินเทอร์เฟซ AGP 8x อีกต่อไปและตามกฎแล้วโซลูชัน PCI Express นั้นหาได้ง่ายกว่าอะนาล็อก AGP และมีราคาถูกกว่า

โซลูชั่นบนการ์ดแสดงผลหลายตัว

การใช้การ์ดแสดงผลหลายใบเพื่อเพิ่มประสิทธิภาพกราฟิกไม่ใช่แนวคิดใหม่ ในช่วงแรก ๆ ของกราฟิก 3D 3dfx เข้าสู่ตลาดโดยมีกราฟิกการ์ดสองตัวที่ทำงานขนานกัน แต่ด้วยการที่ 3dfx หายไป เทคโนโลยีสำหรับการ์ดแสดงผลสำหรับผู้บริโภคหลายตัวที่จะทำงานร่วมกันจึงถูกลืมเลือน แม้ว่า ATI จะสร้างระบบที่คล้ายกันสำหรับเครื่องจำลองมืออาชีพนับตั้งแต่เปิดตัว Radeon 9700 สองสามปีที่ผ่านมาเทคโนโลยีกลับมาสู่ ตลาด: ด้วยการมาถึงของโซลูชั่น nVidia SLIและอีกไม่นาน เอทีไอ ครอสไฟร์ .

การใช้กราฟิกการ์ดหลายตัวร่วมกันจะให้ประสิทธิภาพที่เพียงพอในการรันเกมด้วยการตั้งค่าคุณภาพสูงและความละเอียดสูง แต่การเลือกวิธีแก้ปัญหาอย่างใดอย่างหนึ่งนั้นไม่ใช่เรื่องง่าย

เริ่มจากข้อเท็จจริงที่ว่าโซลูชันที่ใช้การ์ดแสดงผลหลายตัวต้องใช้พลังงานจำนวนมาก ดังนั้นแหล่งจ่ายไฟจึงต้องมีพลังเพียงพอ ความร้อนทั้งหมดนี้จะต้องถูกลบออกจากการ์ดแสดงผลดังนั้นคุณต้องใส่ใจกับเคสพีซีและการระบายความร้อนเพื่อไม่ให้ระบบร้อนเกินไป

นอกจากนี้ โปรดจำไว้ว่า SLI/CrossFire ต้องการมาเธอร์บอร์ดที่เหมาะสม (ไม่ว่าจะสำหรับเทคโนโลยีใดเทคโนโลยีหนึ่ง) ซึ่งโดยปกติจะมีราคาสูงกว่ารุ่นมาตรฐาน การกำหนดค่า nVidia SLI จะทำงานบนบอร์ด nForce4 บางรุ่นเท่านั้น และการ์ด ATi CrossFire จะทำงานบนเมนบอร์ดที่มีชิปเซ็ต CrossFire หรือ Intel บางรุ่นเท่านั้น เพื่อให้เรื่องยุ่งยาก การกำหนดค่า CrossFire บางอย่างจำเป็นต้องมีการ์ดตัวใดตัวหนึ่งต้องเป็นการ์ดพิเศษ: CrossFire Edition หลังจากการเปิดตัว CrossFire สำหรับการ์ดแสดงผลบางรุ่น ATi อนุญาตให้รวมเทคโนโลยีการทำงานร่วมกันผ่านบัส PCI Express และด้วยการเปิดตัวไดรเวอร์เวอร์ชันใหม่ จำนวนชุดค่าผสมที่เป็นไปได้จะเพิ่มขึ้น แต่ถึงกระนั้น CrossFire ของฮาร์ดแวร์ที่มีการ์ด CrossFire Edition ที่เกี่ยวข้องก็ยังให้ประสิทธิภาพที่สูงกว่า แต่การ์ด CrossFire Edition ก็มีราคาแพงกว่ารุ่นปกติเช่นกัน ปัจจุบัน คุณสามารถเปิดใช้งานซอฟต์แวร์โหมด CrossFire (โดยไม่ต้องใช้การ์ด CrossFire Edition) บนกราฟิกการ์ด Radeon X1300, X1600 และ X1800 GTO ได้

มีปัจจัยอื่น ๆ ที่ต้องพิจารณาเช่นกัน แม้ว่ากราฟิกการ์ดสองตัวที่ทำงานร่วมกันจะช่วยเพิ่มประสิทธิภาพ แต่ก็ยังห่างไกลจากสองเท่า แต่คุณจะจ่ายเงินเป็นสองเท่า ส่วนใหญ่แล้วผลผลิตจะเพิ่มขึ้น 20-60% และในบางกรณี เนื่องจากค่าใช้จ่ายในการคำนวณเพิ่มเติมสำหรับการจับคู่ จึงไม่มีการเพิ่มขึ้นเลย ด้วยเหตุนี้ การกำหนดค่าการ์ดหลายใบจึงไม่น่าจะคุ้มค่ากับรุ่นที่ราคาถูกกว่า เนื่องจากการ์ดกราฟิกที่มีราคาแพงกว่ามักจะมีประสิทธิภาพเหนือกว่าการ์ดราคาถูกสองสามใบเสมอ โดยทั่วไปแล้ว สำหรับผู้บริโภคส่วนใหญ่ การซื้อโซลูชัน SLI/CrossFire นั้นไม่สมเหตุสมผล แต่หากคุณต้องการเปิดใช้งานตัวเลือกการปรับปรุงคุณภาพทั้งหมดหรือเล่นด้วยความละเอียดสูงสุด เช่น 2560x1600 เมื่อคุณต้องการคำนวณมากกว่า 4 ล้านพิกเซลต่อเฟรม คุณไม่สามารถทำได้หากไม่มีการ์ดแสดงผลที่จับคู่สองหรือสี่ใบ

คุณสมบัติด้านการมองเห็น

นอกเหนือจากข้อกำหนดด้านฮาร์ดแวร์เพียงอย่างเดียวแล้ว GPU รุ่นและรุ่นที่แตกต่างกันอาจแตกต่างกันในชุดฟังก์ชัน ตัวอย่างเช่น มักกล่าวกันว่าการ์ดรุ่น ATi Radeon X800 XT เข้ากันได้กับ Shader Model 2.0b (SM) ในขณะที่ nVidia GeForce 6800 Ultra เข้ากันได้กับ SM 3.0 แม้ว่าข้อกำหนดฮาร์ดแวร์จะอยู่ใกล้กัน (16 ไปป์ไลน์ ). ดังนั้นผู้บริโภคจำนวนมากจึงตัดสินใจเลือกใช้โซลูชันอย่างใดอย่างหนึ่งโดยไม่รู้ว่าความแตกต่างนั้นหมายถึงอะไร เรามาพูดถึงคุณสมบัติด้านภาพและความสำคัญต่อผู้ใช้กันดีกว่า

ชื่อเหล่านี้มักใช้ในข้อพิพาท แต่มีเพียงไม่กี่คนที่รู้ว่าชื่อเหล่านี้หมายถึงอะไร เพื่อทำความเข้าใจ เรามาเริ่มกันที่ประวัติของ API กราฟิกกันก่อน DirectX และ OpenGL เป็น API กราฟิก ซึ่งก็คือ Application Programming Interfaces ซึ่งเป็นมาตรฐานโอเพ่นโค้ดที่ทุกคนสามารถใช้ได้

ก่อนการถือกำเนิดของ API กราฟิก ผู้ผลิต GPU แต่ละรายใช้กลไกของตนเองในการสื่อสารกับเกม นักพัฒนาต้องเขียนโค้ดแยกกันสำหรับ GPU แต่ละตัวที่ต้องการรองรับ วิธีการที่มีราคาแพงมากและไม่มีประสิทธิภาพ เพื่อแก้ไขปัญหานี้ API สำหรับกราฟิก 3 มิติจึงได้รับการพัฒนาเพื่อให้นักพัฒนาเขียนโค้ดสำหรับ API เฉพาะ ไม่ใช่สำหรับการ์ดแสดงผลโดยเฉพาะ หลังจากนั้นปัญหาความเข้ากันได้ก็ตกอยู่กับผู้ผลิตการ์ดแสดงผล ซึ่งต้องแน่ใจว่าไดรเวอร์จะเข้ากันได้กับ API

ปัญหาเดียวที่ยังคงอยู่คือทุกวันนี้มีการใช้ API สองตัวที่แตกต่างกัน ได้แก่ Microsoft DirectX และ OpenGL โดยที่ GL ย่อมาจาก Graphics Library เนื่องจาก DirectX API ได้รับความนิยมมากขึ้นในเกมในปัจจุบัน เราจะมุ่งเน้นไปที่มัน และมาตรฐานนี้มีอิทธิพลอย่างมากต่อการพัฒนาเกม

DirectX เป็นการสร้างสรรค์ของ Microsoft ในความเป็นจริง DirectX มี API หลายตัว โดยมีเพียงตัวเดียวเท่านั้นที่ใช้สำหรับกราฟิก 3D DirectX มี API สำหรับเสียง เพลง อุปกรณ์อินพุต ฯลฯ Direct3D API รับผิดชอบกราฟิก 3 มิติใน DirectX เมื่อพูดถึงการ์ดวิดีโอนี่คือความหมายดังนั้นในเรื่องนี้แนวคิด DirectX และ Direct3D สามารถใช้แทนกันได้

DirectX ได้รับการอัปเดตเป็นระยะตามความก้าวหน้าของเทคโนโลยีกราฟิก และนักพัฒนาเกมใช้เทคนิคการเขียนโปรแกรมเกมใหม่ๆ เนื่องจาก DirectX ได้รับความนิยมอย่างรวดเร็ว ผู้ผลิต GPU จึงเริ่มปรับแต่งการออกผลิตภัณฑ์ใหม่เพื่อรองรับความสามารถของ DirectX ด้วยเหตุนี้ การ์ดแสดงผลจึงมักเชื่อมโยงกับการรองรับฮาร์ดแวร์สำหรับ DirectX รุ่นใดรุ่นหนึ่ง (DirectX 8, 9.0 หรือ 9.0c)

เพื่อให้เรื่องยุ่งยาก บางส่วนของ Direct3D API สามารถเปลี่ยนแปลงได้ตลอดเวลาโดยไม่ต้องเปลี่ยนรุ่น DirectX ตัวอย่างเช่น ข้อกำหนด DirectX 9.0 ระบุการรองรับ Pixel Shader 2.0 แต่การอัปเดต DirectX 9.0c รวมถึง Pixel Shader 3.0 ดังนั้นแม้ว่าการ์ดจะเป็นคลาส DirectX 9 แต่ก็สามารถรองรับชุดคุณสมบัติที่แตกต่างกันได้ ตัวอย่างเช่น Radeon 9700 รองรับ Shader Model 2.0 และ Radeon X1800 รองรับ Shader Model 3.0 แม้ว่าการ์ดทั้งสองจะจัดเป็นรุ่น DirectX 9 ก็ตาม

โปรดจำไว้ว่าเมื่อสร้างเกมใหม่ นักพัฒนาจะคำนึงถึงเจ้าของเครื่องเก่าและการ์ดแสดงผล เนื่องจากหากคุณเพิกเฉยต่อผู้ใช้กลุ่มนี้ ระดับการขายจะลดลง ด้วยเหตุผลนี้ เส้นทางโค้ดหลายเส้นทางจึงถูกสร้างขึ้นในเกม เกมคลาส DirectX 9 อาจมีเส้นทาง DirectX 8 และแม้แต่เส้นทาง DirectX 7 สำหรับความเข้ากันได้ โดยปกติหากเลือกเส้นทางเก่าเอฟเฟกต์เสมือนบางส่วนที่ปรากฏบนการ์ดวิดีโอใหม่จะหายไปจากเกม แต่อย่างน้อยคุณก็สามารถเล่นได้แม้กับฮาร์ดแวร์เก่า

เกมใหม่จำนวนมากจำเป็นต้องติดตั้ง DirectX เวอร์ชันล่าสุด แม้ว่าการ์ดวิดีโอจะมาจากรุ่นก่อนก็ตาม นั่นคือเกมใหม่ที่จะใช้เส้นทาง DirectX 8 ยังคงต้องติดตั้ง DirectX 9 เวอร์ชันล่าสุดสำหรับการ์ดวิดีโอคลาส DirectX 8

อะไรคือความแตกต่างระหว่าง Direct3D API เวอร์ชันต่างๆ ใน ​​DirectX? DirectX เวอร์ชันก่อนหน้า - 3, 5, 6 และ 7 - ค่อนข้างง่ายในความสามารถของ Direct3D API นักพัฒนาสามารถเลือกเอฟเฟ็กต์ภาพจากรายการแล้วทดสอบวิธีการทำงานในเกมได้ ขั้นตอนสำคัญถัดไปในการเขียนโปรแกรมกราฟิกคือ DirectX 8 ซึ่งเปิดตัวความสามารถในการโปรแกรมการ์ดแสดงผลโดยใช้เชเดอร์ ดังนั้นเป็นครั้งแรกที่นักพัฒนามีอิสระในการเขียนโปรแกรมเอฟเฟกต์ตามที่พวกเขาต้องการ DirectX 8 รองรับเวอร์ชันของ Pixel Shader 1.0 ถึง 1.3 และ Vertex Shader 1.0 DirectX 8.1 ซึ่งเป็นเวอร์ชันอัปเดตของ DirectX 8 ได้รับ Pixel Shader 1.4 และ Vertex Shader 1.1

ใน DirectX 9 คุณสามารถสร้างโปรแกรมเชเดอร์ที่ซับซ้อนยิ่งขึ้นได้ DirectX 9 รองรับ Pixel Shader 2.0 และ Vertex Shader 2.0 DirectX 9c ซึ่งเป็น DirectX 9 เวอร์ชันอัปเดตได้รวมข้อกำหนด Pixel Shader 3.0 ไว้ด้วย

DirectX 10 ซึ่งเป็น API เวอร์ชันที่กำลังจะมาถึงจะมาพร้อมกับ Windows Vista เวอร์ชันใหม่ คุณไม่สามารถติดตั้ง DirectX 10 บน Windows XP ได้

HDR ย่อมาจาก "ช่วงไดนามิกสูง" เกมที่มีแสง HDR สามารถสร้างภาพที่สมจริงมากกว่าเกมที่ไม่มีแสงดังกล่าว และการ์ดแสดงผลบางรุ่นอาจไม่รองรับแสง HDR

ก่อนการถือกำเนิดของกราฟิกการ์ด DirectX 9 GPU ถูกจำกัดอย่างรุนแรงด้วยความแม่นยำในการคำนวณแสง จนถึงขณะนี้ แสงสามารถคำนวณได้ด้วยระดับภายใน 256 (8 บิต) เท่านั้น

เมื่อการ์ดแสดงผล DirectX 9 ปรากฏขึ้น สามารถสร้างแสงที่มีความแม่นยำสูง - เต็ม 24 บิตหรือ 16.7 ล้านระดับ

ด้วยระดับ 16.7 ล้านระดับและก้าวต่อไปในประสิทธิภาพของการ์ดวิดีโอ DirectX 9/Shader Model 2.0 แสงไฟ HDR จึงเกิดขึ้นได้บนคอมพิวเตอร์ นี่เป็นเทคโนโลยีที่ค่อนข้างซับซ้อน และคุณต้องดูมันอย่างมีไดนามิก กล่าวง่ายๆ ก็คือ แสง HDR จะเพิ่มคอนทราสต์ (เฉดสีเข้มจะดูเข้มขึ้น ส่วนเฉดสีอ่อนจะดูสว่างกว่า) ในขณะเดียวกันก็เพิ่มปริมาณรายละเอียดแสงในบริเวณที่มืดและสว่าง เกมที่มีแสง HDR ดูมีชีวิตชีวาและสมจริงมากกว่าที่ไม่มีเลย

GPU ที่สอดคล้องกับข้อกำหนด Pixel Shader 3.0 ล่าสุดช่วยให้การคำนวณแสงที่แม่นยำยิ่งขึ้นแบบ 32 บิตและการผสมผสานจุดลอยตัว ดังนั้นการ์ดวิดีโอคลาส SM 3.0 จึงสามารถรองรับวิธีจัดแสง OpenEXR HDR พิเศษที่ออกแบบมาสำหรับอุตสาหกรรมภาพยนตร์โดยเฉพาะ

เกมบางเกมที่รองรับเฉพาะแสง OpenEXR HDR จะไม่ทำงานด้วยแสง HDR บนกราฟิกการ์ด Shader Model 2.0 อย่างไรก็ตาม เกมที่ไม่ใช้วิธี OpenEXR จะทำงานบนการ์ดกราฟิก DirectX 9 ใดๆ ตัวอย่างเช่น Oblivion ใช้วิธีการ OpenEXR HDR และอนุญาตให้ใช้แสง HDR บนการ์ดกราฟิกล่าสุดที่รองรับข้อกำหนด Shader Model 3.0 เท่านั้น ตัวอย่างเช่น nVidia GeForce 6800 หรือ ATi Radeon X1800 เกมที่ใช้เอ็นจิ้น 3 มิติของ Half-Life 2 รวมถึง Counter-Strike: Source และ Half-Life 2: Aftermath ที่กำลังจะมาถึง อนุญาตให้เปิดใช้งานการเรนเดอร์ HDR บนการ์ดกราฟิก DirectX 9 รุ่นเก่าที่รองรับเฉพาะ Pixel Shader 2.0 ตัวอย่าง ได้แก่ กลุ่มผลิตภัณฑ์ GeForce 5 หรือ ATi Radeon 9500

สุดท้ายนี้ โปรดทราบว่าการเรนเดอร์ HDR ทุกรูปแบบต้องใช้พลังการประมวลผลที่จริงจัง และแม้แต่ GPU ที่ทรงพลังที่สุดก็ทำได้ หากคุณต้องการเล่นเกมล่าสุดที่มีแสง HDR จำเป็นต้องมีกราฟิกประสิทธิภาพสูง

การลดรอยหยักแบบเต็มหน้าจอ (ตัวย่อ AA) ช่วยให้คุณสามารถกำจัดลักษณะ "บันได" ที่ขอบเขตของรูปหลายเหลี่ยมได้ แต่ควรคำนึงว่าการป้องกันนามแฝงแบบเต็มหน้าจอใช้ทรัพยากรคอมพิวเตอร์จำนวนมากซึ่งทำให้อัตราเฟรมลดลง

การป้องกันนามแฝงนั้นขึ้นอยู่กับประสิทธิภาพของหน่วยความจำวิดีโอ ดังนั้นการ์ดแสดงผลความเร็วสูงที่มีหน่วยความจำที่รวดเร็วจะสามารถคำนวณการป้องกันนามแฝงแบบเต็มหน้าจอโดยมีผลกระทบต่อประสิทธิภาพน้อยกว่าการ์ดแสดงผลราคาไม่แพง การลดรอยหยักสามารถเปิดใช้งานได้ในโหมดต่างๆ ตัวอย่างเช่น การลดรอยหยัก 4x จะสร้างภาพได้ดีกว่าการลดรอยหยัก 2x แต่ประสิทธิภาพจะได้รับผลกระทบอย่างมาก ในขณะที่การลดรอยหยัก 2x จะเพิ่มความละเอียดแนวนอนและแนวตั้งเป็นสองเท่า แต่โหมด 4x จะเพิ่มความละเอียดเป็นสี่เท่า

พื้นผิวจะถูกนำไปใช้กับวัตถุ 3 มิติทั้งหมดในเกม และยิ่งมุมของพื้นผิวที่แสดงมากเท่าไร พื้นผิวก็จะดูบิดเบี้ยวมากขึ้นเท่านั้น เพื่อกำจัดผลกระทบนี้ GPU จะใช้การกรองพื้นผิว

วิธีการกรองแบบแรกเรียกว่า Bilinear และทำให้เกิดแถบลักษณะเฉพาะที่ไม่น่าดูนัก สถานการณ์ดีขึ้นด้วยการใช้การกรองแบบไตรลิเนียร์ ตัวเลือกทั้งสองใช้งานได้กับการ์ดแสดงผลสมัยใหม่โดยแทบไม่มีการลดประสิทธิภาพการทำงาน

ปัจจุบัน วิธีที่ดีที่สุดในการกรองพื้นผิวคือการกรองแบบแอนไอโซทรอปิก (AF) เช่นเดียวกับการลดรอยหยักแบบเต็มหน้าจอ การกรองแบบแอนไอโซทรอปิกสามารถเปิดใช้งานได้ในระดับต่างๆ ตัวอย่างเช่น 8x AF ให้คุณภาพการกรองที่ดีกว่า 4x AF เช่นเดียวกับการลดรอยหยักแบบเต็มหน้าจอ การกรองแบบแอนไอโซทรอปิกต้องใช้พลังการประมวลผลจำนวนหนึ่ง ซึ่งจะเพิ่มขึ้นเมื่อระดับ AF เพิ่มขึ้น

เกม 3D ทั้งหมดถูกสร้างขึ้นโดยคำนึงถึงข้อกำหนดเฉพาะ และหนึ่งในข้อกำหนดเหล่านั้นจะกำหนดหน่วยความจำพื้นผิวที่เกมจำเป็นต้องใช้ พื้นผิวที่จำเป็นทั้งหมดจะต้องพอดีกับหน่วยความจำของการ์ดแสดงผลในระหว่างเล่นเกม ไม่เช่นนั้นประสิทธิภาพจะลดลงอย่างมาก เนื่องจากการเข้าถึงพื้นผิวไปยัง RAM ทำให้เกิดความล่าช้าอย่างมาก ไม่ต้องพูดถึงไฟล์เพจจิ้งบนฮาร์ดไดรฟ์ ดังนั้น หากผู้พัฒนาเกมนับหน่วยความจำวิดีโอขนาด 128 MB เป็นข้อกำหนดขั้นต่ำ ชุดของพื้นผิวที่ใช้งานอยู่ก็ไม่ควรเกิน 128 MB ในเวลาใดๆ ก็ตาม

เกมสมัยใหม่มีพื้นผิวหลายชุด ดังนั้นเกมจะทำงานได้โดยไม่มีปัญหาบนการ์ดวิดีโอรุ่นเก่าที่มีหน่วยความจำวิดีโอน้อยกว่า รวมถึงการ์ดใหม่ที่มีหน่วยความจำวิดีโอมากขึ้น ตัวอย่างเช่น เกมอาจมีพื้นผิวสามชุด: สำหรับ 128 MB, 256 MB และ 512 MB ปัจจุบันมีเกมเพียงไม่กี่เกมที่รองรับหน่วยความจำวิดีโอขนาด 512 MB แต่ยังคงเป็นเหตุผลหลักในการซื้อการ์ดแสดงผลที่มีหน่วยความจำจำนวนนี้ แม้ว่าการเพิ่มหน่วยความจำจะแทบไม่มีผลกระทบต่อประสิทธิภาพเลยก็ตาม คุณจะได้รับประโยชน์จากคุณภาพของภาพที่ดีขึ้น หากเกมรองรับชุดพื้นผิวที่เหมาะสม

จำนวนหน่วยการประมวลผล (เชเดอร์) หรือโปรเซสเซอร์

บางทีตอนนี้บล็อกเหล่านี้อาจเป็นส่วนหลักของชิปวิดีโอ พวกเขารันโปรแกรมพิเศษที่เรียกว่าเชเดอร์ ยิ่งไปกว่านั้น หากตัวเชเดอร์พิกเซลก่อนหน้านี้ทำบล็อกเชเดอร์พิกเซล และเวอร์เท็กซ์เชเดอร์ทำบล็อกจุดยอด ดังนั้นในบางครั้งสถาปัตยกรรมกราฟิกก็รวมเป็นหนึ่งเดียว และหน่วยประมวลผลสากลเหล่านี้เริ่มจัดการกับการคำนวณต่างๆ: จุดยอด พิกเซล เรขาคณิต และแม้กระทั่งการคำนวณสากล

เป็นครั้งแรกที่มีการใช้สถาปัตยกรรมแบบครบวงจรในชิปวิดีโอของเกมคอนโซล Microsoft Xbox 360 โปรเซสเซอร์กราฟิกนี้ได้รับการพัฒนาโดย ATI (ภายหลังซื้อโดย AMD) และในชิปวิดีโอสำหรับคอมพิวเตอร์ส่วนบุคคล หน่วยเชเดอร์แบบรวมก็ปรากฏในบอร์ด NVIDIA GeForce 8800 และตั้งแต่นั้นมา ชิปวิดีโอใหม่ทั้งหมดก็ใช้สถาปัตยกรรมแบบครบวงจรซึ่งมีรหัสสากลสำหรับโปรแกรมเชเดอร์ที่แตกต่างกัน (จุดยอด, พิกเซล, เรขาคณิต, ฯลฯ) และตัวประมวลผลแบบรวมที่เกี่ยวข้องสามารถรันโปรแกรมใดๆ ได้

ขึ้นอยู่กับจำนวนหน่วยประมวลผลและความถี่คุณสามารถเปรียบเทียบประสิทธิภาพทางคณิตศาสตร์ของการ์ดแสดงผลต่างๆ ขณะนี้เกมส่วนใหญ่ถูกจำกัดด้วยประสิทธิภาพของตัวเชเดอร์พิกเซล ดังนั้นจำนวนบล็อกเหล่านี้จึงมีความสำคัญมาก ตัวอย่างเช่นหากการ์ดแสดงผลรุ่นหนึ่งใช้ GPU ที่มีโปรเซสเซอร์คำนวณ 384 ตัวในองค์ประกอบและอีกรุ่นจากบรรทัดเดียวกันมี GPU ที่มีหน่วยประมวลผล 192 หน่วยดังนั้นที่ความถี่เดียวกันวินาทีจะช้าเป็นสองเท่าในการประมวลผลใด ๆ ประเภทของเชเดอร์และโดยทั่วไปจะมีประสิทธิผลมากกว่าเหมือนกัน

แม้ว่าจะไม่สามารถสรุปผลที่ชัดเจนเกี่ยวกับประสิทธิภาพตามจำนวนหน่วยประมวลผลเพียงอย่างเดียวได้ แต่ก็จำเป็นต้องคำนึงถึงความถี่สัญญาณนาฬิกาและสถาปัตยกรรมที่แตกต่างกันของหน่วยรุ่นต่างๆ และผู้ผลิตชิปด้วย จากตัวเลขเหล่านี้ คุณสามารถเปรียบเทียบชิปได้เฉพาะในกลุ่มผลิตภัณฑ์เดียวกันของผู้ผลิตรายเดียวเท่านั้น: AMD หรือ NVIDIA ในกรณีอื่นๆ คุณต้องใส่ใจกับการทดสอบประสิทธิภาพในเกมหรือแอปพลิเคชันที่สนใจ

หน่วยพื้นผิว (TMU)

หน่วย GPU เหล่านี้ทำงานร่วมกับโปรเซสเซอร์คอมพิวเตอร์ โดยจะเลือกและกรองพื้นผิวและข้อมูลอื่นๆ ที่จำเป็นสำหรับการสร้างฉากและการคำนวณทั่วไป จำนวนหน่วยพื้นผิวในชิปวิดีโอจะกำหนดประสิทธิภาพของพื้นผิว ซึ่งก็คือความเร็วในการดึงข้อมูลเทคเซลจากพื้นผิว

แม้ว่าเมื่อเร็ว ๆ นี้จะมีการเน้นไปที่การคำนวณทางคณิตศาสตร์มากขึ้น และพื้นผิวบางส่วนถูกแทนที่ด้วยขั้นตอน แต่ภาระบนบล็อก TMU ยังคงค่อนข้างสูง เนื่องจากนอกเหนือจากพื้นผิวหลักแล้ว การเลือกจะต้องทำจากแผนที่ปกติและแผนที่การเคลื่อนที่ เช่นเดียวกับบัฟเฟอร์การเรนเดอร์เป้าหมายการเรนเดอร์นอกหน้าจอ

เมื่อพิจารณาถึงความสำคัญของเกมหลายๆ เกม รวมถึงประสิทธิภาพของหน่วยพื้นผิว เราสามารถพูดได้ว่าจำนวนหน่วย TMU และประสิทธิภาพพื้นผิวสูงที่สอดคล้องกันก็เป็นหนึ่งในพารามิเตอร์ที่สำคัญที่สุดสำหรับชิปวิดีโอเช่นกัน พารามิเตอร์นี้มีผลกระทบเฉพาะกับความเร็วในการเรนเดอร์ภาพเมื่อใช้การกรองแบบแอนไอโซทรอปิก ซึ่งต้องการตัวอย่างพื้นผิวเพิ่มเติม เช่นเดียวกับอัลกอริธึมเงาอ่อนที่ซับซ้อนและอัลกอริธึมแบบใหม่ เช่น Screen Space Ambient Occlusion

หน่วยปฏิบัติการแรสเตอร์ไรเซชัน (ROP)

หน่วยแรสเตอร์ไรเซชันจะดำเนินการเขียนพิกเซลที่คำนวณโดยการ์ดแสดงผลลงในบัฟเฟอร์และดำเนินการผสมพิกเซล (การผสม) ดังที่เราได้กล่าวไว้ข้างต้น ประสิทธิภาพของบล็อก ROP ส่งผลต่ออัตราการเติม และนี่คือหนึ่งในคุณสมบัติหลักของการ์ดแสดงผลตลอดกาล และถึงแม้ว่าความสำคัญของมันจะลดลงบ้างเมื่อเร็ว ๆ นี้ แต่ก็ยังมีกรณีที่ประสิทธิภาพของแอปพลิเคชันขึ้นอยู่กับความเร็วและจำนวนบล็อก ROP สาเหตุส่วนใหญ่มักเกิดจากการใช้ตัวกรองหลังการประมวลผลและการเปิดใช้งานการป้องกันนามแฝงที่การตั้งค่าเกมในระดับสูง

อัตราการเติมจะแสดงความเร็วที่ชิปวิดีโอสามารถวาดพิกเซลได้ อัตราการบรรจุมีสองประเภท: อัตราการบรรจุพิกเซลและอัตราการเติมพื้นผิว อัตราเติมพิกเซลแสดงความเร็วของการวาดพิกเซลบนหน้าจอ และขึ้นอยู่กับความถี่ในการทำงานและจำนวนหน่วย ROP (หน่วยการดำเนินการแรสเตอร์และการผสม) และอัตราการเติมพื้นผิวคือความเร็วของการสุ่มตัวอย่างข้อมูลพื้นผิว ซึ่งขึ้นอยู่กับความถี่ในการทำงาน และจำนวนหน่วยพื้นผิว

ตัวอย่างเช่น อัตราการบรรจุพิกเซลของ GeForce GTX 275 คือ 633 (ความถี่ชิป) * 28 (จำนวนหน่วย ROP) = 17724 ล้านพิกเซลต่อวินาที และอัตราการเติมพื้นผิวคือ 633 * 80 (จำนวนหน่วยการสร้างพื้นผิว) = 50640 เมกะพิกเซล/วินาที . ยิ่งตัวเลขตัวแรกมากเท่าไร การ์ดแสดงผลก็จะสามารถวาดพิกเซลที่เสร็จแล้วได้เร็วยิ่งขึ้น และยิ่งตัวเลขตัวที่สองมากขึ้นเท่าไร ข้อมูลพื้นผิวก็จะยิ่งถูกสุ่มตัวอย่างเร็วขึ้นเท่านั้น พารามิเตอร์ทั้งสองมีความสำคัญสำหรับเกมสมัยใหม่ แต่ต้องมีความสมดุล นี่คือสาเหตุที่จำนวนหน่วย ROP ในชิปสมัยใหม่มักจะน้อยกว่าจำนวนหน่วยพื้นผิว

จำนวนบล็อกเชเดอร์ (พิกเซล, จุดยอด)

เชเดอร์จุดยอดมีหน้าที่สร้างจุดยอดของวัตถุ พวกเขากำหนดความสามารถของการ์ดสมัยใหม่ในการประมวลผลออบเจ็กต์กราฟิกดั้งเดิมและโดยทั่วไปประสิทธิภาพของการ์ดนั้นเอง ตัวเชดเดอร์พิกเซลมีความเกี่ยวข้องมากกว่าตัวเชดเดอร์จุดยอด ดังนั้นจำนวนของมันจึงมักจะมากกว่า การแบ่งพิกเซลและจุดยอดเมื่อเร็ว ๆ นี้ (ด้วยการเปิดตัว Direct 10) สูญเสียความเกี่ยวข้องไป ทั้งหมดจะถูกแทนที่ด้วยบล็อกเชเดอร์แบบรวมเดี่ยว ทั้งนี้ขึ้นอยู่กับสถานการณ์เฉพาะ พวกเขาใช้ทั้งเฉดสีพิกเซลและจุดยอด รวมถึงเฉดสีเรขาคณิต ซึ่งปรากฏใน Direct 10

จำนวนหน่วยพื้นผิว TMU

จำนวนหน่วยการสร้างพื้นผิว TMU ที่กำหนดประสิทธิภาพของพื้นผิว หรือความเร็วในการดึงข้อมูลและแมปพื้นผิว สิ่งนี้เกี่ยวข้องอย่างยิ่งกับการกรองแบบแอนไอโซทรอปิก บล็อก TMU มีความสำคัญที่สุดในเกมเก่า ตอนนี้พวกเขาสูญเสียความเกี่ยวข้องไปแล้วเพราะ... แบนด์วิธบัสหน่วยความจำในระบบสมัยใหม่ไม่เพียงพอสำหรับการ์ดประสิทธิภาพสูงที่จะทำงานได้ตามปกติ ส่วนใหญ่มีหน่วยความจำของตัวเองซึ่งจำเป็นสำหรับการจัดเก็บข้อมูลที่จำเป็น เช่น พื้นผิว จุดยอด ฯลฯ

หน่วยปฏิบัติการแรสเตอร์ไรเซชัน (ROP)

หน่วยแรสเตอร์ไรเซชันจะดำเนินการเขียนพิกเซลที่คำนวณโดยการ์ดแสดงผลลงในบัฟเฟอร์และดำเนินการผสมพิกเซล (การผสม) ดังที่เราได้กล่าวไว้ข้างต้น ประสิทธิภาพของบล็อก ROP ส่งผลต่ออัตราการเติม และนี่คือหนึ่งในคุณสมบัติหลักของการ์ดแสดงผลตลอดกาล และถึงแม้ว่าความสำคัญของมันจะลดลงบ้างเมื่อเร็ว ๆ นี้ แต่ก็ยังมีกรณีที่ประสิทธิภาพของแอปพลิเคชันขึ้นอยู่กับความเร็วและจำนวนบล็อก ROP สาเหตุส่วนใหญ่มักเกิดจากการใช้ตัวกรองหลังการประมวลผลและการเปิดใช้งานการป้องกันนามแฝงที่การตั้งค่าเกมในระดับสูง

โปรดทราบอีกครั้งว่าชิปวิดีโอสมัยใหม่ไม่สามารถประเมินได้จากจำนวนบล็อกและความถี่ที่แตกต่างกันเท่านั้น GPU แต่ละซีรีส์ใช้สถาปัตยกรรมใหม่ ซึ่งหน่วยประมวลผลมีความแตกต่างจากรุ่นเก่าอย่างมาก และอัตราส่วนของจำนวนยูนิตที่แตกต่างกันอาจแตกต่างกัน ดังนั้นหน่วย AMD ROP ในโซลูชันบางตัวสามารถทำงานได้ต่อรอบสัญญาณนาฬิกามากกว่าหน่วยในโซลูชัน NVIDIA และในทางกลับกัน เช่นเดียวกับความสามารถของหน่วยพื้นผิว TMU - มีความแตกต่างใน GPU รุ่นต่างๆ จากผู้ผลิตหลายราย และจะต้องนำมาพิจารณาเมื่อทำการเปรียบเทียบ

บล็อกเรขาคณิต

จนกระทั่งเมื่อไม่นานมานี้ จำนวนหน่วยประมวลผลเรขาคณิตไม่ได้มีความสำคัญมากนัก หนึ่งบล็อกบน GPU ก็เพียงพอสำหรับงานส่วนใหญ่ เนื่องจากรูปทรงเรขาคณิตในเกมค่อนข้างเรียบง่ายและจุดสนใจหลักของประสิทธิภาพคือการคำนวณทางคณิตศาสตร์ ความสำคัญของการประมวลผลเรขาคณิตแบบขนานและจำนวนบล็อกที่สอดคล้องกันเพิ่มขึ้นอย่างมากเมื่อมีการรองรับการเทสเซลเลชั่นเรขาคณิตใน DirectX 11 NVIDIA เป็นคนแรกที่ทำการประมวลผลข้อมูลเรขาคณิตแบบขนานเมื่อมีบล็อกที่เกี่ยวข้องหลายบล็อกปรากฏในชิปตระกูล GF1xx จากนั้น AMD ได้เปิดตัวโซลูชันที่คล้ายกัน (เฉพาะในโซลูชันอันดับต้น ๆ ของกลุ่มผลิตภัณฑ์ Radeon HD 6700 ที่ใช้ชิปเคย์แมน)

ขนาดหน่วยความจำวิดีโอ

ชิปวิดีโอใช้หน่วยความจำของตัวเองเพื่อจัดเก็บข้อมูลที่จำเป็น เช่น พื้นผิว จุดยอด ข้อมูลบัฟเฟอร์ ฯลฯ ดูเหมือนว่ายิ่งมีมากเท่าไรก็ยิ่งดีเท่านั้น แต่มันไม่ง่ายเลย การประมาณพลังของการ์ดแสดงผลตามจำนวนหน่วยความจำวิดีโอถือเป็นข้อผิดพลาดที่พบบ่อยที่สุด! ผู้ใช้ที่ไม่มีประสบการณ์มักประเมินค่าหน่วยความจำวิดีโอสูงเกินไป และยังคงใช้เพื่อเปรียบเทียบการ์ดแสดงผลรุ่นต่างๆ สิ่งนี้สามารถเข้าใจได้ - พารามิเตอร์นี้เป็นหนึ่งในพารามิเตอร์แรกที่ระบุไว้ในรายการคุณสมบัติของระบบที่เสร็จแล้วและเขียนด้วยแบบอักษรขนาดใหญ่บนกล่องการ์ดแสดงผล ดังนั้นผู้ซื้อที่ไม่มีประสบการณ์จึงดูเหมือนว่าเนื่องจากมีหน่วยความจำมากกว่าสองเท่าดังนั้นความเร็วของโซลูชันดังกล่าวจึงควรสูงเป็นสองเท่า ความจริงแตกต่างจากตำนานนี้ตรงที่ความทรงจำมีประเภทและลักษณะที่แตกต่างกัน และการเติบโตของผลิตภาพจะเติบโตจนถึงระดับหนึ่งเท่านั้น และเมื่อถึงนั้นก็หยุดลง

ชิปหน่วยความจำยังมีพารามิเตอร์ที่สำคัญกว่า เช่น ความกว้างของบัสหน่วยความจำและความถี่ในการทำงาน

ความกว้างบัสหน่วยความจำ

ความกว้างบัสหน่วยความจำเป็นคุณลักษณะที่สำคัญที่สุดที่ส่งผลต่อแบนด์วิธหน่วยความจำ (MBB) ความกว้างที่ใหญ่ขึ้นช่วยให้สามารถถ่ายโอนข้อมูลจากหน่วยความจำวิดีโอไปยัง GPU และย้อนกลับได้มากขึ้นต่อหน่วยเวลา ซึ่งส่งผลดีต่อประสิทธิภาพในกรณีส่วนใหญ่ ตามทฤษฎีแล้ว บัส 256 บิตสามารถถ่ายโอนข้อมูลได้มากเป็นสองเท่าต่อรอบสัญญาณนาฬิกาของบัส 128 บิต ในทางปฏิบัติ ความแตกต่างของความเร็วในการเรนเดอร์แม้ว่าจะไม่ถึงสองเท่า แต่ก็ใกล้เคียงกันมากในหลายกรณีโดยเน้นที่แบนด์วิดท์หน่วยความจำวิดีโอ

การ์ดแสดงผลสำหรับเล่นเกมสมัยใหม่ใช้ความกว้างของบัสที่แตกต่างกัน: ตั้งแต่ 64 ถึง 384 บิต (ก่อนหน้านี้มีชิปที่มีบัส 512 บิต) ขึ้นอยู่กับช่วงราคาและเวลาวางจำหน่ายของรุ่น GPU เฉพาะ สำหรับการ์ดแสดงผลต่ำสุดที่ถูกที่สุด 64 และน้อยกว่า 128 บิตมักใช้สำหรับระดับกลางตั้งแต่ 128 ถึง 256 บิตและการ์ดแสดงผลจากช่วงราคาบนจะใช้บัสที่มีความกว้างตั้งแต่ 256 ถึง 384 บิต ความกว้างของบัสไม่สามารถขยายได้อีกต่อไปเนื่องจากข้อจำกัดทางกายภาพ - ขนาดดายของ GPU ไม่เพียงพอที่จะรองรับบัสมากกว่า 512 บิต และนี่ถือว่าแพงเกินไป ดังนั้น แบนด์วิธหน่วยความจำจึงเพิ่มขึ้นโดยใช้หน่วยความจำประเภทใหม่ (ดูด้านล่าง)

ความถี่หน่วยความจำวิดีโอ

พารามิเตอร์อื่นที่ส่งผลต่อแบนด์วิดท์หน่วยความจำคือความถี่สัญญาณนาฬิกา และการเพิ่มแบนด์วิธมักจะส่งผลโดยตรงต่อประสิทธิภาพของการ์ดแสดงผลในแอปพลิเคชัน 3 มิติ ความถี่บัสหน่วยความจำบนการ์ดแสดงผลสมัยใหม่มีตั้งแต่ 533 (1,066 โดยคำนึงถึงการเพิ่มเป็นสองเท่า) MHz ถึง 1375 (5500 โดยคำนึงถึงการเพิ่มเป็นสี่เท่า) MHz นั่นคืออาจแตกต่างกันได้มากกว่าห้าเท่า! และเนื่องจากแบนด์วิดท์ขึ้นอยู่กับทั้งความถี่หน่วยความจำและความกว้างของบัส หน่วยความจำที่มีบัส 256 บิตซึ่งทำงานที่ความถี่ 800 (3200) MHz จะมีแบนด์วิดท์ที่มากกว่าเมื่อเทียบกับหน่วยความจำที่ทำงานที่ 1,000 (4000) MHz ที่ 128 - บิตบัส

ประเภทหน่วยความจำ

การ์ดแสดงผลสมัยใหม่มีหน่วยความจำหลายประเภท คุณจะไม่พบหน่วยความจำ SDR ความเร็วเดียวแบบเก่าอีกต่อไป แต่หน่วยความจำ DDR และ GDDR สมัยใหม่มีลักษณะที่แตกต่างกันอย่างมาก DDR และ GDDR ประเภทต่างๆ ช่วยให้คุณสามารถถ่ายโอนข้อมูลได้มากขึ้นสองหรือสี่เท่าที่ความถี่สัญญาณนาฬิกาเดียวกันต่อหน่วยเวลา ดังนั้นตัวเลขความถี่ในการทำงานจึงมักจะเพิ่มเป็นสองเท่าหรือสี่เท่าคูณด้วย 2 หรือ 4 ดังนั้นหากระบุความถี่ สำหรับหน่วยความจำ DDR 1400 MHz หน่วยความจำนี้ทำงานที่ความถี่กายภาพ 700 MHz แต่ระบุความถี่ที่เรียกว่า "มีประสิทธิภาพ" นั่นคือความถี่ที่หน่วยความจำ SDR ต้องทำงานเพื่อให้แบนด์วิธเดียวกัน สิ่งเดียวกันกับ GDDR5 แต่ความถี่นั้นเพิ่มขึ้นเป็นสี่เท่า

ข้อได้เปรียบหลักของหน่วยความจำประเภทใหม่คือความสามารถในการทำงานที่ความเร็วสัญญาณนาฬิกาที่สูงขึ้น และด้วยเหตุนี้ แบนด์วิดท์จึงเพิ่มขึ้นเมื่อเทียบกับเทคโนโลยีก่อนหน้า สิ่งนี้สามารถทำได้โดยต้องสูญเสียเวลาแฝงที่เพิ่มขึ้นซึ่งไม่สำคัญสำหรับการ์ดแสดงผลมากนัก

ตามมาด้วยว่ายิ่งหน่วยความจำการ์ดแสดงผลมีขนาดใหญ่เท่าใด ประสิทธิภาพก็จะยิ่งสูงขึ้นเท่านั้น พารามิเตอร์ที่สำคัญคือความถี่ในการทำงานของบัสและความกว้างของบัส ความกว้างของบัสที่ใหญ่ขึ้นทำให้สามารถถ่ายโอนข้อมูลได้มากขึ้นต่อหน่วยเวลาจากหน่วยความจำวิดีโอไปยัง GPU และด้านหลัง ช่วยให้มั่นใจได้ถึงประสิทธิภาพของการ์ดแสดงผลที่ดีขึ้นภายใต้เงื่อนไขที่เท่าเทียมกัน ความกว้างของบัสคือ 64-128 บิตสำหรับการ์ดวิดีโอราคาประหยัด 128-256 บิตสำหรับการ์ดระดับกลาง 256-512 บิตสำหรับการ์ดระดับไฮเอนด์


1.2 คำอธิบายการทำงานและแผนภาพบล็อกของอุปกรณ์

เมื่อสร้างภาพ หลังจากประมวลผลสัญญาณวิดีโอโดยโปรเซสเซอร์กลาง ข้อมูลจะถูกส่งไปยังบัสข้อมูลของการ์ดวิดีโอ จากนั้นข้อมูลจะถูกส่งไปยังหน่วยดำเนินการคำสั่งแบบขนานและจากนั้นไปยัง GPU (โปรเซสเซอร์กราฟิก) ซึ่งดำเนินการดังต่อไปนี้:

· การเปลี่ยนแปลง - วัตถุธรรมดาส่วนใหญ่มักจำเป็นต้องได้รับการเปลี่ยนแปลงหรือเปลี่ยนแปลงในลักษณะใดลักษณะหนึ่งเพื่อสร้างวัตถุที่เป็นธรรมชาติมากขึ้น หรือเพื่อเลียนแบบการเคลื่อนที่ในอวกาศ เมื่อต้องการทำเช่นนี้ พิกัดของจุดยอดของใบหน้าของวัตถุ (จุดยอด) จะถูกคำนวณใหม่โดยใช้การดำเนินการพีชคณิตเมทริกซ์และการแปลงทางเรขาคณิต ในการ์ดแสดงผลมีการใช้งานอย่างหนาแน่นเพื่อจุดประสงค์นี้ โปรเซสเซอร์ร่วมทางเรขาคณิต.

· การคำนวณการส่องสว่างและการแรเงา - เพื่อให้วัตถุปรากฏบนหน้าจอ จำเป็นต้องคำนวณการส่องสว่างและการแรเงาของสี่เหลี่ยมหรือสามเหลี่ยมเบื้องต้นแต่ละอัน ยิ่งไปกว่านั้น จำเป็นต้องจำลองการกระจายแสงจริง เช่น จำเป็นต้องซ่อนการเปลี่ยนแปลงของการส่องสว่างระหว่างสี่เหลี่ยมหรือสามเหลี่ยม ซึ่งทำได้โดยหน่วยแรสเตอร์

· การทำแผนที่พื้นผิว - เพื่อสร้างภาพที่สมจริง พื้นผิวที่เลียนแบบพื้นผิวจริงจะถูกนำไปใช้กับพื้นผิวเบื้องต้นแต่ละพื้นผิว พื้นผิวจะถูกเก็บไว้ในหน่วยความจำเป็นภาพแรสเตอร์

· การแก้ไขข้อบกพร่อง - เส้นจำลองและขอบเขตของวัตถุหากไม่ใช่แนวตั้งหรือแนวนอน ให้มองเป็นมุมบนหน้าจอ ดังนั้นการแก้ไขภาพจึงเกิดขึ้น เรียกว่าการลดรอยหยัก ( ต่อต้านนามแฝง);

หลังจากการประมวลผล GPU วัตถุจะถูกประมวลผลโดยบล็อก "Z-buffer":

· การฉายภาพ - วัตถุสามมิติจะถูกแปลงเป็นวัตถุสองมิติ แต่ระยะทางของจุดยอดของใบหน้าถึงพื้นผิวของหน้าจอ (พิกัด Z, บัฟเฟอร์ Z) ที่จะจดจำวัตถุที่ฉายไว้

· การถอดพื้นผิวที่ซ่อนอยู่ - ลบพื้นผิวที่มองไม่เห็นทั้งหมดออกจากการฉายภาพ 2 มิติของวัตถุ 3 มิติ

หลังจากคำนวณจุดทั้งหมดในเฟรมแล้ว ข้อมูลเกี่ยวกับแต่ละพิกเซลจะถูกย้ายไปยังหน่วยความจำวิดีโอ

ในจานสีและบล็อกควบคุมการซ้อนทับรูปภาพ สีที่ขาดหายไปจะถูกสอดแทรก - หากใช้จำนวนสีที่แตกต่างกันในการสร้างแบบจำลองวัตถุมากกว่าในโหมดการ์ดแสดงผลปัจจุบัน จำเป็นต้องคำนวณสีที่หายไปหรือลบสีที่ซ้ำซ้อนออก

หากการ์ดแสดงผลเชื่อมต่อกับจอภาพโดยใช้หลอดรังสีแคโทด ข้อมูลจะถูกส่งไปยัง DAC (ตัวแปลงดิจิทัลเป็นอะนาล็อก) ซึ่งสัญญาณดิจิทัลจะถูกแปลงเป็นสัญญาณ RGB แบบอะนาล็อกที่จอภาพสามารถเข้าใจได้

หากการ์ดแสดงผลเชื่อมต่อกับจอภาพดิจิทัล ข้อมูลภาพจะถูกแปลงเป็นรูปแบบหน้าจอมอนิเตอร์

ระบบการบัญชีอัตโนมัติสำหรับธุรกรรมทางธนาคารและการนำไปใช้ในโปรแกรมบัญชี 1C

หากกิจกรรมทั้งหมดของบริษัทสามารถแบ่งออกเป็นกระบวนการทางธุรกิจได้ กระบวนการต่างๆ ก็สามารถแบ่งออกเป็นองค์ประกอบที่เล็กลงได้ ในวิธีการสร้างกระบวนการทางธุรกิจ สิ่งนี้เรียกว่าการสลายตัว...

อุปกรณ์ภายในพีซีและอุปกรณ์ต่อพ่วง

การศึกษาแบบจำลองประชากรแบบแยกส่วนโดยใช้โปรแกรม Model Vision Studio

"แบบเอกสารสำเร็จรูป" หลักของคำอธิบายใน MVS คือบล็อก บล็อกคือวัตถุที่ใช้งานอยู่ซึ่งทำงานแบบขนานและเป็นอิสระจากวัตถุอื่นๆ ในเวลาต่อเนื่องกัน บล็อกเป็นบล็อกเชิง...

การใช้ LMS Moodle ในกระบวนการศึกษา

สนามไหนก็ต้องมีพื้นที่ส่วนกลาง อาจไม่มีคอลัมน์ซ้ายหรือขวาที่มีบล็อก แต่บล็อคต่างๆ ที่รวมอยู่ในระบบบริหารจัดการการเรียนรู้ Moodle จะเพิ่มฟังก์ชันการทำงาน...

ศึกษาความสามารถของครูในระบบการเรียนทางไกลของ Moodle

หากต้องการเพิ่มทรัพยากร องค์ประกอบ บล็อก หรือแก้ไขสิ่งที่มีอยู่ในหลักสูตรของคุณ ให้คลิกปุ่มแก้ไขที่อยู่ในบล็อกควบคุม มุมมองทั่วไปของหน้าต่างหลักสูตรในโหมดแก้ไขจะแสดงในรูปที่ 2.5: รูปที่ 2...

การจำลองในการพัฒนาซอฟต์แวร์

คำศัพท์ UML ประกอบด้วยบล็อคส่วนประกอบสามประเภท: เอนทิตี; ความสัมพันธ์; ไดอะแกรม เอนทิตีคือนามธรรมที่เป็นองค์ประกอบพื้นฐานของแบบจำลอง...

การจำลองการทำงานในห้องสมุด

ตัวดำเนินการ - บล็อกสร้างตรรกะของโมเดล GPSS/PC มีบล็อกที่แตกต่างกันประมาณ 50 ประเภท ซึ่งแต่ละประเภททำหน้าที่เฉพาะเจาะจง ด้านหลังแต่ละบล็อกจะมีรูทีนย่อยของนักแปลที่เกี่ยวข้อง...

คุณสมบัติที่สำคัญของ CSS3

คุณสามารถออกแบบข้อความด้วยวิธีดั้งเดิมโดยใช้บล็อกการสนทนาที่หลากหลาย ซึ่งสร้างขึ้นจากเทคโนโลยี CSS3 อีกครั้ง (รูปที่ 5.) รูปที่ 5...

คุณสมบัติที่สำคัญของ CSS3

เอฟเฟกต์โปร่งแสงขององค์ประกอบนั้นมองเห็นได้ชัดเจนในภาพพื้นหลังและแพร่หลายในระบบปฏิบัติการต่าง ๆ เพราะดูมีสไตล์และสวยงาม...

การเตรียมเอกสารข้อความตาม STP 01-01

หน่วยขยาย (การ์ด) หรือการ์ด (การ์ด) ตามที่บางครั้งเรียกว่าสามารถใช้เพื่อบริการอุปกรณ์ที่เชื่อมต่อกับ IBM PC สามารถใช้เชื่อมต่ออุปกรณ์เพิ่มเติมได้ (อะแดปเตอร์จอแสดงผล ตัวควบคุมดิสก์ ฯลฯ)...

การ์ดแสดงผลเสียและซ่อมแซม

บล็อกเหล่านี้ทำงานร่วมกับโปรเซสเซอร์เชเดอร์ทุกประเภทที่ระบุ โดยจะเลือกและกรองข้อมูลพื้นผิวที่จำเป็นในการสร้างฉาก...

โปรแกรมลงทะเบียนกระบวนการผลิตสำหรับระบบการจัดการองค์กรแบบอัตโนมัติในอุตสาหกรรมอิเล็กทรอนิกส์

มีบล็อก 11 ประเภทที่สามารถสร้างระบบ MES เฉพาะสำหรับการผลิตเฉพาะได้...

การพัฒนาชุดซอฟต์แวร์สำหรับคำนวณค่าชดเชยการซ่อมใหญ่

ที่ระดับรายละเอียดต่ำสุด ข้อมูลฐานข้อมูล Oracle จะถูกจัดเก็บไว้ในบล็อกข้อมูล ข้อมูลหนึ่งบล็อกสอดคล้องกับจำนวนไบต์ของพื้นที่ฟิสิคัลดิสก์...

การพัฒนาระบบการจัดการฮาร์ดแวร์และซอฟต์แวร์สำหรับแพลตฟอร์มการขนส่งใน Simatic ขั้นตอนที่ 7

หน่วยระบบเป็นส่วนประกอบของระบบปฏิบัติการ สามารถจัดเก็บได้โดยโปรแกรม (ฟังก์ชันระบบ, SFC) หรือข้อมูล (บล็อกข้อมูลระบบ, SDB) หน่วยระบบช่วยให้สามารถเข้าถึงฟังก์ชันระบบที่สำคัญ...

อุปกรณ์ที่รวมอยู่ในคอมพิวเตอร์

หน่วยขยาย (การ์ด) หรือการ์ด (การ์ด) ตามที่บางครั้งเรียกว่าสามารถใช้เพื่อบริการอุปกรณ์ที่เชื่อมต่อกับ IBM PC สามารถใช้เชื่อมต่ออุปกรณ์เพิ่มเติมได้ (อะแดปเตอร์จอแสดงผล ตัวควบคุมดิสก์ ฯลฯ)...

สถาปัตยกรรม GPU: คุณสมบัติ

ความสมจริงของกราฟิก 3D ขึ้นอยู่กับประสิทธิภาพของการ์ดแสดงผลเป็นอย่างมาก ยิ่งพิกเซลเชเดอร์บล็อกโปรเซสเซอร์มีมากเท่าใด และยิ่งความถี่สูงเท่าใด เอฟเฟ็กต์ต่างๆ ก็สามารถนำไปใช้กับฉาก 3D ได้มากขึ้นเพื่อปรับปรุงการรับรู้ทางสายตา

GPU มีบล็อกการทำงานที่แตกต่างกันมากมาย จากจำนวนส่วนประกอบบางส่วน คุณสามารถประมาณได้ว่า GPU มีประสิทธิภาพเพียงใด ก่อนที่จะไปต่อ ให้เราตรวจสอบบล็อกการทำงานที่สำคัญที่สุดก่อน

โปรเซสเซอร์ Vertex (หน่วยเชเดอร์จุดยอด)

เช่นเดียวกับหน่วยเชเดอร์พิกเซล โปรเซสเซอร์จุดยอดเรียกใช้โค้ดเชเดอร์ที่สัมผัสกับจุดยอด เนื่องจากงบประมาณจุดยอดที่มากขึ้นทำให้สามารถสร้างวัตถุ 3 มิติที่ซับซ้อนมากขึ้นได้ ประสิทธิภาพของตัวประมวลผลจุดยอดจึงมีความสำคัญมากในฉาก 3 มิติที่มีวัตถุที่ซับซ้อนหรือมีจำนวนมาก อย่างไรก็ตาม หน่วย vertex shader ยังคงไม่ส่งผลกระทบที่ชัดเจนต่อประสิทธิภาพเช่นเดียวกับโปรเซสเซอร์พิกเซล

โปรเซสเซอร์พิกเซล (หน่วยเชเดอร์พิกเซล)

โปรเซสเซอร์พิกเซลเป็นส่วนประกอบของชิปกราฟิกที่ใช้เพื่อประมวลผลโปรแกรมตัวเชเดอร์พิกเซลโดยเฉพาะ โปรเซสเซอร์เหล่านี้ทำการคำนวณที่เกี่ยวข้องกับพิกเซลเท่านั้น เนื่องจากพิกเซลมีข้อมูลสี พิกเซลเชเดอร์จึงช่วยให้คุณได้เอฟเฟกต์กราฟิกที่น่าประทับใจ ตัวอย่างเช่น เอฟเฟกต์น้ำส่วนใหญ่ที่คุณเห็นในเกมนั้นสร้างขึ้นโดยใช้ตัวเชเดอร์พิกเซล โดยทั่วไปแล้ว จำนวนโปรเซสเซอร์พิกเซลจะใช้เพื่อเปรียบเทียบประสิทธิภาพพิกเซลของการ์ดแสดงผล หากการ์ดใบหนึ่งมีแปดหน่วยเชเดอร์พิกเซลและอีกการ์ดหนึ่งมี 16 หน่วยก็สมเหตุสมผลที่จะถือว่าการ์ดวิดีโอที่มี 16 ยูนิตจะเร็วกว่าในการประมวลผลโปรแกรมเชเดอร์พิกเซลที่ซับซ้อน ควรคำนึงถึงความเร็วสัญญาณนาฬิกาด้วย แต่ในปัจจุบันการเพิ่มจำนวนโปรเซสเซอร์พิกเซลเป็นสองเท่านั้นประหยัดพลังงานมากกว่าการเพิ่มความถี่ของชิปกราฟิกเป็นสองเท่า

เชเดอร์แบบครบวงจร

Unified shaders ยังมาไม่ถึงในโลกพีซี แต่มาตรฐาน DirectX 10 ที่กำลังจะมาถึงนั้นใช้สถาปัตยกรรมที่คล้ายกัน นั่นคือ โครงสร้างโค้ดของโปรแกรมจุดยอด เรขาคณิต และพิกเซลจะเหมือนกัน แม้ว่าเชเดอร์จะทำงานต่างกันก็ตาม ข้อมูลจำเพาะใหม่สามารถดูได้ใน Xbox 360 ซึ่ง GPU ได้รับการออกแบบเป็นพิเศษโดย ATi สำหรับ Microsoft น่าสนใจมากที่จะเห็นว่า DirectX 10 ใหม่มีศักยภาพเพียงใด

หน่วยการแมปพื้นผิว (TMU)

ควรเลือกและกรองพื้นผิว งานนี้ดำเนินการโดยหน่วยการแมปพื้นผิว ซึ่งทำงานร่วมกับหน่วยเชเดอร์พิกเซลและจุดยอด งานของ TMU คือการใช้การดำเนินการกับพื้นผิวกับพิกเซล จำนวนหน่วยพื้นผิวใน GPU มักใช้เพื่อเปรียบเทียบประสิทธิภาพพื้นผิวของการ์ดวิดีโอ มีเหตุผลที่จะสรุปได้ว่าการ์ดกราฟิกที่มี TMU มากกว่าจะให้ประสิทธิภาพพื้นผิวที่ดีกว่า

หน่วยปฏิบัติการแรสเตอร์ (ROP)

โปรเซสเซอร์แรสเตอร์มีหน้าที่เขียนข้อมูลพิกเซลลงในหน่วยความจำ ความเร็วในการดำเนินการนี้คืออัตราการเติม ในช่วงแรกของตัวเร่งความเร็ว 3D ROP และอัตราการเติมเป็นคุณลักษณะที่สำคัญมากของการ์ดแสดงผล ในปัจจุบัน งาน ROP ยังคงมีความสำคัญ แต่ประสิทธิภาพของการ์ดแสดงผลไม่ได้ถูกจำกัดด้วยบล็อกเหล่านี้เหมือนแต่ก่อนอีกต่อไป ดังนั้นประสิทธิภาพ (และจำนวน) ของ ROP จึงไม่ค่อยถูกนำมาใช้ในการประเมินความเร็วของการ์ดแสดงผล

สายพานลำเลียง

ไปป์ไลน์ใช้เพื่ออธิบายสถาปัตยกรรมของการ์ดแสดงผลและให้แนวคิดที่ชัดเจนเกี่ยวกับประสิทธิภาพของ GPU

สายพานลำเลียงไม่สามารถถือเป็นคำศัพท์ทางเทคนิคที่เข้มงวดได้ GPU ใช้ไปป์ไลน์ที่แตกต่างกันซึ่งทำหน้าที่ต่างกัน ในอดีต ไปป์ไลน์หมายถึงโปรเซสเซอร์พิกเซลที่เชื่อมต่อกับ Texture Mapping Unit (TMU) ตัวอย่างเช่น การ์ดแสดงผล Radeon 9700 ใช้โปรเซสเซอร์แปดพิกเซล ซึ่งแต่ละตัวเชื่อมต่อกับ TMU ของตัวเอง ดังนั้นการ์ดจึงถือว่ามีแปดไปป์ไลน์

แต่โปรเซสเซอร์สมัยใหม่นั้นยากมากที่จะอธิบายด้วยจำนวนไปป์ไลน์ เมื่อเทียบกับการออกแบบก่อนหน้านี้ โปรเซสเซอร์ใหม่ใช้โครงสร้างแบบแยกส่วนและกระจัดกระจาย ATi ถือได้ว่าเป็นผู้ริเริ่มในด้านนี้ซึ่งเปลี่ยนมาใช้โครงสร้างโมดูลาร์ด้วยการ์ดวิดีโอกลุ่ม X1000 ซึ่งทำให้สามารถบรรลุประสิทธิภาพที่เพิ่มขึ้นผ่านการเพิ่มประสิทธิภาพภายใน บล็อก CPU บางตัวถูกใช้มากกว่าบล็อกอื่นๆ และเพื่อปรับปรุงประสิทธิภาพของ GPU ATi ได้พยายามค้นหาการประนีประนอมระหว่างจำนวนบล็อกที่ต้องการและพื้นที่ดาย (ซึ่งไม่สามารถเพิ่มขึ้นได้มากนัก) ในสถาปัตยกรรมนี้ คำว่า "ไปป์ไลน์พิกเซล" ได้สูญเสียความหมายไปแล้ว เนื่องจากโปรเซสเซอร์พิกเซลไม่ได้เชื่อมต่อกับ TMU ของตัวเองอีกต่อไป ตัวอย่างเช่น ATi Radeon X1600 GPU มีหน่วยเชเดอร์พิกเซล 12 หน่วยและมีหน่วยการแมปพื้นผิว TMU เพียงสี่หน่วย ดังนั้นจึงเป็นไปไม่ได้ที่จะบอกว่าสถาปัตยกรรมของโปรเซสเซอร์นี้มีไปป์ไลน์ 12 พิกเซลเช่นเดียวกับที่เป็นไปไม่ได้ที่จะบอกว่ามีเพียงสี่เท่านั้น อย่างไรก็ตาม ตามธรรมเนียมแล้ว ท่อพิกเซลยังคงถูกกล่าวถึงอยู่

เมื่อพิจารณาตามสมมติฐานข้างต้น มักใช้จำนวนไปป์ไลน์พิกเซลใน GPU เพื่อเปรียบเทียบการ์ดแสดงผล (ยกเว้นบรรทัด ATi X1x00) ตัวอย่างเช่นหากคุณใช้การ์ดแสดงผลที่มีไปป์ไลน์ 24 และ 16 ก็ค่อนข้างสมเหตุสมผลที่จะถือว่าการ์ดที่มี 24 ไปป์ไลน์จะเร็วกว่า


เนื้อหา
บอกเพื่อน