Lõi đồ họa trong chip AMD Trinity cho hệ thống để bàn

Không nghi ngờ gì khi mà hiện tại những bộ vi xử lí  PC nhanh nhất lại không phải của AMD và điều này không thể thay đổi trong một đêm .

Kể từ khi Intel chuyển từ Pentium sang Core , những sản phẩm của AMD đã bị tụt xuống vị trí thứ hai . Trên thực tế những bộ vi xử lí  AMD hiện tại là loại giá rẻ hoặc có phù hợp một công việc đặc biệt nào đó . Việc hỗ trợ 64-bit , thiết kế đa lõi , tích hợp mạch điều khiển bộ nhớ và chipset NorthBridge vào trong bộ vi xử lí  chưa đủ để chip AMD có thể mạnh hơn chip Intel .

Hiện nay AMD đang phát triển bộ vi xử lí  theo chiều hướng APU (Accelerated Processor Unit) dựa trên ý tưởng kết hợp những lõi tính toán truyền thống x86 với những lõi đồ họa  tốc độ cao bên trong một khuôn mạch bán dẫn ( die )

 

\"\"

 

Có một vài kiểu APU khác nhau được AMD phát hành kể từ năm 2011 . Đáng chú ý nhất đó là những bộ vi xử lí  A-Series có tên mã Llano đã được dùng trong nền tảng  Lynx và Sabine trong những hệ thống  mobile và hệ thống  để bàn . Mặc dù những bộ vi xử lí  và nền tảng  này được cho là để “chạy thử nghiệm” nhưng đã được thị trường đón nhận với thái độ yêu mến .

Nhờ có Llano mà thị phần của AMD trong thị trường máy xách tay tăng lên trong khi vài năm  trước AMD mất dần thị trường này vào tay Intel . Tuy nhiên sự tăng này của AMD lại không  phải hoàn toàn do thiết kế ghép mà lại do vấn đề khác . Những bộ vi xử lí  của Intel tuy có mạnh hơn về AMD về lõi x86 nhưng lại yếu về khả năng xử lí đồ họa  bên cạnh đó những chip APU của AMD lại có giá thành rất hợp lí vì thế APU là lựa chọn hoàn hỏa cho những máy xách tay giá rẻ .

Trong tháng 5 , AMD lại giới thiệu APU A-Series theo cấu trúc Trinity , có lõi x86 mạnh hơn và có hiệu suất đồ họa  cao hơn và vẫn có giá thành phải chăng . Do đó mà thị phần những máy xách tay có gắn nhãn hiệu AMD Vision sẽ tiếp tục tăng lên .

 

\"\"

 

Tuy nhiên câu chuyện APU trên hệ thống  để bàn lại hoàn toàn khác . Yêu cầu của người dùng máy để bàn lại rất khác với những gì người dùng  máy xách tay muốn và cần . Đồ họa  tích hợp mạnh trên trong APU không  hấp dẫn người dùng hệ thống  để bàn như trong máy xách tay . Với những máy để bàn cần độ phân giải  cao hơn trong khi đó những APU A-Series lại không đáp ứng được hiệu suất làm việc nhất là với Game cao cấp vì thế mà chỉ có thể dùng được với những game không cần đồ họa  mạnh lắm . Bên cạnh đó lõi x86 trong chip của Intel lại làm việc hiệu quả hơn nhiều so với lõi x86 của AMD . Và APU Llano lại có nhiệt lượng tỏa ra nhiều hơn và thiếu những công nghệ để có thể tăng tốc việc giải mã những nội dung video HD .

Để cố gắng cầm cự trên thị trường AMD đã giới thiệu những bộ vi xử lí  A-Series thế hệ thứ 2 với nhiều cải tiến có tên mã Trinity trong đó những model cho máy xách tay đã có mặt trên thị trường từ màu Hè năm  nay .

Những model Trinity cho hệ thống  để bàn có tần số x86 và iGPU tăng lên đáng kể để có thể đẩy hiệu suất làm việc lên cao nhất có thể .

Thiết kế Trinity rõ ràng tốt hơn Llano trong nhiều khía cạnh . Lõi x86 Piledriver trong Trinity nhanh hơn so với lõi Husky trong Llano . Hiệu suất đồ họa  trong Trinity cũng được cải thiện nhiều và cấu trúc bên trong cũng được thay đổi đáng kể .

 

Thiết kế Trinity

 

Theo khái niệm ban đầu , APU có 3 thành phần chính và Trinity không  thay đổi điều này với : lõi xử lí ghép mới , tích hợp đồ họa  và bộ phận quan trọng khác : NorthBridge hợp nhất . Những kết nối bên trong những lõi linh hoạt thành một hệ thống  cân bằng , cùng với bộ phận điều khiển bộ nhớ DDR3 SDRAM để bảo đảm việc truyền thông giữa lõi x86 và lõi đồ họa  với nhau cùng với bộ nhớ hệ thống  một cách thông suốt và cọng tác với nhau trong cùng dữ liệu .

 

\"\"

 

Tóm lại , cấu trúc Trinity duy trì những gì có trong Llano nhưng tất cả những bộ phận đã được thay đổi . Sự thay đổi này không làm tăng kích thước bán dẫn lên đáng kể nên AMD vẫn sử dụng công nghệ 32nm để sản xuất chip Trinity qua GlobalFoundries . Kết quả là kích thước khuôn của Trinity 246 mm2 chỉ lớn hơn 8% , với số lượng bóng bán dẫn tăng lên một chút với 1,030 tỉ . Bên cạnh đó sự phân bố lượng bóng bán dẫn giữa bộ phận tính toán x86 và GPU không thực sự thay đổi nhiều

 

\"\"

 

Lõi x86 trong APU Trinity thay đổi nhiều , dùng cấu trúc Bulldozer thế hệ thứ hai có tên mã Piledriver . Những chip Trinity 2- và 4-lõi sẽ có 1 hoặc 2 module 2-lõi . Mỗi module bao gồm 2 bộ phận xử lí (Execution Unit) và có thể xử lí 2-thread cùng một lúc nhưng lại có cùng bộ nhớ Cache chia xẻ , và cùng bộ phận : Instruction Fetcher, Instruction Decoder và Floating Point Unit .

Các bạn nên nhớ những bộ vi xử lí  FX cũng dùng cấu trúc Bulldozer nhưng không có đồ họa tích hợp .

 

\"\"

 

Piledriver , cấu trúc Bulldozer thế hệ thứ 2 , dùng trong Trinity có nhiều sự cải tiến nhằm tăng hiệu suất làm việc , giảm dòng điện  rờ rỉ để giảm mức tiêu hao điện  năng và bảo đảm chạy ổn định với tốc độ cao hơn .

Phần Front-End trong Piledriver có khả năng dự đoán rẽ nhánh lớn hơn . Execution Unit có Scheduler cải tiến để thực hiện lệnh nhanh hơn , bộ phận Integer và Floating-Point cũng xử lí nhanh hơn kèm theo những lệnh mở rộng . Những kỹ sư của AMD đã tăng L1 TLB và thuật toán lấy dữ liệu trước ( Data Prefetch ) cũng được cải tiến trong Cache L2 . Theo AMD tất cả những sự cải tiến này cho phép Trinity nâng cao hiệu suất tính toán 25% so với Llano .

North Bridge hợp nhất tích hợp trong Trinity cũng thay đổi đáng kể . Đầu tiên AMD đã cải tiến sự ưu tiên truy cập cho bộ nhớ chia xẻ bằng cách đưa danh sách những dữ liệu hay sử dụng lên đầu cho những lõi tính toán để giảm thiểu thời gian trễ . Bên cạnh đó AMD bảo đảm tối ưu hóa với kiểu bộ nhớ mới bao gồm DDR3-1866 trong chế độ bình thường và DDR3-2400 trong chế độ Overclock .

Bus dữ liệu nội bộ cũng được mở rộng . Bây giờ lõi đồ họa  có thể truyền thông với mạch điều khiển bộ nhớ bằng Bus bộ nhớ Radeon 256-bit , tất cả những truyền thông ra bên ngoài chip dùng giao diện PCIe thay thế cho Hyper-Transport .

 

\"\"

 

Tuy nhiên sự thay đổi trong lõi đồ họa  là đáng chú ý hơn cả . AMD đã tăng hiệu suất làm việc nhưng không tăng số lượng bóng bán dẫn hoặc thay đổi đáng kể về mặt cấu trúc .

 

Lõi đồ họa  Devastator

 

Lõi đồ họa  tích hợp trong Trinity có tên mã Devastator dựa trên cấu trúc VLIW4 chứ không phải theo cấu trúc CGN như trong những Radeon HD để bàn mới nhất hiện nay . Đồ họa  tích hợp trong Llano dựa trên cấu trúc VLIW5 .

AMD đã dùng những thủ thuật đã dùng trong những Card màn hình Radeon HD 6900 để sử dụng trong Devastator theo cấu trúc VLIW4 để tăng hiệu suất làm việc , tiết kiệm điện năng trong khi vẫn không tăng số lượng bóng bán dẫn .

 

\"\"

 

VLIW5 sắp xếp 5 ALU thành một nhóm của bộ xử lí Stream VLIW . Điều này không mang lại hiệu quả cao nếu như một ALU ở trạng thái nghỉ trong hầu hết những tình huống . Vì thế với cấu trúc VLIW4 của Devastator dùng  4 ALU thành bộ xử lí Stream VLIW , cho phép tối ưu hóa nguồn tài nguyên . Tất nhiên mặt hạn chế của VLIW4 là số lượng Execution Unit nhỏ hơn và độ rộng băng thông của lõi giảm đi nhưng bù lại hiệu suất làm việc / mm2 lại tăng lên . Và điều đó cũng là giải pháp tối ưu nhất cho cả lõi đồ họa  với lõi x86 .

 

\"\"

 

Như vậy lõi đồ họa  trong Trinity có 6 SIMD Engine , mỗi SIMD có 4 Texture Unit và 16 bộ xử lí Stream VLIW . Lõi đồ họa  của Trinity có 384 ALU , ít hơn 16 ALU trong lõi đồ họa Sumo của Llano . Như những ALU của Devastator được tối ưu hóa nên xử lí hiệu quả hơn so với Sumo , cho phép tốc độ làm việc cao hơn . Ví dụ đồ họa  trong Llano đạt tốc độ cao nhất 600Mz , của Trinity cao nhất là 800MHz .

Devastator có 24 Texture Unit ( mỗi SIMD có 4 TMU ) và 8 ROP (Raster Operation Unit) vì thế có thể kết luận lõi đồ họa  này tương đương với 1/4 GPU Radeon HD 6970 . Điều này thực sự tốt nên AMD quảng cáo đồ họa  trong Trinity đạt chất lượng “như với đồ họa  rời” có thể đạt tới tốc độ xử lí video 3D .

Devastator tương thích với DirectX 11 , OpenCL và giao diện phần mềm DirectCompute . Theo AMD , Devastator cũng cải tiến những bộ phận Tessellation Unit và hỗ trợ tất cả những mode Anti-Aliasing như SSAA , EQAA và MLAA .

AMD đặc biệt chú ý tới những tính năng Multimedia trong Devastator với bộ phận AMD HD Media Accelerator như những GPU mới nhất . Bộ phận này bao gồm phần cứng UVD3 (video decoding engine) và giải mã video H.264 bằng phần cứng VCE .

Điều quan trọng nhất mà Trinity có thể cạnh tranh với những bộ vi xử lí của Intel chính là có tính năng Quick Sync cho giải mã video HD tốc độ cao

 

\"\"

 

Khi AMD phát triển những bộ vi xử lí  Fusion cho thị trường để bàn , họ muốn người dùng có thể sử dụng với nhiều màn hình như những Card màn hình rời vì thế mà đồ họa  trong Trinity cho phép kết nối tới 4 màn hình cùng một lúc như VGA , DVI , HDMI và DisplayPort 1.2 .

Bên cạnh đó Trinity cũng hỗ trợ công nghệ Eyefinity .

 

Những model Trinity

 

Những bộ vi xử lí Trinity khác nhau trong A-Series có thể có lõi Devastator với cấu hình khác nhau . Model Trinity A-Series cao cấp nhất sẽ có lõi Davastator đầy đủ tính năng như đã kể trên và có tên thương mại Radeon HD 7660D dùng trong chip A10-Series . Những model khác thấp hơn sẽ có số ALU ít hơn , tần cố thấp hơn .

 

\"\"

 

\"\"\"\"