APU A8-3800: thực sự Fusion

Nền tảng  Lynx cho hệ thống  để bàn của AMD có bộ vi xử lí lai ghép Llano đã có tay người tiêu dùng  thông thường .

Điều đó cho phép chúng ta thấy được rõ ràng những gì thực sự bên trong giữa sự kết hợp lõi xử lí x86 Stars cũ với những GPU Radeon hiệu suất cao .

AMD chưa bao giờ vượt qua Intel về số lượng CPU bán ra . Tuy nhiên điều đó không có nghĩa là AMD đóng vai trò thứ yếu trong thế giới x86 . Có nhiều ví dụ cho thấy những sáng tạo của AMD trong vi cấu trúc x86 đã trở thành xu hướng trong tương lai khiến cho Intel phải học tập . AMD chính là người đi đầu khi mở rộng cấu trúc x86 hỗ trợ 64-bit và bây giờ tính năng này đã trở thành chuẩn hóa trong những bộ vi xử lí  . AMD cũng là người đầu tiên tích hợp mạch điều khiển bộ nhớ từ Chipset North Bridge vào bên trong CPU để nâng cao hiệu suất xử lí bộ nhớ . Nếu như quay trở lại xem xét về lịch sử bộ vi xử lí  chúng ta cũng sẽ thấy nhiều ví dụ như vậy , không phải tất cả “người thứ hai” trong thị trường bộ vi xử lí đứng ngoài tất cả .

Quay trở lại vài năm  trước khi mua lại ATI Technologies đã cho phép AMD truy cập tới những công nghệ đồ họa  hàng đầu . Những công nghệ này hỗ trợ AMD sáng tạo hơn nữa với Fusion . Ý tưởng của Fusion đó là kết hợp giữa những lõi tính toán truyền thống với những lõi đồ họa  cho phép xử lí những phép tính song song cực mạnh .

Việc tích hợp lõi x86 với GPU không  phải có gì là mới mẻ hiện nay . Intel đã có những sản phẩm như vậy từ trước đó . Nhưng AMD đưa ra cách tiếp cận hoàn toàn khác để cộng sinh giữa lõi x86 và lõi đồ họa  . Theo những kỹ sư của AMD , lõi đồ họa  không  chỉ thực thi những nhiệm vụ hiển thị trên màn hình mà nó còn được sử dụng trong những công việc tính toán thông thường . Cấu trúc lõi đồ họa  mới cho phép nó xử lí mảng dữ liệu lớn theo phương thức song song .Hiện tại lõi đồ họa  có thể tham gia vào một số nhiệm vụ như xử lí hình ảnh và video , thuật toán mật mã và thực thi những bài toán khoa học . Tất nhiên nó sẽ yêu cầu phần mềm hiện tại phải được thiết kế để sử dụng sức mạnh tính toán dựa trên GPU ,nhưng kết quả rõ ràng cho thấy khái niệm Fusion rất hợp thời .

Trước khi đưa ra APU A-Series cho hệ thống  để bàn , AMD cũng đã có những Fusion đầu tiên có tên mã Ontario và Zacate , thuộc E và C-Series , được thiết kế để dùng cho những hệ thống  để bàn giá rẻ và hệ thống  mobile dựa trên nền tảng  Brazos . Tuy nhiên Ontario và Zacate được thiết kế ưu tiên hàng đầu để dùng  cho những hệ thống  nhỏ gọn và tiết kiệm điện năng nên có năng lực tính toán thấp và có những hạn chế . Rõ ràng AMD rất cần những nền tảng  chủ đạo và những APU có đủ sức mạnh tính toán để có thể đáp ứng được sự mong mỏi từ phía người dùng  .

Sau Brazos , AMD có hai nền tảng  Fusion mới : Sabine cho hệ thống  mobile và Lynx cho hệ thống  để bàn . Cả hai nền tảng  này đều dựa trên APU A-Series với tên mã Llano .

Bây giờ chúng ta sẽ đề cập tới APU Llano đầu tiên cho hệ thống  để bàn .

Cái gì bên trong Llano ?

Khái niệm Fusion có nghĩa là những lõi CPU và lõi đồ họa  ghép lại với nhau cả mức phần cứng với phần mềm . Như vậy mọi APU (accelerated processor unit) được thiết kế theo nguyên lí Fusion có kết cấu mang tính chất đặc trưng . Llano có lõi x86 kết hợp những lõi đồ họa  và North Bridge . Ontario và Zacate cũng có kết cấu như vậy nhưng không mạnh .

Những lõi x86 trong Llano của hệ thống  để bàn dựa trên vi cấu trúc Starts với đầy đủ tính năng mà không  phải là lõi x86 Bobcat rút gọn . Llano có thể có 2- , 3- hoặc 4-lõi x86 . Bên trong Llano có GPU với 320 hoặc 400 SP ( Stream Processor ) , nhiều hơn 4-5 lần so với số lõi SP bên trong Brazos . Bên cạnh đó Llano còn tích hợp North Bridge với mạch điều khiển bộ nhớ 2-kênh tốc độ cao và giao diện PCIe cho Card màn hình rời .

 

\"\"

 

Mặc dù Llano là bộ vi xử lí  thứ hai trong họ Fusion nhưng trên thực tế cấu trúc bên trong của nó không  có nhiều cái mới . Nói một cách khác những APU mới bản chất là dùng những thành phần cũ kết hợp với nhau và có chút ít sáng tạo . Nếu nói một cách rõ ràng APU chính là sự kết hợp của những bộ vi xử lí  Athlon II X4 với lõi đồ họa  Radeon HD 5570 và Chipset AMD 870 lại với nhau mà thôi và đóng chung vào một vỏ . Tất nhiên mô tả trên mang tính chất dễ hiểu vì Llano mới cũng có tính sáng tạo và những dùng những kỹ thuật đặc biệt nhưng xét trên nguyên lí là không có khái niệm gì mới cả .

Tuy nhiên trong Llano cũng có một số bộ phận rất phức tạp được đặt cùng với nhau bên trong một khuôn bán dẫn . Llano được GlobalFoundries sản xuất bằng công nghệ 32nm nhưng Intel đã sản xuất bằng công nghệ này từ một năm trước .

 

\"\"

 

Sự phức tạp bên trong Llano thể hiện qua số lượng bóng bán dẫn lên tới 1.45 tỉ , nhiều hơn một chút so với Intel Sandy Bridge . Tuy nhiên cả Llano và Sandy Bridge đều có kích thước khuôn ( Die ) gần tương tự với nhau đó là 228 và 216 mm2 . Điều đó cho thấy Intel đã đầu tư đáng kể tới thiết kế trong Sandy Bridge . Nhưng khái niệm về kích thước khuôn bán dẫn giữa Llano và Sandy Bridge không nói lên nhiều điều . Sandy Bridge có lõi đồ họa  tích hợp chiếm chưa tới 20% kích thước bên trong nhưng lõi đồ họa  trong Llano lớn hơn rất nhiều , nó chiếm nhiều chỗ hơn cả 4-lõi x86 kết hợp lại .

 

\"\"

 

Đó chính là minh chứng rõ ràng nhất là AMD có thể gửi tới người dùng  . AMD đánh cược những gì tốt nhất hiện nay của mình đó chính là lõi đồ họa  . Hiện tại sự phát triển những lõi x86 đang chững lại đó là nguyên nhân tại sao những bộ vi xử lí  mới đang tiếp cận gần với khái niệm Fusion . Nếu AMD có thể chuyển hầu hết những hoạt động chủ yếu trong máy tính xử lí tại GPU thì không  có gì nghi ngờ Llano sẽ là một sản phẩm siêu cạnh tranh . Tuy nhiên nói về điều đó vẫn còn hơi sớm khi mà hầu hết những phần mềm vẫn đang làm việc theo cách cũ đó là dựa trên hoạt động của lõi x86 truyền thống .

Lõi CPU x86 Husky

Lõi x86 trong Llano mới có tên mã Husky . Trên thực tế không  có gì để nói nhiều vì dùng dựa trên cấu trúc K10 “Stars” , hiện đang được dùng  trong những bộ vi xử lí  Socket AM3 . Vi cấu trúc Bulldozer hoàn toàn mới sẽ có mặt từ năm  sau . Dó đó x86 trong Llano không  có gì là đặc sắc trong các thử nghiệm , ít nhất trong những ứng dụng truyền thống .

Các kỹ sư của AMD thì cố gắng chứng minh Husky đã cải tiến và họ khẳng định hiệu suất làm việc tăng hơn 6% so với Athlon II và Phenom II .

Có cách đơn giản nhất để có thể đạt được đó là tăng dung lượng bộ nhớ Cache L2 , do đó mỗi lõi Llano có 1MB Cache L2 riêng . Tuy nhiên những bộ vi xử lí  mới lại không  có bộ nhớ Cache L3 dùng chung vì thế mà kích thước bộ nhớ Cache không lớn lắm .

Bên cạnh việc tăng dung lượng bộ nhớ Cache , lõi Husky đã cải tiến Bộ phận dự đoán rẽ nhánh ( Branch Prediction ) và tối ưu hóa những bộ đệm sơ cấp như bộ đệm sắp xếp lại những lệnh lớn hơn 20% , những bộ đệm Load/Store có kích thước gấp đôi . Husky cũng có Bộ phận xử lí phép chia riêng biệt bằng phần cứng , cho phép tăng tốc độ hoạt động cho ứng dụng nào đó . Như chúng ta thấy không  có nhiều sự thay đổi đều dựa trên vi cấu trúc K10 vì thế có thể lí giải tại sao Husky chỉ xử lí 3 lệnh theo mỗi chu kì xung nhịp đồng hồ , như những lõi trước kia mà thôi .

 

\"\"

 

Rõ ràng AMD không  có ý định tập tung phát triển lõi x86 trong Llano . Họ lại đi theo hướng riêng . Đầu tiên họ làm sao để lõi Husky tiết kiệm điện  năng bởi vì K10 xử lí việc này không tốt . Thứ hai họ chú trọng tời liên kết xử lí và trao đổi thông tin giữa bộ nhớ hệ thống  , lõi x86 và lõi đồ họa  . Đó là tất cả những cải tiến đáng kể trong Llano .

Lõi GPU Sumo

Lõi GPU trong Llano được AMD gọi tên mã là Sumo , tương tự như Zacate , đó là giải pháp của những GPU rời . AMD đã quyết định tích hợp nhiều sức mạnh đồ họa  bên trong Llano và có cùng số SP như Radeon HD 5570 .

Sự thật : Sumo có mối quan hệ mật thiết với GPU Redwood rời theo cấu trúc AMD VLIW5 . Nói một cách khác APU cao cấp nhất trong họ Llano sẽ có 400 SP , 20 Texture Unit và 8 Raster Unit . Những APU rẻ tiền hơn sẽ có 1 nhóm SIMD bị vô hiệu hóa ( mỗi nhóm SIMD có 80 SP ) và chỉ còn 320 SP , như của Radeon HD 5550 .

 

\"\"

 

So với Redwood đầu tiên , Sumo có hai sự thay đổi chính .

Đầu tiên chúng thay đổi giao diện Bus nhớ video để bảo đảm GPU có thể làm việc được với bộ nhớ DDR3 SDRAM 2-kênh kèm theo North Bridge và không  nối trực tiếp với nhau . Nếu làm việc với bộ nhớ như theo cách truyền thống sẽ bị thắt nút cổ chai dữ liệu như những lõi đồ họa  tích hợp trước kia , vì thế khi đặt những GPU tốc độ cao bên trong APU mới nó đã được thiết kế để tối ưu hóa . Tuy nhiên Llano lại không làm những Bus vòng tròn ( ring bus ) như Intel đã làm và Sumo lại không bộ xử lí bộ nhớ Cache cho riêng mình . GPU trong Llano có cách làm việc hoàn toàn khác đó là ghi trực tiếp dữ liệu tới bộ nhớ hệ thống  bỏ qua lõi x86 . Hơn thế nữa tất cả hoạt động của lõi đồ họa  với bộ nhớ có mức ưu tiên cao hơn so với yêu cầu của lõi x86 trong Llano , do vậy chúng sẽ được mạch điều khiển bộ nhớ xử lí đầu tiên .

Thứ hai , Bộ phận UDV (Unified Video Decoder ) trong Sumo dùng phiên bản mới hơn 3.0 để hỗ trợ tất cả mọi định dạng video HD thông dụng và tương thích với MVC (Multi-View Codec) dùng video 3D . So vậy khác với Brazos , nền tảng  Lynx có thể xem 3D Blu-Ray qua giao diện HDMI . Bên cạnh đó UVD3 lại tiết kiệm điện  năng hơn , làm việc độc lập với phần còn lại của GPU , cho phép tắt SP trong khi xem video .

Những sự thay đổi trên cho phép AMD dùng nhãn hiệu Series 6000 để làm thị trường khi nói tới Sumo . Do đó tùy thuộc vào số lượng SP bên trong mà Llano có thể có lõi Radeon HD 6550D hoặc Radeon HD 6530D .

AMD cũng cho phép người dùng nâng cấp đồ họa dựa trên công nghệ CrossFire với những Chip APU bằng công nghệ có tên Dual Graphics để kết hợp GPU tích hợp bên trong Llano với Card màn hình Radeon HD rời để nâng cáo sức mạnh đồ họa  .

 

\"\"

 

Dual Graphics thực sự ấn tượng khi mà nó tận dụng được sức mạnh của đồ họa  rời . Tuy nhiên nó lại có vấn đề .

Đầu tiên bạn chỉ có thể thấy hiệu suất đồ họa  được cải tiến khi mà Card màn hình rời không mạnh gấp hai lần so với Sumo . Nói một cách khác , nếu bạn có Radeon HD 6850 thì hệ thống  của bạn lại chỉ làm việc với Card màn hình rời và hoàn toàn vô hiệu hóa lõi Sumo .

Hạn chế thứ hai còn tệ hơn đó là CrossFire với Dual Graphics lại chỉ làm việc với DirectX 10 hoặc 11 mà không làm việc với DirectX 9 hoặc OpenGL . Tuy nhiên Dual Graphics lại chưa phải và yêu cầu quan trọng vì người dùng sử dụng Llano là sự lựa chọn tuyệt vời cho những hệ thống  Game giá rẻ không  có nhu cầu dùng đồ họa  mạnh hơn .

North Bridge

North Bridge tích hợp trong APU không  phải chỉ điều khiển bộ nhớ mà nó còn hỗ trợ PCIe . Có nghĩa là nền tảng  Lynx cũng tương tự như cấu trúc của hệ thống  Intel và như vậy trên Motherboard hoàn toàn không  còn Chip North Bridge như trước kia .

So với những bộ vi xử lí  thế hệ trước , mạch điều khiển bộ nhớ Llano có nhiều tính năng hơn . Nó vẫn hỗ trợ bộ nhớ 2-kênh như trước kia và tốc độ còn cao hơn lên tới DDR3-1600/1866 SDRAM . Mặc dù khi bạn dùng DDR3-1866 nó sẽ chỉ làm việc khi lắp một thanh nhớ trên mỗi kênh .

Lõi đồ họa  hiển nhiên cần băng thông bộ nhớ lớn hơn , AMD còn cho biết nếu dùng bộ nhớ DDR3 có thể khiến cho đồ họa  tích hợp giảm hiệu suất làm việc . Tuy nhiên làm việc với bộ nhớ tốc độ cao không  phải là nét đặc trưng của North Bridge mà nó còn có nhiều điều đáng quan tâm hơn như những đường dẫn dữ liệu mới , được thiết kế để tối ưu hóa hiệu suất đồ họa  trong APU . Bên cạnh những liên kết truyền thống giữa CPU và North Bridge , Llano cũng có thêm hai Bus kết nối giữa GPU với North Bridge .

 

\"\"

 

Bus kết nối đầu tiên có tên gọi Radeon Memory Bus được dùng cho những ứng dụng đồ họa  thông thường . Băng thông của nó lên tới 29.8 GBps , cùng tốc độ truyền dữ liệu của DDR3-1866 SDRAM . Bộ nhớ đi qua Bus này có mức ưu tiên cao nhất và mạch điều khiển bộ nhớ xử lí chúng trước cả yêu cầu của CPU .

Bus thứ hai nằm giữa lõi đồ họa  và mạch điều khiển bộ nhớ có tên gọi AMD Fusion Compute Link và cung cấp lõi đồ họa  truy cập trực tiếp tới bộ nhớ cùng một lúc bảo đảm gắn kết chặt chẽ với Cache của bộ vi xử lí  . Nói một cách khác Fusion Compute Link được dùng  để truyền dữ liệu trực tiếp giữa đồ họa  và những lõi CPU khi chúng làm việc cùng với nhau trong cùng nhiệm vụ . Hiện tại Bus này chưa được dùng một cách hiệu quả nhưng nó sẽ là lợi thế về sau khi mà khái niệm Fusion trở nên thông dụng và càng có nhiều ứng dụng tận dụng được sức mạnh đầy đủ của APU .

Với mạch điều khiển Bus PCIe , Llano hỗ trợ 24 Lane 2.0 . 04 lane được nối tới Chipset South Bridge , 04 lane khác tới các thiết bị ngoại vi . 16 lane còn lại tới Card màn hình rời . Bus này có thể được chia thành hai khe PCIe x8 , do đó Lynx hỗ trợ CrossFire không  chỉ với Dual Graphics mà nó cũng cho phép cấu hình với 02 Card màn hình rời .

Quản lí điện  năng và Turbo Core

Giảm công suất tiêu thụ là một trong những mục tiêu chính khi phát triển Llano . Như chúng ta còn nhớ , bộ vi xử lí  dựa trên vi cấu trúc K10 không  phải là model mới khi nói tới khía cạnh tiêu thụ điện năng . Và bây giờ bên cạnh những lõi x86 , bên trong Llano lại còn có lõi đồ họa  cực mạnh vì vậy AMD phải tìm cách để giảm mức tiêu thụ điện  năng . Cũng vì thế mà Llano không  thể được dùng trong thị trường mobile .

Vấn đều tiêu thụ nhiều điện  năng có thể được giải quyết khi chuyển sang sản xuất bằng công nghệ 32nm , hỗ trợ lõi x86 trong Llano làm việc với điện  áp thấp hơn trong khoảng từ 1.2-1.25V , có nghĩa là cùng mức tiêu thụ điện  năng của Athlon II tiết kiệm điện  .

Tuy nhiên sự thay đổi chủ yếu là khả năng tắt bớt điện năng cung cấp cho những phần APU nghỉ thông qua Power Gating . Mặc dù chỉ có hai nguồn cấp điện năng độc lập trong Llano đó là một cho lõi x86 và một cho lõi đồ họa  và North Bridge , nhưng hệ thống  quản lí điện  năng có thể tắt bớt những bộ phận trong CPU được lựa chọn một cách linh hoạt . Từng lõi x86 riêng biệt , hoặc lõi đồ họa  hoặc UVD có thể tắt hoàn toàn độc lập với nhau .

 

\"\"

 

Kết quả là Llano cho hệ thống  để bàn có TDP 65W và 100W , bộ vi xử lí  mobile 35W và 45W . Nói một cách khác AMD đã theo kịp khi so sánh với Sandy Bridge về khả năng tiết kiệm điện .

Tuy nhiên TDP thấp kết quả từ việc giảm tốc độ xung nhịp của lõi x86 trong Llano , hiện tại chưa có model nào vượt quá ngưỡng 3GHz và Model cho mobile chưa vượt quá 2.6GHz .

Trong trường  hợp này AMD quyết định dùng cách tăng hiệu suất làm việc của CPU bằng công nghệ Overclock động Turbo Core , đó là tăng tần số làm việc của lõi x86 nào đó khi một số lõi x86 còn lại chuyển sang trạng thái nghỉ . AMD đã áp dụng công nghệ này trong Phenom II X6 nhưng họ đã thay đổi chút ít trong Llano .

Turbo Core mới trong Llano cho kết quả tương đương nhưng nó lại gần như không  phụ thuộc vào hiệu quả của hệ thống  làm mát hoặc nhiệt độ môi trường .

Công nghệ Turbo Core trong Llano chỉ dùng cho lõi x86 . Lõi đồ họa  chỉ có thể làm việc với tần số thấp hơn theo mệnh lệnh để giảm tiêu thụ điện năng và không  thể tự động tăng tốc .

Chipset và Motherboard

Bộ vi xử lí  Llano không  phải là thành phần duy nhất trong nền tảng  Lynx . Nó cũng dùng Chipset logic tương ứng .

APU đã tích hợp mạch điều khiển bộ nhớ và điều khiển Bus PCIe vì thế Chipset chỉ còn một Chip , South Bridge , hay còn gọi là FCH ( Fusion Controller Hub ) .

 

\"\"

 

Hiện tại AMD đang có hai model FCH đó là A55 và loại cao cấp hơn là A75 .

A75 hỗ trợ tất cả những giao diện hiện đại như USB 3.0 và SATA 6.0Gbps . A55 chĩ hỗ trợ những giao diện cũ hơn như USB 2.0 và SATA 3.0Gbps .

Dưới đây là sơ đồ khối của A75 FCH

 

\"\"

 

Dưới đây là những tính năng kỹ thuật của những model FCH

 

\"\"

 

Những Motherboard cho hệ thống  để bàn dựa trên FCH A55 và A75 trang bị Socket FM1 . Như vậy nó không tương thích với những bộ vi xử lí  AM3 hiện thời . tất nhiên Llano cũng không  thể dùng với những Motherboard cũ .

 

\"\"

 

Socket FM1 có kích thước tương tự như Socket AM3 mặc dù có số lượng chân hoàn toàn khác , 905 chân . Tất cả những chân này bảo đảm APU được nối tới không  chỉ Chipset và bộ nhớ hệ thống  mà còn có Bus đồ họa  PCIe x16 và màn hình .

Hầu hết những nhà sản xuất Motherboard hàng đầu đều chuẩn bị những Motherboard FM1

 

\"\"

 

Llano cho hệ thống  để bàn

Những Llano đầu tiên cho hệ thống  để bàn sẽ có 04 model APU với 4-lõi x86 bên trong . Cũng như APU Llano mobile chúng vẫn dùng tên A8- A6-Series .

A8-Series là model cao cấp hơn với lõi đồ họa  Sumo với 400SP .

A6-Series có tốc độ lõi x86 thấp hơn và số lượng SP ít hơn với 320SP .

Điều đó có nghĩa là chờ tới khi Llano 2-lõi A4-Series phát hành thì những APU hiện nay phân biệt với nhau dựa trên khả năng làm việc của lõi đồ họa  . Bảng bên dưới là liệt kê chi tiết về đặc điểm kỹ thuật của Radeon HD 6550D và Radeon HD 6530D dùng trong Llano

 

\"\"

 

Dưới đây là danh sách đầy đủ hiện tại của Llano dùng cho nền tảng  Lynx

 

\"\"

 

Hai model trong mỗi Series trên thực tế là hai sản phẩm khác nhau nhất là mức tiêu thụ điện  năng . Model cao cấp hơn có TDP 100W nhưng model kia lại có TDP 65W là hỗ trợ Turbo Core . Tốc độ lõi x86 của APU có TDP nhỏ hơn thường giảm 20-25% so với model 100W nhưng những tính năng đồ họa  vẫn giữ nguyên .

Như vậy chúng ta đều thấy tốc độ x86 trong Llano hiện nay thấp hơn so với những bộ vi xử lí  Athlon II và Phenom II mới nhất vì thế thế mạnh của Llano không  phải hiệu suất làm việc của lõi x86 mà là thế mạnh của lõi đồ họa  khủng . Điều đó khiến cho người dùng  cần xem xét khi nâng cấp từ Socket AM3 sang nền tảng  Socket FM1 khi mà Llano chỉ tăng hiệu quả sử dụng điện  năng mà không  tăng hiệu suất làm việc của lõi x86 .

Trong thị trường mobile , Llano mới dùng để cạnh tranh với Core i3 và Core i5 dựa trên Sandy Bridge . Như thị trường để bàn x86 trong Llano không  thể cạnh tranh được với x86 trong Core i5 vì có tốc độ thấp hơn và dùng vi cấu trúc K10 cũ từ năm 2007. Vì thế chiến lược về giá của AMD dùng A8 Llano cạnh tranh với những model Core i3 2-lõi .

Như đã mô tả bên trên AMD không  phải chỉ có 04 model APU đã liệt kê mà họ sẽ còn có những model A6- và A4-Series 2- và 3-lõi có giá thành rẻ hơn với TDP 65W và sẽ có 320SP và 240SP trong lõi đồ họa  . Như vậy họ Llano mở rộng trong phân khúc thị trường giá rẻ và AMD không  có kế hoạch dùng Lynx cho nền tảng  cao cấp nhất .

 

\"\"