Bên trong vi cấu trúc Intel Haswell

Vi cấu trúc Haswell mở rộng từ vi cấu trúc Ivy Bridge bằng cách thêm những tính năng mới , như bộ phận đồ họa  , tập lệnh AVX2 mới , những cổng Dispatch mới …

 

Để hiểu tốt hơn bạn nên xem về Vi cấu trúc Intel Ivy Bridge trước khi tiếp tục . Tin không vui cho những ai muốn nâng cấp máy tính chỉ bằng cách thay thế CPU khác bởi vì bộ vi xử lí  Haswell dùng khe cắm (LGA1150 cho hệ thống  để bàn) khác .

Dưới đây là những tính năng mở rộng mới của vi cấu trúc Haswell so với Ivy Bridge :

  • Khe cắm LGA1150 mới cho máy để bàn .
  • Hỗ trợ tập lệnh AVX2 mới .
  • Hỗ trợ tập lệnh TSX mới .
  • Hỗ trợ một số lệnh BMI ( Bit Manipulation Instruction ) mới .
  • Thêm hai cổng Dispatch Port nối Reservation Station tới Execution Unit.
  • Bộ xử lí video 2D mới .
  • Bộ xử lí đồ họa  DirectX 11.1 mới .
  • Trạng thái điện năng S0ix mới , cho phép tiết kiệm điện năng tương tự như những trạng thái “Sleep” hiện tại nhưng lại “đánh thức” CPU nhanh gấp 20 lần so với những trạng thái “Sleep” truyền thống . Những trạng thái mới được dùng khi máy tính đang bật những CPU ở trạng thái nghỉ .

Những tính năng khác còn lại vẫn tương tự như vi cấu trúc Ivy Bridge .

 

Những lệnh mới

Tập lệnh AVX2 mở rộng từ tập lệnh AVX hiện tại cho phép dùng những thanh ghi 256-bit cho những phép tính số nguyên .

Với tập lệnh AVX , những phép toán số nguyên chỉ hạn chế trong những thanh ghi 128-bit và những thanh ghi 256-bit chỉ dùng cho những phép toán dấu phảy động .

Bên cạnh đó , lệnh AVX2 hỗ trợ những phép tính gộp cộng và nhân với ba phần tử FMA ( Fused Multiply-Add ) hay còn gọi là FMA3 , cho phép thực hiện những phép tính như a x b + c chỉ bằng một lệnh . Những lệnh như thế này đã được hỗ trợ trong những bộ vi xử lí  AMD dựa trên cấu trúc Piledriver . Hai bộ xử lí ( Execution Unit ) FMA cũng được đưa thêm vào trong vi cấu trúc , sẽ được thấy trong phần dưới .

15 lệnh BMI ( Bit Manipulation Instruction ) mới được thêm vào . Những lệnh này đã liệt kê trong hình dưới , có thể được dùng để mã hóa , chỉ số hóa ( Indexing ) và chuyển đổi dữ liệu .

 

Hình 1

 

Tập lệnh mới thứ ba được thêm vào trong vi cấu trúc Haswell đó là TSX ( Transactional Synchronization eXtensions ) , và được dùng để hỗ trợ giải quyết những vấn đề liên quan tới đồng bộ dữ liệu khi cùng một dữ liệu có thể được dùng bởi những công việc khác đang chạy cùng một lúc .

Tất cả những tập lệnh mới được Intel mô tả tại đây bạn đọc có thể tham khảo .

Các bạn nên lưu ý mọi tập lệnh mới phải có chương trình phù hợp mới được hỗ trợ .

 

Những cổng Dispatch Port ( DP ) và Execution Unit ( EU ) mới

Từ vi cấu trúc Nehalem , những bộ vi xử lí  Intel đã có 6 cổng Dispatch Port để nối bộ phận Reservation Station ( RS ) của CPU ( tại đây lưu trữ những vi lệnh chờ để xử lí ) tới những Bộ thực thi phép tính EU ( Execution Unit ) .

Vi cấu trúc Haswell thêm hai cổng DP , tăng 33% số lượng vi lệnh để RS có thể gửi tới những EU .

Haswell có tất cả 17 EU , Sandy Bridge và Ivy Bridge có 15 , Nehalem có 12 .

Cải tiến quan trọng trong Haswell đó là độ rộng đường dữ liệu giữa RS và EU là 256-bit . Sandy Bridge và Ivy Bridge có độ rộng này là 128-bit điều đó có nghĩa là khi những lệnh AVX 256-bit khi thực hiện phải kết hợp hai EU lại với nhau . Điều này không  xảy ra với Haswell .

 

Hình 2 : Những cổng DP và EU mới của Haswell

 

Bộ xử lí video 2D mới – 2D Video Engine

Bộ xử lí video 2D mới được mở rộng so với Ivy Bridge để có thể hỗ trợ độ phân giải  4K , lên tới 3840 x 2160 @ 60Hz trên DisplayPort hoặc lên tới 4096 x 2304 @ 24Hz trên HDMI . Nó tích hợp Bộ mã hóa Media hỗ trợ mã hóa định dạng MPEG2 và SVC , tích hợp giải mã Media để hỗ trợ giải mã MJPEG và SVC và hỗ trợ những cải tiến về hình ảnh mới .

 

Hình 3 .

 

Bộ đồ họa  3D mới

Haswell có Bộ xử lí đồ họa  DirectX 11.1 mới và sơ đồ khối chủ yếu của nó được trình bày trong Hình 4 .

Số lượng chính xác các Bộ xử lí EU ( Execution Unit ) , trong Hình 4 và 5 , tùy thuộc vào từng model CPU . Intel đưa ra ba cấu hình bao gồm : GT1 , GT2 và GT3 . Những tên thương mại có trong danh sách ở Hình 6 .

GT3e ( Iris Pro Graphics 5200 ) sẽ là GT3 với 128MB bộ nhớ Cache L4 để dùng như là bộ nhớ video tích hợp bên trong CPU và dùng cho thị trường mobile .

 

Hình 4 : Bộ xử lí video 3D

 

Hình 5 :

 

Hình 6 : Tên thương mại của những model GT1 , GT2 và GT3