Nehalem của Intel

Intel đã tung ra thị trường những bộ vi xử lí có tên mã Nehalem và cao cấp nhất là dòng Core i7
Giới thiệu

 Những tính năng chính bao gồm Bộ phận điều khiển bộ nhớ tích hợp Triple-Channnel , 03 mức bộ nhớ Cache , Bus ngoài mới với tên gọi QuickPath , Intel quay trở lại với công nghệ HyperThreading và hơn thế nữa .

“Nehalem” là tên mã nhưng không phải là tên cuối cùng của dòng CPU mới và chưa biết chính xác tên thương mại của dòng sản phẩm này là gì .

Dưới đây chúng tôi tóm lược những đặc điểm chính của Nehalem và sẽ giải thích những danh mục chính trong bài báo này :

  • Dựa trên vi cấu trúc Intel Core
  • Từ hai tới tám lõi
  • Bộ phận điều khiển bộ nhớ tích hợp DDR3 Triple-Channel
  • Mỗi lõi chứa 256Kb Cache L2
  • Bộ nhớ Cache L3 8MB
  • Tập lệnh SSE 4.2 mới với việc thêm bảy lệnh mới để hỗ trợ cho xử lí văn bản , có tên gọi “Application Target Accelerator “ .
  • Hỗ trợ Two-Way SMT ( Simultaneous Multi-Threading )
  • Cải tiến trong vi cấu trúc ( Bộ phận Gửi đi – Dispatch Unit – 04-way )
  • Cải tiến phần dự đoán rẽ nhánh bằng việc thêm bộ đệm BTB ( Branch Target Buffer ) thứ hai .
  • Bộ đệm TLB (Translation Look-aside Buffer ) thứ hai với 512 – Entry .
  • Cải thiện hiệu suất với những ứng dụng ảo hoá .
  • Bus ngoài QuickPath mới ( Hai liên kết cho một Socket của CPU )
  • Công nghệ sản xuất 45nm

 \"/\"

Hình 1 : Những tính năng kĩ thuật chính của Nehalem

Nehalem sẽ là những CPU 45nm dựa trên Vi cấu trúc Intel Core . Nói một cách khác nó dựa trên những bộ vi xử lí Core 2 Duo hiện thời .

Bộ nhớ Cache của Nehalem sẽ sử dụng tương tự như sắp xếp Cache đã sử dụng như đối với những bộ vi xử lí AMD Phenom , có nghĩa là mỗi lõi sẽ dùng bộ nhớ Cache L2 riêng biệt và bộ nhớ Cache L3 được dùng chung . Mỗi lõi sẽ có 256KB Cache L2 và bộ nhớ Cache L3 sẽ là 8MB ( như hình 2 ) . Bộ nhớ Cache L1 sẽ tương tự như của Core 2 Duo có nghĩa là tất cả là 64KB trong đó 32KB cho Lệnh và 32KB cho Dữ liệu .

 \"/\"

Hình 2 : Cấu trúc Cache trong Nehalem

Những bộ vi xử lí Core 2 Duo chỉ có một bộ nhớ Cache L2 được sử dụng chung cho tất cả những lõi của nó .

Những bộ vi xử lí Intel Core 2 Quad và Core 2 Extreme có hai bộ nhớ Cache L2 , mỗi bộ nhớ Cache L2 sử dụng chung cho hai lõi . Để hiểu rõ ràng hơn bạn có thể tham khảo theo hình 3 và 4

 \"/\"

Hình 3 : So sánh giữa những cấu trúc Cache

 \"/\"

Hình 4 : So sánh giữa những cấu trúc Cache

Bộ phận điều khiển bộ nhớ và Bus ngoài

Như vậy Nehalem sẽ là bộ vi xử lí đầu tiên của Intel có Bộ phận điều khiển bộ nhớ được tích hợp bên trong CPU . Đó chính là ý tưởng của AMD đã thực hiện bên trong bộ vi xử lí , đã gây được tiếng vang lúc đó , từ những năm 2003 với Athlon 64 . Bằng việc như vậy làm tăng hiệu suất của bộ nhớ ( có nghĩa là tốc độ truyền của bộ nhớ ) vì khi đó Bộ phận điều khiển bộ nhớ gần với lõi CPU nhất , làm giảm thời gian trễ so với quá trình đi ra từ CPU để có thể tiếp xúc với Bộ phận điều khiển bộ nhớ nằm trên Motherboard .

Nehalem sẽ tích hợp Bộ phận điều khiển bộ nhớ DDR3 , hỗ trợ DDR3 800/1064/1333 . Nhưng thực sự có một điều mới nhất của nó chính là sử dụng cấu trúc Triple-Channel , có nghĩa là nó truy cập được 03 thanh nhớ trong cùng một lúc , truyền 192-bit / chu kì thay thế cho 128-bit trong cấu hình Dual-Channel và 64-bit trong cấu hình Single-Channel . Intel nói rằng hiệu suất của bộ nhớ tăng 50% so với cấu trúc Dual-Channel . Khi sử dụng 03 thanh nhớ DDR3-1333 thì theo lí thuyết băng thông của nó đạt được là 31.992 MB/s so với 21.328 MB/s với cấu hình Dual-Channel hiện thời khi sử dụng cùng kiểu bộ nhớ .

 \"\"

Hình 5 : Tích hợp bộ phận điều khiển bộ nhớ DDR3 – 1333

AMD sử dụng Bus HyperTransport để nối CPU với Chipset , và bây giờ trong Nehalem Intel sẽ sử dụng Bus QuickPath mới . Mỗi CPU Nehalem sẽ có hai Bus QuickPath , một để kết nối CPU với Chipset và một để kết nối giữa những CPU với nhau , để cho nền tảng Multi-CPU ( hình 6 ) .

Chúng tôi đã có bài giới thiệu tổng quan về QuickPath các bạn tìm đọc để hiểu thêm , nhưng cũng xin nói lại như sau :

Bus này có tốc độ truyền 6.4 tỉ / giây / một đường liên kết và CPU sẽ có băng thông 25.6 GB/s với một đường liên kết . Mỗi đường liên kết có đường truyền dữ liệu riêng biệt là Nhận và Thu dữ liệu vì thế số liệu 25.6GB/s đó là thủ thuật quảng cáo mà thôi , có nghĩa là mỗi đường truyền có tốc độ cao nhất là 12.8GB/s

 \"\"

Hình 6 : Bus ngoài QuickPath mới

Những cải tiến nâng cao cấu trúc khác trong Nehalem

Vấn đề tiếp theo quan trọng nữa trong Nehalem đó chính là sự quay trở lại của công nghệ Hyper-Threading và được đổi tên thành SMT ( Simutaneous Multi-Threading ) . Công nghệ này sẽ cho phép mỗi lõi CPU sẽ được hệ điều hành và chương trình nhận dạng thanh hai lõi CPU độc lập . Do đó hệ thống Quad-Core CPU thì hệ điều hành sẽ nhận dạng thành 08 lõi CPU .

\"\" 

Hình 7 : Công nghệ Hyper-Threading quay trở lại với tên gọi mới là SMT

  • Tiếp theo trong Nehalem cải tiến cấu trúc phải kể đến về việc nó có 04 Bộ phận Gửi dữ liệu đi ( Dispatch Unit ) thay vì 03 Bộ phận này trong Core 2 Duo . Điều đó có nghĩa là bên trong CPU xử lí 04 vi lệnh tại cùng một thời điểm thay vì 03 vi lệnh trong những bộ vi xử lí dựa trên cấu trúc Core . Với việc có 04 Dispatch Unit cho phép CPU tăng khả năng xử lí thêm 33% . Như vậy những CPU dựa trên Nehalem sẽ nhanh hơn những CPU Core 2 Duo khi chạy cùng tốc độ xung nhịp .
  • Nehalem sẽ có bộ đệm 512-Entry TLB ( Translation Look-aside Buffer) thứ hai . Bộ phận này là một bảng được dùng để chuyển đổi giữa địa chỉ vật lí và địa chỉ ảo của bộ nhớ ảo . Bộ nhớ ảo là kĩ thuật mà ở đó CPU mô phỏng nhiều bộ nhớ RAM thành những File trên ổ cứng ( gọi là Swap Flie ) để cho phép máy tính tiếp tục hoạt động khi mà bộ nhớ RAM không đủ chỗ . Khi đó CPU sẽ sử dụng ổ cứng như là nơi lưu trữ thông tin thay thế cho RAM . Theo Intel việc thêm bản thứ hai này sẽ cải thiện hiệu suất làm việc của CPU .
  • Nehalem có sự cải tiến đáng kể phải đề cập đến đó là việc nâng cấp Bộ phận dự đoán Rẽ nhánh ( Branch Prediction Unit ) , bằng việc thêm bộ đệm BTB ( Branch Target Buffer ) thứ hai . Dự đoán Rẽ nhánh là phần mà cố gắng dự đoán những bước tiếp theo của chương trình để tải vào bên trong CPU những lệnh mà nó nghĩ rằng CPU sẽ có thể thực hiện công việc đó kế tiếp . Nếu dự đoán là đúng thì CPU không mất thời gian để tải những lệnh đó từ bộ nhớ vì lúc đó nó đã có sẵn bên trong CPU . Việc tăng kích thước của BTB hoặc thêm bộ đệm BTB nữa cho phép tải nhiều lệnh dự đoán trước hơn và vì thế sẽ cải thiện được hiệu suất của CPU .

 \"\"\"\"