Chi tiết về cấu trúc ARM Cortex-A72

Tại sự kiện TechDay 2015 diễn ra ở London , ARM đã cung cấp thêm những thông tin chi tiết về Cortex-A72 .

ARM đã thông báo về Cortex-A72 từ tháng Hai năm nay nhưng để lại cho những người quan tâm nhiều câu hỏi thắc mắc . Cortex-A72 được thiết kế để thay thế cho Cortex-A57 .

Việc chuyển từ A57 thành A72 liệu có khác hơn so với A59 hay tương tự , ARM cho biết họ muốn cung cấp sự phân biệt tốt hơn giữa những lõi có hiệu suất làm việc cao hơn với những lõi tầm trung và tiết kiệm điện năng . Trên thực tế có một số sự nhầm lẫn giữa A53 dùng điện năng hiệu quả hơn với A57 có nhiều sức mạnh xử lí hơn điều đó khiến cho người dùng thường suy nghĩ là tương tự nhau , do đó có sự thay đổi lớn trong dòng A7x Series .

Chúng ta đã đưa ra những dự đoán về số liệu liên quan tới hiệu suất làm việc , liệu A72 mạnh hơn A57 là bao nhiêu , khả năng tiết kiệm điện  năng của nó như thế nào …

Cortex-A72 được sản xuất bằng công nghệ xử lí FinFET mới của Samsung / GlobalFoundries và TSMC , theo bảng trình chiếu cho thấy đó là công nghệ 14nm và 16nm . Do dùng công nghệ xử lí nhỏ hơn nên A72 sẽ có tốc độ làm việc cao hơn so với A57 , khoảng 2.5GHz với công nghệ 14nm/16nm cho những điện thoại cao cấp . Tốc độ xung nhịp cao hơn có thể được dùng trong những ứng dụng máy chủ , đó cũng là thị trường mã Cortex-A72 hướng tới .

 

\"\"

 

\"\"

ARM cho biết nếu như A72 và A57 được sản xuất cùng công nghệ 28nm và với cùng tốc độ xung nhịp thì A72 tiết kiệm điện  năng hơn 20% so với A57 .

Điều đáng chú ý đó là ARM thiết kế A72 có khả năng hoạt động liên tục trong tần số làm việc của mình . Điều đó khiến cho chúng ta nhớ tới A57 trong những thiết bị nhỏ như điện thoại thông minh , nó rất khó để duy trì được sức mạnh của nó trong thời gian dài vì thế A57 chỉ có thể chạy được với tốc độ lớn nhất trong một khoảng thời gian ngắn .

Với A72 có thể kéo dài mức độ hoạt động 750mW cho mỗi lõi khi được chế tạo bằng công nghệ 16nm FinFET với tốc độ khoảng gần 2.5GHz .

 

\"\"

 

Với Cortex-A72 , ARM cũng có một số tối ưu hóa về cấu trúc để cải thiện hiệu suất làm việc khi so sánh với A57 và có IPC tăng 16-30% trong một số tình huống .

Cấu trúc A72 , nâng cấp từ A57

ARM có vẻ như cố gắng cải tiến cấu trúc trong A72 theo ba tiêu chí PPA – Performance , Power và Area - , tối ưu hóa lại mọi khối logic có trong A57 . Tuy nhiên cũng có một số thiết kế lại trong cấu trúc CPU  , như một số thay đỏi bao gồm Dự đoán rẽ nhánh ( Brach-Predictor ) mới và cải tiến lại Pipeline của Decoder cho phép giải mã lệnh được tốt hơn .

 

\"\"

 

Trong Khối lấy trước lệnh ( Instruction Fetch Block ) chúng ta thấy nhánh Dự đoán rẽ nhánh mới sử dụng thuật toán phức tạp mới để cải thiện hiệu suất làm việc và giảm mức độ tiêu hao điện năng bằng cách giảm việc Dự đoán sai và Suy đoán , cho phép giảm dự đoán sai lên tới 50% so với A57 . Việc Dự đoán rẽ nhánh dư thừa cũng được giảm đi .

Cũng có sự tối ưu hóa về sức mạnh tổng hợp trong tổ chức RAM bằng những cặp khối IP khác nhau tốt hơn , đôi khi ARM cung cấp IP vật lí riêng của mình .

 

\"\"

 

\"\"

Về phần Pipeline , Decoder/Rename của A72 cũng có những cải tiến riêng trong những bộ phận này . Decoder vẫn là Decoder 3-wide nhưng ARM cố gắng thực cải tiến nó về hiệu suất làm việc và mức tiêu hao điện năng thao những cách khác . Để cải tiến hiệu suất làm việc thì độ rộng băng thông của Decoder cũng tăng lên và nhận một số lệnh ghép AArch64 nâng cao . Về điện năng tiêu hao cũng được gia cố theo nhiều mức , bao gồm tối ưu hóa việc giải mã lệnh trực tiếp , đặt phần cứng Bộ đệm và điều khiển luồng dữ liệu làm việc xung quanh Decoder .

Tuy nhiên tầng Dispatch / Retire được cải tiến nhiều nhất để nâng cao hiệu suất làm việc .

Trong khi Decoder có khả năng xử lí những lệnh hợp nhất , bộ phận Dispatch có thể lấy được nhiều Vi lệnh để cung cấp cho Execution Unit với khả năng chuyển hóa được từ 3-wide thành 5-wide . Kết quả là Decoder xử lí được công việc ngày càng nhiều trong mỗi chu kì xung nhịp do Dispatch lấy được nhiều vi lệnh hơn .

Với Dispatch , ARM cũng có một số giải pháp chuyên dụng trên Register File bằng cách giảm số lượng những cổng đọc ( Read-Port ) bằng cách giới thiệu chia xẻ cổng để giảm lượng truy cập thừa .

 

\"\"

 

Dưới đây là bảng so sánh lõi CPU của ARM

 

\"\"

 

Trong những Bộ phận thục thi ( Execution Unit – EU ) chúng ta thấy những FP/Advanced SIMD thế hệ mới . Những bộ phận mới cho phép độ trễ thấp hơn như chiều dài Pipeline FP giảm từ 9 còn 6 , FMUL giảm từ 5 chu kì xuống còn 3 , FADD từ 4 còn 3 , FMAC từ 9 còn 6 và CVT từ 4 xuống còn 2 . Việc giảm chiều dài Pipeline FP như vậy cho phép thiều dài Pipeline lớn nhất giảm từ 19 xuống còn 16 .

Những Bộ phận Số nguyên ( Integer Unit ) cũng được cải tiến , những Bộ chia Radix-16 có băng thông rộng gấp đôi , trong khi đó phần CRC bây giờ có thời gian trễ chỉ là 1 chu kì , băng thông lớn gấp 3 so với A57 .

 

\"\"9

 

Một sự thay đổi lớn khác trong A72 so với A57 đó là phần Load/Store . ARM tuyên bố băng thông tới L1/L2 tăng 30% . Để đạt được điều này bộ phận lấy trước dữ liệu Prefetcher L1/L2 phức tạp với sự cải tiến một cách hiệu quả trong Pipeline L1-Hit .

Chúng ta đã thấy những sự đổi mới của A72 so với A57 trên giấy và rõ ràng A72 được nâng cấp từ A57 để nâng cao hiệu suất làm việc , sử dụng điện năng hiệu quả hơn .

Cortex-A57 đã có mặt trên thị trường từ Q3 năm ngoái và bây giờ được sản xuất với số lượng lớn bên trong Snapdragon 810 và Exynos 7420 . Dự kiến chúng ta sẽ thấy Cortex-A72 vào năm nay và sẽ được sản xuất hàng loạt từ năm sau .

MediaTek đã trình diễn A72 tại MWC 2015 , sắp tới sẽ có những thông tin thử nghiệm về loại SoC mới này .

 

\"\"