NVIDIA xâm nhập vào hệ thống suy luận bằng Tesla P4 và P40

Tại Hội nghị công nghệ GPU diễn ra ở Bắc Kinh , CEO của NVIDIA là Jen-Hsun Huang thông báo hai Card chuyên nghiệp mới thuộc họ Tesla có năng lực tính toán cực cao bao gồm Tesla P4 và Tesla P40 .

 

Tesla P4 được chế tạo dựa trên GPU GP104 đã dùng để tạo nên sức mạnh cho GeForce GTX1080 và Tesla P40 dùng GPU GP102 đã sử dụng trong Card màn hình Titan X mới .

Hiện tại NVIDIA đã có Tesla P100 dùng GPU Pascal đã được sử dụng trong hệ thống  máy học sâu DGX-1 . P100 rất thích hợp trong mạng lưới nơ-ron luyện tập vì NVIDIA nhấn mạnh nó có hiệu suất tính toán FP16 rất cao .

Trong khi đó P4 và P40 mới rất thích hợp cho mạng nơ-ron suy luận có thời gian trễ được ưu tiên mà không cần nhiều tới tốc độ tính toán có độ chính xác dấy phảy động . Kết quả là những Card chuyên nghiệp mới hỗ trợ cho những tính toán tốc độ cao dùng số nguyên 8-bit . Những chip Pascal trong P4 và P40 mới có 4 bộ tính toán INT8 đặt cùng với một bộ tính toán FP32 cho những phép tính kết hợp giữa Nhân-Cộng thích hợp cho những mạng nơ-ron suy luận .

NVIDIA giới thiệu phép đo hiệu sất mới được viết tắt TOPS (tera-operations per second) . Bản chất của kết quả này đó là phiên bản tính toán số nguyên của FLOPS và NVIDIA cho biết Tesla P40 đạt 47 TOPS .

NVIDIA khẳng định P40 nhanh gấp 4 lần trong hiệu suất suy luận “thế giới thực” so với Tesla M40 thế hệ trước .

Tesla P40 có TDP 250W , Tesla P4 tập trung cho mức độ tiêu hao điện năng và mật độ nên có TDP có thể được cấu hình 50W hoặc 75W và đạt năng lực tính toán 22 TOPS .

NVIDIA tuyên bố Tesla P4 dùng hiệu quả gấp 60 lần so với những máy chủ Xeon cho các ứng dụng suy luận .

Tesla P40 và P4 đều dùng bộ nhớ GDDR5 . P4 có 8GB RAM @ 6GT/s , P40 có 24GB RAM @ 7.2GT/s với bus nhớ 384-bit .

Bên cạnh phần cứng mới , NVIDIA cũng thông báo hai sản phẩm phần mềm mới bao gồm TensorRT là thư viện phần mềm cho phép những nhà phát triển dễ dàng chuyển đổi những mạng nơ-ron tới cấu trúc Pascal chuyên dụng INT8 . DeepStream SDK là thư viện phân tích video dùng để sử dụng phần cứng giải mã video tích hợp trong Pascal trong những Card Tesla mới . NVIDIA cho biết DeepStream SDK nhanh gấp 13 lần so với phân tích bằng CPU .