Anatasia
04-16-2010, 05:02 PM
FERMI - LÀN GIÓ MÁT
THỔI QUA THUNG LŨNG CÔNG NGHỆ KỶ NGUYÊN MỚI
Tiến thêm một bước dài với khả năng tính toán GPU và kiến trúc CUDA hoàn toàn mới, NVidia đă tung ra công nghệ Fermi – mẫu GPU tính toán đầu tiên. Dựa trên các công nghệ có sẵn trong bộ xử lư đồ họa G80 và GT 200, NVidia đă tạo ra một thiết kế mới với 512 bộ xử lư CUDA và hơn 3 tỉ biến trở. Hiệu năng của nó tương đương bộ xử lư máy chủ thông thường nhưng chỉ tiêu tốn 1/10 chi phí và chỉ tiêu thụ 1/20 mức năng lượng.
http://www.wareground.com/images/Nvidia_Gives_Fermi_GF100_Official_GPU_Names_126519 0304_0.jpg
Ảnh minh họa một lớp cắt kiến trúc Fermi
Công nghệ Fermi mở rộng khả năng xử lư kết hợp của GPU và CPU nhằm xử lư các ứng dụng tính toán của những lập tŕnh viên, nhà phát triển, nhà khoa học lẫn nhu cầu của các trường ĐH. GPU mới có khả năng xử lư mă C++ và môi trường phát triển Visual Studio. Đồng thời, Fermi cũng giúp cho việc lập tŕnh song song trở nên dễ dàng hơn cùng việc tăng tốc các ứng dụng nhanh hơn bao giờ hết.
http://images.anandtech.com/reviews/video/NVIDIA/Fermi/Preview/transistorcount.png
Ảnh minh họa số biến trở của công nghệ Fermi
Ngoài ra, các phép lập vật lư chi tiết cao, dựng h́nh 3D và nhiều tính năng khả thi khác đều có thể thực hiện dựa trên kiến trúc Fermi. Tất cả đều nhờ vào bốn công nghệ đột phá của NVidia đă góp mặt trong thế hệ GPU CUDA mới này:
- 512 LƠI CUDA: Với 512 lơi CUDA và chuẩn tính toán dấu chấm động IEEE 754-2008, khả năng tăng tốc và tính linh hoạt của ứng dụng đă được cải thiện đáng kể so với kiến trúc Tesla c1060 trước đây. Thiết kế mới này được nhắm vào nhu cầu của các ứng dụng phát triển và khoa học nhằm nâng cao khả năng tính toán chính xác kép (Double Precision) bên trong GPU. Nó đặc biệt hữu ích cho các ứng dụng khoa học như giả lập môi trường thiên văn (ví dụ như trường trọng lực lớn hay các tương tác gia tốc vec tơ trong không gian) đ̣i hỏi khả năng tính toán cực lớn:
http://www.legitreviews.com/images/reviews/1193/gf100_block_diagram.jpg
Ảnh minh họa FERMI Block Diagram
- CÔNG NGHỆ BỘ ĐỆM DỮ LIỆU SONG SONG CỦA NVIDIA: Các nhà phát triển và nghiên cứu công nghệ thường sử dụng nhiều ứng dụng khác nhau, mỗi trong số chúng đều có đặc điểm sử dụng tài nguyên khác nhau ví dụ như bộ đệm hay bộ nhớ chia sẻ trên GPU. Một số bản đồ giải thuật có thể sử dụng trực tiếp bộ nhớ, một số lại yêu cầu bộ đệm hoặc thậm chí là cả hai. Công nghệ bộ đệm dữ liệu song song với trật tự bộ nhớ, khả năng thiết lập bộ nhớ truy cập ngẫu nhiên 64KB cho bộ đệm L1 hay bộ đệm L2 thống nhất cho phép GPU sử dụng phù hợp với mọi loại ứng dụng. Ví dụ điển h́nh có thể kể tới như bộ nhớ 64KB có thể được sử dụng để hỗ trợ các ứng dụng chia sẻ bộ nhớ nặng như giả lập khí động học. Nó đem lại hiệu năng nhanh gấp 3 lần so với việc sử dụng DRAM – đặc biệt là ở những ứng dụng có nhu cầu sử dụng bộ nhớ theo phương thức mới lạ.
http://www.cgnewspaper.com/images/feature/2010/NVIDIA/fermi/1/fermi-10.jpg
- CƠ CHẾ GIGATHREAD CỦA NVIDIA: Cơ chế Gigathread cho phép quản lư thông minh hơn 10 ngàn tiểu tŕnh để tạo ra khả năng xử lư hiệu quả hơn bao giờ hết. Tính năng thừa hưởng của G80 này được tích hợp vào Fermi với nhiều cải tiến về tốc độ chuyển đổi, thực hiện các lệnh lơi cùng lúc và nâng cao khả năng sắp xếp khối tiểu tŕnh. Khi đi chung với nhau, các tính năng này cho phép các nhà phát triển tạo ra những ứng dụng có thể tận dụng tốt hơn nữa ưu thế của PhysX. Với Fermi, việc sử dụng tài nguyên GPU được tối ưu hóa cho hiệu năng và đem lại cho các nhà phát triển và nhà nghiên cứu một công cụ rất hữu hiệu để tạo ra những phép lạ mới.
http://www.techspot.com/fileshost/newspics2/2009/fermi-block.gif
Ảnh minh họa biểu đồ hoạt động của công nghệ GigaThread Engine ứng dụng trong công nghệ Fermi
- HỖ TRỢ MĂ SỬA LỖI (ECC): ECC (khả năng hỗ trợ mă sửa lỗi) là giải pháp bảo vệ dữ liệu trong bộ nhớ. Do sóng xạ có mặt ở xung quanh chúng ta – dù không gây hại nặng nhưng chỉ một lượng nhỏ cũng có thể làm sai lệch dữ liệu có trong bộ nhớ và tạo ra các lỗi phần mềm. Những người dùng tới khả năng tính toán GPU sẽ yêu cầu độ tích hợp dữ liệu mở rộng ở môi trường hiệu năng cao và đây là những ǵ mà kiến trúc Fermi đem lại. Công nghệ ECC của Fermi sẽ phát hiện các lỗi mềm này trước khi chúng gây ảnh hưởng tới hệ thống. Thêm vào đó, Fermi cũng hỗ trợ các mă Single Error Corrent, Double Error Corrent (SECDED) để đảm bảo các lỗi này được ghi nhận lại và ứng dụng có thể chạy lại hoặc chấm dứt việc xử lư các dữ liệu lỗi. Tính năng này của Fermi sẽ đem lại lợi ích cho các lĩnh vực h́nh ảnh y tế hay tính toán diện rộng – vốn yêu cầu tính chính xác cao.
Dưới đây là bảng so sánh các tính năng giữa G80, G200 và Fermi:
http://www.xtremevn.com/forum/attachment.php?attachmentid=9426&thumb=1&d=1270907511
Qua đó, bảng số liệu cho ta thấy sự khác biệt rơ rệt giữa kiến trúc mới so với các sản phẩm trước đây. Công nghệ gồm các tính năng chưa từng được biết đến và nâng cao hiệu năng của các thành phần quan trọng như: Số lượng biến trở, lơi CUDA – gần gấp đôi so với những ǵ có trong GT200 hiện nay.
http://forum.amtech.com.vn/attachments/card-do-hoa-video-cards/17678d1254367064-ati-nvidia-cuoc-chien-khong-bao-gio-co-hoi-ket-physx-fermi.jpg
Ảnh minh họa bảng số liệu so sánh hiệu năng giữa kiến trúc GT200 và kiến trúc Fermi
http://www.cgnewspaper.com/images/feature/2010/NVIDIA/fermi/1/fermi-05.jpg
Ảnh minh họa nội thất các xe hơi đua của các Game trong tương lai được áp dụng công nghệ Fermi - giấc mơ NVidia liệu có thể thành hiện thực?
THỔI QUA THUNG LŨNG CÔNG NGHỆ KỶ NGUYÊN MỚI
Tiến thêm một bước dài với khả năng tính toán GPU và kiến trúc CUDA hoàn toàn mới, NVidia đă tung ra công nghệ Fermi – mẫu GPU tính toán đầu tiên. Dựa trên các công nghệ có sẵn trong bộ xử lư đồ họa G80 và GT 200, NVidia đă tạo ra một thiết kế mới với 512 bộ xử lư CUDA và hơn 3 tỉ biến trở. Hiệu năng của nó tương đương bộ xử lư máy chủ thông thường nhưng chỉ tiêu tốn 1/10 chi phí và chỉ tiêu thụ 1/20 mức năng lượng.
http://www.wareground.com/images/Nvidia_Gives_Fermi_GF100_Official_GPU_Names_126519 0304_0.jpg
Ảnh minh họa một lớp cắt kiến trúc Fermi
Công nghệ Fermi mở rộng khả năng xử lư kết hợp của GPU và CPU nhằm xử lư các ứng dụng tính toán của những lập tŕnh viên, nhà phát triển, nhà khoa học lẫn nhu cầu của các trường ĐH. GPU mới có khả năng xử lư mă C++ và môi trường phát triển Visual Studio. Đồng thời, Fermi cũng giúp cho việc lập tŕnh song song trở nên dễ dàng hơn cùng việc tăng tốc các ứng dụng nhanh hơn bao giờ hết.
http://images.anandtech.com/reviews/video/NVIDIA/Fermi/Preview/transistorcount.png
Ảnh minh họa số biến trở của công nghệ Fermi
Ngoài ra, các phép lập vật lư chi tiết cao, dựng h́nh 3D và nhiều tính năng khả thi khác đều có thể thực hiện dựa trên kiến trúc Fermi. Tất cả đều nhờ vào bốn công nghệ đột phá của NVidia đă góp mặt trong thế hệ GPU CUDA mới này:
- 512 LƠI CUDA: Với 512 lơi CUDA và chuẩn tính toán dấu chấm động IEEE 754-2008, khả năng tăng tốc và tính linh hoạt của ứng dụng đă được cải thiện đáng kể so với kiến trúc Tesla c1060 trước đây. Thiết kế mới này được nhắm vào nhu cầu của các ứng dụng phát triển và khoa học nhằm nâng cao khả năng tính toán chính xác kép (Double Precision) bên trong GPU. Nó đặc biệt hữu ích cho các ứng dụng khoa học như giả lập môi trường thiên văn (ví dụ như trường trọng lực lớn hay các tương tác gia tốc vec tơ trong không gian) đ̣i hỏi khả năng tính toán cực lớn:
http://www.legitreviews.com/images/reviews/1193/gf100_block_diagram.jpg
Ảnh minh họa FERMI Block Diagram
- CÔNG NGHỆ BỘ ĐỆM DỮ LIỆU SONG SONG CỦA NVIDIA: Các nhà phát triển và nghiên cứu công nghệ thường sử dụng nhiều ứng dụng khác nhau, mỗi trong số chúng đều có đặc điểm sử dụng tài nguyên khác nhau ví dụ như bộ đệm hay bộ nhớ chia sẻ trên GPU. Một số bản đồ giải thuật có thể sử dụng trực tiếp bộ nhớ, một số lại yêu cầu bộ đệm hoặc thậm chí là cả hai. Công nghệ bộ đệm dữ liệu song song với trật tự bộ nhớ, khả năng thiết lập bộ nhớ truy cập ngẫu nhiên 64KB cho bộ đệm L1 hay bộ đệm L2 thống nhất cho phép GPU sử dụng phù hợp với mọi loại ứng dụng. Ví dụ điển h́nh có thể kể tới như bộ nhớ 64KB có thể được sử dụng để hỗ trợ các ứng dụng chia sẻ bộ nhớ nặng như giả lập khí động học. Nó đem lại hiệu năng nhanh gấp 3 lần so với việc sử dụng DRAM – đặc biệt là ở những ứng dụng có nhu cầu sử dụng bộ nhớ theo phương thức mới lạ.
http://www.cgnewspaper.com/images/feature/2010/NVIDIA/fermi/1/fermi-10.jpg
- CƠ CHẾ GIGATHREAD CỦA NVIDIA: Cơ chế Gigathread cho phép quản lư thông minh hơn 10 ngàn tiểu tŕnh để tạo ra khả năng xử lư hiệu quả hơn bao giờ hết. Tính năng thừa hưởng của G80 này được tích hợp vào Fermi với nhiều cải tiến về tốc độ chuyển đổi, thực hiện các lệnh lơi cùng lúc và nâng cao khả năng sắp xếp khối tiểu tŕnh. Khi đi chung với nhau, các tính năng này cho phép các nhà phát triển tạo ra những ứng dụng có thể tận dụng tốt hơn nữa ưu thế của PhysX. Với Fermi, việc sử dụng tài nguyên GPU được tối ưu hóa cho hiệu năng và đem lại cho các nhà phát triển và nhà nghiên cứu một công cụ rất hữu hiệu để tạo ra những phép lạ mới.
http://www.techspot.com/fileshost/newspics2/2009/fermi-block.gif
Ảnh minh họa biểu đồ hoạt động của công nghệ GigaThread Engine ứng dụng trong công nghệ Fermi
- HỖ TRỢ MĂ SỬA LỖI (ECC): ECC (khả năng hỗ trợ mă sửa lỗi) là giải pháp bảo vệ dữ liệu trong bộ nhớ. Do sóng xạ có mặt ở xung quanh chúng ta – dù không gây hại nặng nhưng chỉ một lượng nhỏ cũng có thể làm sai lệch dữ liệu có trong bộ nhớ và tạo ra các lỗi phần mềm. Những người dùng tới khả năng tính toán GPU sẽ yêu cầu độ tích hợp dữ liệu mở rộng ở môi trường hiệu năng cao và đây là những ǵ mà kiến trúc Fermi đem lại. Công nghệ ECC của Fermi sẽ phát hiện các lỗi mềm này trước khi chúng gây ảnh hưởng tới hệ thống. Thêm vào đó, Fermi cũng hỗ trợ các mă Single Error Corrent, Double Error Corrent (SECDED) để đảm bảo các lỗi này được ghi nhận lại và ứng dụng có thể chạy lại hoặc chấm dứt việc xử lư các dữ liệu lỗi. Tính năng này của Fermi sẽ đem lại lợi ích cho các lĩnh vực h́nh ảnh y tế hay tính toán diện rộng – vốn yêu cầu tính chính xác cao.
Dưới đây là bảng so sánh các tính năng giữa G80, G200 và Fermi:
http://www.xtremevn.com/forum/attachment.php?attachmentid=9426&thumb=1&d=1270907511
Qua đó, bảng số liệu cho ta thấy sự khác biệt rơ rệt giữa kiến trúc mới so với các sản phẩm trước đây. Công nghệ gồm các tính năng chưa từng được biết đến và nâng cao hiệu năng của các thành phần quan trọng như: Số lượng biến trở, lơi CUDA – gần gấp đôi so với những ǵ có trong GT200 hiện nay.
http://forum.amtech.com.vn/attachments/card-do-hoa-video-cards/17678d1254367064-ati-nvidia-cuoc-chien-khong-bao-gio-co-hoi-ket-physx-fermi.jpg
Ảnh minh họa bảng số liệu so sánh hiệu năng giữa kiến trúc GT200 và kiến trúc Fermi
http://www.cgnewspaper.com/images/feature/2010/NVIDIA/fermi/1/fermi-05.jpg
Ảnh minh họa nội thất các xe hơi đua của các Game trong tương lai được áp dụng công nghệ Fermi - giấc mơ NVidia liệu có thể thành hiện thực?