spot_img
25.7 C
Hanoi
spot_img
Trang chủTài ChínhTưởng đã thoát phụ thuộc vào NVIDIA, hóa ra DeepSeek vẫn không...

Tưởng đã thoát phụ thuộc vào NVIDIA, hóa ra DeepSeek vẫn không thể ra mắt mô hình AI mới khi thiếu chip

Trước đó, nhiều người kỳ vọng rằng mô hình AI mới của DeepSeek sẽ là bước đột phá mới đối với lĩnh vực AI.

DeepSeek, công ty AI Trung Quốc từng gây ấn tượng mạnh với mô hình R1 đầu năm nay, đang phải đối mặt với tình trạng trì hoãn phát triển mô hình thế hệ tiếp theo R2 do tình trạng thiếu hụt chip H20 của NVIDIA tại Trung Quốc. Thông tin này được tờ The Information tiết lộ, trong khi DeepSeek vẫn chưa đưa ra bình luận chính thức về thời điểm ra mắt R2.

Để phát triển mô hình R1, DeepSeek đã sử dụng một cluster gồm 50.000 GPU Hopper bao gồm 30.000 chip H20, 10.000 chip H800 và 10.000 chip H100, được cung cấp bởi nhà đầu tư High-Flyer Capital Management. Tuy nhiên, hiện tại vẫn chưa rõ liệu mô hình R2 đã được pre-train hoàn toàn hay chưa.

Theo hai nguồn tin quen thuộc với dự án mà The Information trích dẫn, đội ngũ DeepSeek đã làm việc tích cực trên mô hình này, nhưng CEO Liang Wenfeng vẫn chưa hài lòng với khả năng hiện tại của nó. Công việc cải thiện hiệu suất đang tiếp tục diễn ra nội bộ trước khi mô hình được phép triển khai.

Tưởng đã thoát phụ thuộc vào NVIDIA, hóa ra DeepSeek vẫn không thể ra mắt mô hình AI mới khi thiếu chip- Ảnh 1.

Thiếu hụt các GPU AI H20 của NVIDIA được cho là nguyên nhân khiến mô hinh AI mới DeepSeek hoãn ra mắt

Mô hình R1 đã được áp dụng nhanh chóng và rộng rãi bởi nhiều người dùng khác nhau, bao gồm các startup tư nhân, công ty lớn và các nhóm liên kết với chính phủ. Phần lớn những người dùng này vận hành mô hình trên chip H20 của NVIDIA. Giờ đây, khi việc vận chuyển H20 bị hạn chế, điều này đã gây ra vấn đề, hạn chế cách R1 được sử dụng hiện tại và làm khó khăn việc chuẩn bị cho việc ra mắt R2.

Nếu mô hình R2 sắp tới của DeepSeek vượt trội hơn các lựa chọn mở hiện có, việc sử dụng dự kiến sẽ tăng vọt vượt quá khả năng xử lý của các nền tảng cloud Trung Quốc, theo các nhân viên tại những công ty đó được The Information trích dẫn. Hầu hết các tổ chức dựa vào mô hình R1 trước đó được cho là vận hành nó bằng chip H20 của NVIDIA, hiện đang khan hiếm.

Chính phủ Mỹ đã hạn chế việc bán chip H20 của NVIDIA để huấn luyện và suy luận AI vào giữa tháng 4. Mặc dù H20 là phiên bản bị cắt giảm nghiêm trọng của GPU H100 phổ biến, do sự phụ thuộc của các công ty AI Trung Quốc vào hệ sinh thái phần mềm CUDA của NVIDIA, H20 vẫn là sản phẩm khá được ưa chuộng trong số các công ty tại Trung Quốc, khi NVIDIA bán hàng tỷ USD chip H20 mỗi quý.

Tưởng đã thoát phụ thuộc vào NVIDIA, hóa ra DeepSeek vẫn không thể ra mắt mô hình AI mới khi thiếu chip- Ảnh 2.

Phần mềm AI của DeepSeek được báo cáo là được tối ưu hóa cho phần cứng của NVIDIA, điều này khiến công ty đặc biệt dễ bị tổn thương trước các quyết định chính sách của Mỹ. Mặc dù công ty tuyên bố đã phát triển các mô hình của mình bằng cách sử dụng ít tài nguyên hơn nhiều so với các công ty Mỹ như OpenAI, các lệnh cấm xuất khẩu gần đây làm nổi bật một điểm yếu quan trọng: các công ty AI hàng đầu của Trung Quốc vẫn phụ thuộc rất nhiều vào phần cứng của Mỹ.

Tình trạng thiếu hụt chip H20 hiện tại không chỉ ảnh hưởng đến khả năng sử dụng mô hình R1 mà còn tạo ra những rào cản đáng kể cho việc phát triển và triển khai R2. Việc này cho thấy mức độ phụ thuộc nghiêm trọng của ngành AI Trung Quốc vào công nghệ phần cứng từ Mỹ, đặc biệt là các sản phẩm của NVIDIA.

Sự trì hoãn của mô hình R2 phản ánh tác động thực tế của các biện pháp hạn chế xuất khẩu mà Washington đã áp đặt nhằm làm chậm sự phát triển AI của Trung Quốc. Đối với DeepSeek, một công ty từng được ca ngợi vì khả năng tạo ra các mô hình AI chất lượng cao với chi phí thấp, việc thiếu hụt nguồn cung phần cứng thiết yếu đang tạo ra những thách thức nghiêm trọng cho kế hoạch phát triển trong tương lai.

Hiện tại, DeepSeek vẫn chưa đưa ra lịch trình cụ thể cho việc ra mắt R2, và tình trạng này có thể kéo dài tùy thuộc vào việc các hạn chế xuất khẩu sẽ được dỡ bỏ khi nào và công ty có thể tìm được các giải pháp thay thế hiệu quả hay không.

Theo tomshardware

spot_img

Mới cập nhật

Nổi bật