Ba tập đoàn công nghệ hàng đầu Trung Quốc – ByteDance, Alibaba và Tencent – đã chi hàng tỷ USD để tích trữ chip trí tuệ nhân tạo H20 của Nvidia trước khi chính quyền Mỹ chính thức siết chặt kiểm soát xuất khẩu dòng chip này vào tháng 4, theo thông tin từ Nikkei Asia.
GPU H20 là dòng chip do Nvidia phát triển riêng cho thị trường Trung Quốc nhằm tuân thủ các quy định xuất khẩu của Washington, vốn cấm bán những công nghệ AI tiên tiến cho Bắc Kinh vì lo ngại rủi ro an ninh quốc gia. Tuy nhiên, trước khả năng Mỹ có thể mở rộng lệnh cấm sang cả dòng chip “phiên bản nhẹ” như H20, các tập đoàn công nghệ Trung Quốc đã chủ động chuẩn bị từ năm ngoái.

Theo Nikkei Asia, ByteDance, Alibaba và Tencent đã yêu cầu Nvidia vận chuyển tổng cộng khoảng 1 triệu đơn vị GPU H20 – tương đương với nguồn cung cả năm – càng sớm càng tốt, lý tưởng là trước cuối tháng 5/2025. Tuy nhiên, kế hoạch này gặp trở ngại khi vào đầu tháng 4, chính quyền Mỹ bất ngờ thông báo rằng việc xuất khẩu H20 cũng sẽ cần giấy phép, khiến lượng chip thực tế được chuyển giao thấp hơn kỳ vọng.
Một nguồn tin khác tiết lộ rằng tổng giá trị đơn hàng gấp này vượt quá 12 tỷ USD, và một phần đáng kể trong số đó – ước tính lên tới hàng tỷ USD – đã được vận chuyển trước thời điểm các hạn chế mới có hiệu lực.
ByteDance được cho là công ty hành động quyết liệt nhất trong đợt tích trữ lần này. “Họ nỗ lực thu mua càng nhiều GPU càng tốt trong thời gian ngắn”, một người am hiểu nội bộ cho biết.
Động thái tích trữ chip của các công ty công nghệ Trung Quốc diễn ra trong bối cảnh nhu cầu về sức mạnh tính toán AI tại quốc gia này đang bùng nổ. Sự ra mắt của mô hình ngôn ngữ lớn (LLM) DeepSeek vào đầu năm nay được cho là chất xúc tác mạnh mẽ cho xu hướng này.
Từ tháng 2, Tencent đã bắt đầu tích hợp DeepSeek vào hệ sinh thái WeChat – siêu ứng dụng có hàng tỷ người dùng. Điều này khiến nhu cầu xử lý dữ liệu và đào tạo mô hình AI tăng mạnh, đòi hỏi nguồn cung lớn các GPU hiệu năng cao như H20.
“Việc Mỹ hạn chế chip H20 không khiến chúng tôi bất ngờ vì toàn ngành đã dự đoán trước được điều này”, một giám đốc điều hành giấu tên tại một công ty công nghệ lớn Trung Quốc chia sẻ với Nikkei Asia. “Tất cả các ông lớn công nghệ đều tranh thủ gom chip trước. Khi H20 chưa bị cấm, với hiệu suất ấn tượng của nó, thì đây là quyết định chiến lược hợp lý”.
Bên cạnh việc tăng tốc gom hàng trong nước, nhiều công ty Trung Quốc còn tìm cách mua chip Nvidia từ các thị trường quốc tế, nơi chưa bị áp đặt kiểm soát xuất khẩu từ Mỹ. Một số chiến lược được xem xét bao gồm thành lập công ty con hoặc chi nhánh tại nước ngoài, cũng như hợp tác với các đối tác quốc tế – đặc biệt là các nhà khai thác viễn thông.
“Các khách hàng Trung Quốc vẫn bình tĩnh đối mặt với thay đổi,” một giám đốc điều hành của nhà cung cấp linh kiện cho ByteDance và Alibaba Cloud cho biết sau các cuộc họp gần đây với hai tập đoàn này. “Họ đã chuẩn bị từ trước và vẫn kiên định với mục tiêu xây dựng thêm các trung tâm dữ liệu trong năm nay.”
Alibaba hiện đang vận hành các trung tâm dữ liệu tại 13 quốc gia, bao gồm hai trung tâm tại Mỹ. Trong khi đó, ByteDance sở hữu hệ thống trung tâm dữ liệu trải rộng khắp Đông Nam Á và châu Âu, với các cơ sở chính tại Ireland và Na Uy.
Động thái này cho thấy tham vọng không chỉ đáp ứng nhu cầu tính toán trong nước mà còn xây dựng năng lực lưu trữ và xử lý dữ liệu toàn cầu, đồng thời tạo “vành đai công nghệ” để đối phó với các rào cản địa chính trị và thương mại.
Trong khi đó, các “ông lớn” trung tâm dữ liệu tại Trung Quốc đang đẩy mạnh thử nghiệm và xác minh các nền tảng GPU nội địa nhằm giảm phụ thuộc vào công nghệ Mỹ. Theo nhiều nguồn tin trong ngành, dòng GPU Ascend của Huawei đang được thúc đẩy triển khai ở quy mô lớn hơn.
Vào đầu tháng 4, Huawei đã giới thiệu giải pháp điện toán AI thế hệ mới mang tên CloudMatrix 384, hệ thống kết nối đồng thời 384 chip Ascend do Huawei tự phát triển. Mục tiêu của công nghệ này là cạnh tranh trực tiếp với Nvidia GB200 NVL72, một trong những nền tảng AI hiệu năng cao nhất hiện nay.
H20 là sản phẩm bị “hạ cấp hai lần” từ dòng GPU H100 đình đám của Nvidia – vốn được tung ra thị trường toàn cầu vào quý III/2022. Để phù hợp với các quy định xuất khẩu được thắt chặt bởi chính phủ Mỹ, Nvidia đã giới thiệu H800 – phiên bản giảm hiệu năng dành riêng cho Trung Quốc. Tuy nhiên, đến cuối năm 2023, Washington tiếp tục siết kiểm soát, buộc Nvidia phải tung ra H20 với hiệu năng giới hạn hơn nữa.
Được ra mắt vào nửa đầu năm 2024, H20 chỉ sở hữu khoảng 10% hiệu suất tính toán để đào tạo mô hình AI so với H100, và 20% khả năng suy luận – quá trình ứng dụng mô hình AI đã được huấn luyện để đưa ra dự đoán hoặc phản hồi. Dù bị giới hạn nghiêm trọng về sức mạnh, H20 vẫn là một trong những dòng chip AI phổ biến nhất tại Trung Quốc, nhờ vào sự khan hiếm nguồn cung và nhu cầu ngày càng cao.
Chuyên gia trong ngành nhận định: “H20 không phải là lựa chọn lý tưởng, nhưng là lựa chọn tốt nhất trong bối cảnh bị hạn chế. Nó giúp các công ty Trung Quốc duy trì năng lực AI trong khi chờ đợi GPU nội địa đủ mạnh thay thế.”
Eugene Lee, kỹ sư AI tại Hồng Kông, nhận định GPU H20 của Nvidia tuy mang danh GPU đào tạo nhưng thực chất được thiết kế tối ưu cho suy luận, không đạt hiệu suất cao như các dòng H100 và H800. Theo ông, trong trường hợp nguồn cung H20 gián đoạn, các mô hình AI vừa và nhỏ vẫn có thể vận hành nhờ giải pháp trong nước hoặc nền tảng đám mây. Tuy nhiên, việc triển khai và tinh chỉnh các mô hình lớn sẽ gặp nhiều hạn chế.
Lee cho biết thêm, phần lớn các mô hình AI quy mô lớn hiện nay vẫn phụ thuộc vào H100 và H800 đã được mua từ trước, vốn cũng là nền tảng chính của các dịch vụ suy luận do các nhà cung cấp đám mây lớn triển khai.
“Nếu lượng GPU H100 và H800 hiện có bị cạn kiệt, điều này sẽ gây trở ngại lớn cho việc đào tạo các mô hình tiên tiến và phát triển các hệ thống AI thế hệ tiếp theo, từ đó ảnh hưởng nghiêm trọng đến năng lực cạnh tranh của Trung Quốc trong lĩnh vực AI cao cấp,” Lee cảnh báo.
Nvidia cũng cho rằng các biện pháp hạn chế đối với H20 có thể tạo cơ hội cho các đối thủ, khi khách hàng tại Trung Quốc bắt đầu tìm đến các giải pháp thay thế nội địa hoặc từ các thị trường khác. Ngày 15/4, công ty cho biết họ dự kiến thiệt hại 5,5 tỷ USD trong quý vì các quy định mới.

Theo báo cáo tài chính kết thúc ngày 26/1, Trung Quốc đóng góp 13,1% vào tổng doanh thu của Nvidia, giảm so với mức gần 17% của năm trước đó. Trong khi đó, tỷ trọng doanh thu từ Singapore tăng lên 18% từ mức 11,2%. Tuy nhiên, Nvidia lưu ý rằng phần lớn khách hàng sử dụng Singapore như một trung tâm thanh toán, dù hàng hóa thực tế được chuyển đến các quốc gia khác. Xét theo địa điểm giao hàng thực tế, Singapore chỉ chiếm chưa đầy 2% doanh thu của hãng trong cùng kỳ.
Tham khảo Nikkei Asia