Cả Trung Quốc đang phấn khích trước thành công của startup AI nội địa DeepSeek, khi mô hình AI mới nhất của công ty này khiến Thung lũng Silicon và Phố Wall chấn động. Trên mạng xã hội Weibo, hàng loạt hashtag như “DeepSeek làm chao đảo chứng khoán Mỹ chỉ sau một đêm” hay “DeepSeek khiến Meta hoảng loạn” trở thành xu hướng, thu hút hàng chục triệu lượt xem.
Sự bùng nổ của DeepSeek đã đẩy ứng dụng này lên đứng đầu bảng xếp hạng quốc tế, thậm chí vượt mặt ChatGPT của OpenAI vào ngày 20/1. Người sáng lập DeepSeek, Liang Wenfeng, cũng được ca ngợi là một “nhà tiên phong công nghệ” có thể giúp Trung Quốc bước vào kỷ nguyên đổi mới sáng tạo ngang hàng với Thung lũng Silicon.
Liang Wenfeng, một kỹ sư trở thành doanh nhân, nổi tiếng với việc chỉ tuyển dụng nhân tài trong nước và giữ các mô hình AI của mình ở dạng mã nguồn mở, cho phép các công ty và người dùng khác thử nghiệm và phát triển dựa trên nền tảng của DeepSeek. Ông là đồng sáng lập quỹ đầu tư định lượng High-Flyer Quant và thành lập DeepSeek vào năm 2023. Mô hình AI mới nhất của DeepSeek – DeepSeek R1 – được công bố vào ngày 20/1 và nhanh chóng đạt hiệu suất tiệm cận với các đối thủ lớn như GPT-4 của OpenAI, Llama của Meta và Gemini của Google, nhưng chi phí huấn luyện chỉ dưới 6 triệu USD – một con số cực kỳ thấp so với các ông lớn AI của Mỹ.
Sự thành công của DeepSeek khiến nhiều nhân vật tầm cỡ phải lên tiếng. Nhà đầu tư công nghệ nổi tiếng Marc Andreessen gọi đây là “khoảnh khắc Sputnik” – ám chỉ bước ngoặt công nghệ đột phá. Tổng thống Mỹ Donald Trump cũng nhận định DeepSeek là “hồi chuông cảnh tỉnh” cho nước Mỹ trong cuộc đua AI với Trung Quốc. Giới chức Mỹ lo ngại rằng AI sẽ trở thành chiến trường công nghệ quan trọng giữa hai cường quốc, đặc biệt khi Washington đã siết chặt lệnh cấm xuất khẩu chip cao cấp nhằm kìm hãm sự phát triển của AI Trung Quốc.
Dù vậy, một số chuyên gia cho rằng cần thêm thông tin để xác thực tuyên bố của DeepSeek, nhất là về chi phí phát triển thấp đáng kinh ngạc.
Nhưng với nhiều người Trung Quốc, sự vươn lên của DeepSeek là một bước tiến quan trọng, thể hiện sự tự chủ công nghệ của đất nước. Trên Weibo, một người dùng hào hứng bình luận: “Dù các ông lớn có mạnh đến đâu, họ cũng có thể bị lật đổ chỉ sau một đêm.” Một bình luận khác ca ngợi Liang Wenfeng là “người mang vận mệnh quốc gia”.
Người đàn ông muốn ‘thay đổi luật chơi’
Liang Wenfeng sinh ra trong một gia đình giáo viên tiểu học ở tỉnh Quảng Đông vào những năm 1980. Ông theo học ngành kỹ thuật thông tin và điện tử tại Đại học Chiết Giang – một trong những trường danh giá nhất Trung Quốc.
Theo truyền thông nhà nước Trung Quốc, những người từng làm việc cùng Liang nhớ về ông như một người có phần “mọt sách” với kiểu tóc không mấy chỉn chu. Dù vậy, ông luôn nhắc đến tham vọng huấn luyện các mô hình AI khổng lồ và “thay đổi luật chơi” trong ngành. Tuy nhiên, ít ai thực sự tin vào những lời nói đó, bởi lúc bấy giờ, chỉ những gã khổng lồ công nghệ như ByteDance hay Alibaba mới đủ nguồn lực để thực hiện tham vọng AI tầm cỡ.
Năm 2015, Liang đồng sáng lập High-Flyer Quant – một quỹ đầu tư ứng dụng AI và học máy vào giao dịch tài chính. Công ty này cũng xây dựng một siêu máy tính AI có quy mô ngang một sân bóng rổ, trở thành một trong những hệ thống điện toán mạnh nhất Trung Quốc, dù không thuộc sở hữu của các ông lớn công nghệ.
Đến năm 2023, Liang sáng lập DeepSeek với mục tiêu phát triển AI tổng quát (AGI) và thay đổi văn hóa đổi mới sáng tạo của Trung Quốc. Trong một cuộc phỏng vấn hiếm hoi với 36Kr vào tháng 7/2023, Liang thẳng thắn chia sẻ: “Chúng ta hay nói rằng Trung Quốc đi sau Mỹ một, hai năm, nhưng khoảng cách thực sự là giữa sáng tạo và sao chép. Nếu điều này không thay đổi, Trung Quốc sẽ mãi là kẻ theo sau.”
Vươn lên bất chấp hạn chế công nghệ
Trong cuộc phỏng vấn với 36Kr, Liang thừa nhận rằng thách thức lớn nhất của DeepSeek không phải là vốn đầu tư mà là lệnh cấm xuất khẩu “chip cao cấp” từ Mỹ. Tuy nhiên, ông vẫn lạc quan về khả năng cạnh tranh của Trung Quốc trong lĩnh vực AI: “Khi xã hội cho phép những nhà đổi mới thực thụ thành công, tư duy tập thể sẽ thay đổi. Chúng ta chỉ cần nhiều ví dụ thực tế hơn.”
DeepSeek hiện có văn phòng tại Bắc Kinh và Hàng Châu, với một đội ngũ khiêm tốn gồm chưa đến 140 nhà nghiên cứu và kỹ sư – một con số rất nhỏ so với các tập đoàn AI lớn ở Trung Quốc và Mỹ. Liang cho biết ông ưu tiên tuyển dụng nhân tài trong nước, chủ yếu là sinh viên xuất sắc và tiến sĩ từ các đại học hàng đầu Trung Quốc.
“Có thể 50 nhân tài AI giỏi nhất không nằm ở Trung Quốc, nhưng chúng tôi có thể tự tạo ra những người như vậy,” Liang chia sẻ. Ông tin rằng đổi mới sáng tạo bắt nguồn từ sự tự tin, và sự tự tin này thường mạnh mẽ nhất ở những người trẻ tuổi.
Cựu nhân viên DeepSeek, Zihan Wang, hiện đang học tại Mỹ, cũng nhận xét rằng công ty mang lại “đặc quyền mà hiếm công ty nào dành cho sinh viên mới tốt nghiệp” – đó là quyền truy cập vào tài nguyên máy tính dồi dào và sự tự do thử nghiệm.
Trên trang tuyển dụng chính thức, DeepSeek đang tìm kiếm các kỹ sư học sâu (deep learning), nhà nghiên cứu AI và nhà thiết kế giao diện người dùng. Những vị trí kỹ sư cao cấp có mức lương lên đến 90.000 nhân dân tệ (khoảng 12.400 USD) mỗi tháng – thấp hơn nhiều so với mức lương của các kỹ sư phần mềm tại Google.
Một bài đăng trên tài khoản WeChat chính thức của DeepSeek khẳng định triết lý của công ty: “Chúng tôi không làm những điều tầm thường, mà sẽ theo đuổi những câu hỏi lớn nhất với sự tò mò và tầm nhìn xa.”