spot_img
20 C
Hanoi
spot_img
Trang chủTài ChínhCông ty tí hon gây chấn động thế giới, chứng minh một...

Công ty tí hon gây chấn động thế giới, chứng minh một công nghệ không phải 'chỉ nước Mỹ mới có thể làm được'

Trung Quốc dường như đã bắt kịp Mỹ trong lĩnh vực AI đúng vào thời điểm mà nhiều chuyên gia trong ngành tuyên bố rằng họ đang trên bờ vực của một bước đột phá mang tính lịch sử.
Công ty tí hon gây chấn động thế giới, chứng minh một công nghệ không phải 'chỉ nước Mỹ mới có thể làm được'- Ảnh 1.

Vào thứ hai tuần này, thế giới đã chứng kiến 1.000 tỷ USD bị cuốn bay khỏi thị trường chứng khoán chỉ trong một ngày. Đây được ví như “đống lửa khổng lồ” được nhóm lên bởi DeepSeek – một công ty khởi nghiệp trí tuệ nhân tạo (AI) ít được biết đến của Trung Quốc.

Việc phát hành mô hình AI mới, có tên là R1, đã làm lung lay những giả định về sự thống trị của Mỹ trong lĩnh vực AI và làm dấy lên viễn cảnh rằng một số người ở Trung Quốc đang học cách đánh bại Thung lũng Silicon ngay trên sân nhà của họ.

Mô hình này có khả năng “lý luận” để giải quyết các vấn đề khoa học phức tạp và hoạt động ngang tầm với các phần mềm tiên tiến từ các gã khổng lồ công nghệ của Mỹ. Quan trọng hơn, R1 làm được tất cả những điều đó nhưng được phát triển với chi phí chỉ bằng một phần nhỏ so với các mô hình tương tự.

Sau đó, R1 đã nhanh chóng đánh bật ChatGPT của OpenAI để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên cửa hàng iOS của Mỹ.

Bên cạnh thách thức địa chính trị, bước đột phá của DeepSeek còn có hai tác động đối với ngành công nghiệp công nghệ. Thứ nhất, nó có khả năng thúc đẩy sự phát triển thương mại và việc áp dụng AI, tương tự như cách mà ChatGPT đã làm vào năm 2022.

Đồng thời, điều này đe dọa phá vỡ các giả định đầu tư vốn đã là nền tảng của toàn bộ thị trường chứng khoán Mỹ, khi dường như cho thấy rằng việc phát triển các mô hình AI tiên tiến không nhất thiết phải đòi hỏi cơ sở hạ tầng khổng lồ và vốn đầu tư khổng lồ.

Câu hỏi đang được đặt ra một cách cấp bách từ California đến Phố Wall: Liệu Trung Quốc đã bắt kịp Mỹ trong lĩnh vực AI đúng vào thời điểm mà nhiều chuyên gia trong ngành tuyên bố rằng họ đang trên bờ vực của một bước đột phá mang tính lịch sử: Đưa máy móc lên ngang tầm trí tuệ con người, một ngưỡng được gọi là trí tuệ nhân tạo tổng quát (AGI – Artificial General Intelligence)?

“Những đổi mới thuật toán của DeepSeek nhắc nhở chúng ta rằng Trung Quốc và Mỹ đang ngang ngửa nhau, và lợi thế công nghệ của chúng ta không được đảm bảo, điều này thúc đẩy ngành công nghiệp phải làm cho AI trở nên hiệu quả hơn”, Eric Schmidt, cựu CEO và Chủ tịch của Google, cho biết.

“Để đạt được AGI trước tiên, chúng ta cần tiếp tục đầu tư vào nhân tài, hỗ trợ hệ sinh thái mã nguồn mở sôi động của mình, và đảm bảo rằng chúng ta đổi mới vượt trội, chứ không chỉ đơn thuần chi tiêu nhiều hơn đối thủ”.

DeepSeek được thành lập với tham vọng ở tầm cỡ Thung lũng Silicon. Công ty khởi đầu vào năm 2023 như một dự án bên lề của tỷ phú quỹ đầu cơ lập dị Liang Wenfeng, đúng vào thời điểm cuộc đua tái tạo ChatGPT đang nóng lên. Kể từ đó, DeepSeek đã trở thành một trong những phòng thí nghiệm AI hàng đầu của Trung Quốc.

“Vì sao Thung lũng Silicon lại sáng tạo đến vậy? Vì họ dám làm những điều táo bạo”, Liang nói trong một cuộc phỏng vấn năm ngoái. “Khi ChatGPT ra mắt, cộng đồng công nghệ Trung Quốc thiếu tự tin vào đổi mới tiên phong”.

Khi các quỹ thuộc sở hữu nhà nước ở Trung Quốc ngày càng đóng vai trò lớn hơn trong việc tài trợ cho các công ty khởi nghiệp trong những năm gần đây, hệ sinh thái khởi nghiệp đã chịu áp lực phải đảm bảo lợi nhuận, do lo ngại việc thất thoát tài sản quốc gia.

DeepSeek là một trong những công ty khởi nghiệp AI tạo sinh hiếm hoi ở Trung Quốc chưa huy động bất kỳ khoản tài trợ bên ngoài nào, và do đó, không bị ràng buộc bởi những áp lực này.

TRƯỜNG HỢP ĐỘC NHẤT

Là một phòng thí nghiệm nghiên cứu thuần túy, gợi nhớ về những ngày đầu của DeepMind ở Anh và OpenAI ở Mỹ, DeepSeek đã tập trung toàn bộ nỗ lực vào việc thúc đẩy lĩnh vực AI tiến xa hơn, thay vì tìm cách kiếm tiền. Mặc dù tự hào được thành lập hoàn toàn bởi nhân tài trong nước, công ty này lại áp dụng văn hóa làm việc thường thấy ở trung tâm công nghệ Mỹ.

“Đây là một trường hợp độc nhất trong số các công ty AI của Trung Quốc”, một nhà đầu tư AI tại Trung Quốc nhận xét. “Không có chính trị nội bộ hay xung đột quản lý như ở các tập đoàn công nghệ lớn hay các công ty khởi nghiệp khác. Mọi người không có chức danh cụ thể hay cấp bậc báo cáo”.

Nguồn gốc của DeepSeek từ một quỹ đầu cơ định lượng giúp công ty có được đội ngũ kỹ sư am hiểu sâu sắc về chip. Bước đột phá của họ nằm ở khả năng huấn luyện các mô hình AI tiên tiến mà không phải chi hàng trăm triệu USD như các đối thủ Mỹ.

Họ tuyên bố rằng bước huấn luyện cuối cùng của R1 chỉ tốn 5,6 triệu USD. Tuy nhiên, con số này không bao gồm nhiều chi phí khác liên quan đến việc phát triển mô hình, bao gồm cơ sở hạ tầng tính toán và các lần huấn luyện trước đó, khiến việc so sánh chính xác trở nên khó khăn.

DeepSeek có thể cũng đã cắt giảm một số quy trình để tiết kiệm chi phí: OpenAI tuyên bố có bằng chứng cho thấy DeepSeek đã huấn luyện mô hình của mình bằng đầu ra từ các mô hình của OpenAI – một hành vi vi phạm điều khoản sử dụng của OpenAI, mặc dù đây được cho là một thủ thuật ngầm cũng được nhiều công ty Mỹ áp dụng.

Trớ trêu thay, nỗ lực của Washington nhằm kìm hãm ngành AI của Trung Quốc bằng cách áp đặt các biện pháp kiểm soát xuất khẩu đối với chip cao cấp của Mỹ từ năm 2022 trở đi có thể đã góp phần vào bước đột phá của DeepSeek.

Không có quyền tiếp cận các con chip tiên tiến nhất, công ty buộc phải tìm ra những cách sáng tạo để tối ưu hóa hiệu suất trên các loại chip kém hiện đại hơn mà họ có thể mua được.

Công ty tí hon gây chấn động thế giới, chứng minh một công nghệ không phải 'chỉ nước Mỹ mới có thể làm được'- Ảnh 2.

Những tuyên bố của DeepSeek về chi phí thấp và khả năng tiên tiến của các mô hình AI của mình đã châm ngòi cho một cuộc tranh luận sôi nổi về mức độ gây xáo trộn của công ty này đối với ngành AI toàn cầu. Các lãnh đạo ở Thung lũng Silicon đã công nhận những đổi mới của DeepSeek, đồng thời cũng cố gắng giảm nhẹ tầm quan trọng của chúng.

CEO OpenAI, Sam Altman, gọi mô hình R1 là “ấn tượng”, trong khi Mark Zuckerberg, CEO của Meta, ghi nhận rằng công ty đã có “những tiến bộ mà chúng tôi hy vọng có thể áp dụng vào hệ thống của mình”.

Tuy nhiên, Zuckerberg cũng xem bước đột phá của DeepSeek chỉ là một trong nhiều tiến bộ trong một lĩnh vực đang phát triển với tốc độ chóng mặt, khiến khó có thể đánh giá liệu cách tiếp cận chi phí thấp của công ty này sẽ thay đổi cục diện ngành công nghiệp đến mức nào.

Theo một số chuyên gia theo dõi công nghệ Trung Quốc, những tiến bộ của DeepSeek chưa đủ để thay đổi thực tế rằng các công ty AI của Trung Quốc vẫn chủ yếu là những người theo sau nhanh chóng, phần lớn tập trung vào việc mô phỏng các đối thủ Mỹ hơn là tự định hình hướng đi cho ngành.

“Công việc của DeepSeek cũng thuộc dạng đó. Điều thực sự có thể đảo ngược thế cục trong cuộc cạnh tranh Mỹ-Trung là nếu họ tạo ra một thứ gì đó thực sự đẩy ranh giới công nghệ lên một tầm cao mới. Chúng ta sẽ chờ xem liệu họ có làm được không”, Helen Toner, nhà phân tích chính sách AI tại Trung tâm Công nghệ An ninh và Mới nổi của Georgetown, đồng thời là cựu thành viên hội đồng quản trị của OpenAI nhận xét.

Tuy nhiên, một số ý kiến khác cho rằng việc một công ty khởi nghiệp công nghệ Trung Quốc đứng sau bước tiến mới nhất gây chú ý là một dấu mốc quan trọng, làm thay đổi cục diện cuộc đua AI giữa hai quốc gia.

“Những mô hình mới nhất của DeepSeek có thể chưa có nghĩa là Trung Quốc đang vượt mặt Mỹ trong cuộc đua AI, nhưng nó chứng minh rằng các công ty Trung Quốc đang đạt được những bước tiến đáng kể trong đổi mới phần mềm, giúp giảm thiểu những hạn chế do các biện pháp kiểm soát xuất khẩu của Mỹ áp đặt”, Tilly Zhang, nhà phân tích công nghệ Trung Quốc tại Gavekal Dragonomics – một công ty nghiên cứu chuyên về Trung Quốc viết trong một báo cáo công bố tuần này.

“Cuộc đua giành vị thế dẫn đầu trong lĩnh vực AI giờ đây không còn chỉ xoay quanh việc ai sở hữu những con chip tốt nhất, mà là ai sử dụng chúng hiệu quả nhất”.

Mặc dù tầm quan trọng của những đột phá kỹ thuật của DeepSeek vẫn còn gây tranh cãi, không thể phủ nhận cú sốc lan tỏa khắp thị trường chứng khoán khi các nhà đầu tư nhận ra ý nghĩa của đổi mới cốt lõi mà công ty này mang lại: Cắt giảm đáng kể chi phí huấn luyện các mô hình AI tiên tiến nhất.

Các mô hình của DeepSeek dường như làm lung lay lập luận mà các công ty AI Mỹ đã liên tục nhấn mạnh trong năm qua: Sự phát triển của AI đòi hỏi nguồn vốn khổng lồ và cơ sở hạ tầng quy mô lớn để có thể triển khai công nghệ một cách hiệu quả.

Thay vào đó, những tiến bộ của DeepSeek cho thấy rằng các mô hình AI của Mỹ, vốn đắt đỏ hơn rất nhiều, có thể không có lợi thế khác biệt rõ ràng, làm dấy lên lo ngại trong giới đầu tư về một cú sốc giảm phát mạnh mẽ trong ngành.

“Trước đây có một niềm tin vào tính ưu việt của Mỹ – rằng chỉ có nước Mỹ mới sở hữu công nghệ này, và chỉ có người Mỹ mới có đủ tiền để làm điều đó”, Jim Tierney, nhà đầu tư cổ phiếu tăng trưởng tại AllianceBernstein nhận xét. “Việc thương mại hóa các mô hình AI đang diễn ra nhanh hơn nhiều so với những gì chúng ta từng nghĩ”.

Theo: Financial Times

spot_img

Mới cập nhật

Nổi bật