Không chỉ liên tiếp giới thiệu các mô hình AI mới làm chấn động thế giới, một startup công nghệ mới từ Trung Quốc vừa ra mắt Manus – một hệ thống được mô tả như “Tác nhân AI (AI Agent) tự động đầu tiên trên thế giới”. Sự kiện này đánh dấu một bước ngoặt mới trong cuộc đua AI giữa Trung Quốc và Mỹ, đặc biệt là khi các hệ thống Tác nhân AI này được xem như bước tiến hóa lên bậc cao hơn của chatbot AI.
Vào cuối năm 2023, việc ra mắt DeepSeek – mô hình AI Trung Quốc được thiết kế để cạnh tranh với GPT-4 của OpenAI – đã được mô tả là “khoảnh khắc Sputnik” của Trung Quốc trong lĩnh vực AI. Đó là dấu hiệu đầu tiên cho thấy các nhà nghiên cứu nước này đang thu hẹp khoảng cách về khả năng mô hình ngôn ngữ lớn (LLM).

Startup AI Manus đang gây bão trên toàn cầu
Nhưng Manus đại diện cho một điều hoàn toàn khác – nó không chỉ là một chatbot thông thường hay một công cụ tìm kiếm được cải tiến. Nó là một “agent”, một hệ thống AI suy nghĩ, lập kế hoạch và thực hiện nhiệm vụ một cách độc lập, có khả năng điều hướng thế giới thực một cách liền mạch như một thực tập sinh người nhưng với khả năng tập trung không giới hạn.
Đây là điều khiến Manus khác biệt so với các đối thủ phương Tây. Trong khi ChatGPT-4 và Gemini của Google dựa vào lời nhắc của con người để hướng dẫn, Manus không chờ đợi hướng dẫn. Thay vào đó, nó được thiết kế để chủ động bắt đầu nhiệm vụ, đánh giá thông tin mới và điều chỉnh cách tiếp cận một cách linh hoạt.

Đồng sáng lập Peak Ji Yichao giới thiệu về Manus.
Tác nhân AI – bước tiến hóa mới của chatbot AI
Có lẽ cũng hiểu được rằng, với đa số người dùng thông thường, sẽ rất khó nhận ra tác dụng của “Tác nhân AI” là gì và quan trọng đến mức nào, vì vậy, ngay trên website của Manus đã xuất hiện rất nhiều ví dụ về tiềm năng ứng dụng của công nghệ này trong thực tế. Một ví dụ được liệt kê trong số đó là phân tích cổ phiếu Tesla của ông Elon Musk và đánh giá cơ hội đầu tư.

Website của Manus liệt kê hàng loạt ứng dụng hữu ích của Manus
Thông thường để làm được việc này, nhà đầu tư phải tìm hiểu hàng loạt thông tin cơ bản về tiềm năng ngành kinh doanh mà doanh nghiệp đó đang hoạt động, vị thế của doanh nghiệp trong ngành so với các đối thủ. Ngoài ra đối với riêng doanh nghiệp đó, cũng phải tìm hiểu rất nhiều thông tin để đánh giá, bao gồm các thông tin cơ bản như xu hướng doanh thu, lợi nhuận, dòng tiền, tiềm năng tăng trưởng, điểm mạnh, điểm yếu, các yếu tố rủi ro. Ngoài ra còn các phân tích về yếu tố kỹ thuật trong đầu tư, mức hỗ trợ, kháng cự để mua bán, …
Việc tìm kiếm và tổng hợp các thông tin nói trên cần đến nhiều kỹ năng và kinh nghiệm khác nhau của nhà đầu tư hoặc nhà phân tích. Ngoài ra cũng phải mất khá nhiều thời gian để một nhà phân tích có kinh nghiệm tổng hợp thông tin và đưa ra nhận định của mình.
Thế nhưng với Manus, quá trình này có thể đơn giản hóa hơn bao giờ hết, khi người dùng chỉ cần viết yêu cầu của mình để phân tích, đánh giá một cổ phiếu nào đó – ví dụ như của hãng xe điện Tesla – một bản phân tích đánh giá chi tiết sẽ được hoàn thành chỉ trong vòng vài phút với đầy đủ các khuyến nghị về tiềm năng lợi nhuận hoặc rủi ro thiệt hại sẽ đến trong tương lai.

Chỉ bằng một câu lệnh phân tích cổ phiếu Tesla và người dùng có thể nhận được một báo cáo chi tiết
Trong một trường hợp thử nghiệm, Rowan Cheung, một nhà văn công nghệ, đã yêu cầu Manus viết tiểu sử về anh và xây dựng một trang web cá nhân. Trong vòng vài phút, agent đã quét mạng xã hội, trích xuất những điểm nổi bật trong nghề nghiệp, tạo ra một tiểu sử được định dạng gọn gàng, lập trình một trang web hoạt động và triển khai nó trực tuyến. Nó thậm chí còn khắc phục các vấn đề lưu trữ – mà không cần yêu cầu thêm đầu vào.
Sức mạnh của Manus đến từ đâu
Sức mạnh của Manus nằm ở kiến trúc đa tác nhân (multi-agent). Thay vì dựa vào một mạng nơ-ron duy nhất, Manus hoạt động như một giám đốc điều hành giám sát một nhóm các tác nhân phụ chuyên biệt. Khi được giao một nhiệm vụ phức tạp, nó chia vấn đề thành các thành phần có thể quản lý, phân công chúng cho các tác nhân thích hợp và theo dõi tiến trình của họ.

Cấu trúc này cho phép nó giải quyết quy trình công việc nhiều bước mà trước đây đòi hỏi nhiều công cụ AI được kết nối thủ công. Hoạt động không đồng bộ dựa trên đám mây của Manus là một bước đột phá khác. Các trợ lý AI truyền thống cần sự tham gia tích cực của người dùng – Manus thì không. Nó chạy các nhiệm vụ trong nền, chỉ thông báo cho người dùng khi kết quả đã sẵn sàng, giống như một nhân viên cực kỳ hiệu quả không bao giờ cần quản lý vi mô.
Cho dù OpenAI cũng đã giới thiệu tính năng tương tự có tên Deep Research trên ChatGPT cách đây không lâu, nhưng theo bài kiểm tra GAIA – một tiêu chuẩn đánh giá khả năng của các trợ lý AI tổng quát – Manus còn có điểm số cao hơn công cụ của OpenAI trên tất cả các cấp độ khó trong bài kiểm tra.
Sự xuất hiện của Manus đã gây ra một làn sóng lo ngại ở Thung lũng Silicon, nơi các nhà lãnh đạo AI đã thầm thừa nhận rằng sự phát triển mạnh mẽ của Trung Quốc vào hệ thống tự trị có thể mang lại lợi thế cho người đi đầu trong các lĩnh vực quan trọng.
Nỗi lo của họ là Manus đại diện cho “sự công nghiệp hóa trí tuệ” – một hệ thống hiệu quả đến mức các công ty sẽ sớm thấy mình buộc phải thay thế lao động con người bằng AI không phải vì sở thích, mà vì sự cần thiết. Manus không chỉ là sự cải tiến của AI hiện có – nó là “một loại trí thông minh mới”, chuyển trọng tâm từ hỗ trợ thụ động sang hành động tự chủ. Và nó được xây dựng hoàn toàn bởi Trung Quốc.
Nguyễn Hải