KhoGameHub – Diễn đàn Công Nghệ & Gaming, nơi chia sẻ trò chơi PC, Console, Retro online và phần mềm hữu ích

#2857211 - 01/12/2025 12:00:00

Một startup AI vừa rời khỏi chế độ stealth và lập tức gây chú ý bằng tuyên bố mạnh mẽ về hiệu năng của agent

OpenAGI, một công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo, hôm nay công bố công chúng về một agent mà họ mô tả là có khả năng vượt trội so với các hệ thống do OpenAI và Anthropic phát triển. Công ty cho biết agent của họ đạt kết quả cao trên một loạt bài kiểm tra nội bộ và thử nghiệm thực tế, đồng thời nhấn mạnh điểm mạnh ở chi phí vận hành và khả năng tùy biến cho doanh nghiệp.

OpenAGI tuyên bố 'đè bẹp' OpenAI và Anthropic khi ra mắt công khai

Chi tiết về tuyên bố và nguồn dữ liệu

Theo thông tin ban đầu, OpenAGI công bố các bảng so sánh do đội ngũ nội bộ thực hiện, trong đó agent của họ ghi điểm tốt hơn ở các tác vụ đa bước, xử lý ngôn ngữ tự nhiên và quản lý công việc đa nhiệm. Công ty không công bố toàn bộ dữ liệu thô trong lần ra mắt đầu tiên, nhưng khẳng định đã sử dụng bộ dữ liệu benchmark nội bộ kết hợp với các kịch bản thực tế từ khách hàng thử nghiệm.

Trong báo cáo công khai, OpenAGI cũng nhắc đến các cải tiến kiến trúc và tối ưu hóa về chi phí tính toán, cho phép agent hoạt động hiệu quả hơn trên phần cứng phổ biến và giảm phí dịch vụ theo phút xử lý so với một số đối thủ. Tuy nhiên, các chuyên gia trong ngành thường cảnh báo rằng kết quả do bên phát triển công bố cần được đánh giá độc lập để loại trừ rủi ro thiên vị trong thiết kế thử nghiệm.

Phản ứng của cộng đồng và những câu hỏi còn bỏ ngỏ

Thông điệp "crushes OpenAI and Anthropic" (đè bẹp OpenAI và Anthropic) nhanh chóng thu hút sự chú ý trên mạng xã hội và trong giới chuyên gia. Một số nhà nghiên cứu hoan nghênh sự xuất hiện của đối thủ mới, cho rằng cạnh tranh có thể thúc đẩy đổi mới. Số khác tỏ ra thận trọng, yêu cầu minh bạch hơn về phương pháp thử nghiệm, kích thước mô hình, dữ liệu huấn luyện và kiểm chứng bên thứ ba.

Vẫn còn các câu hỏi lớn: agent có thực sự an toàn trong các kịch bản sản xuất? Các tuyên bố về chi phí và hiệu năng có giữ vững khi thử nghiệm độc lập? Liệu OpenAGI có dự định công bố mã nguồn hoặc các benchmark chung để cộng đồng kiểm tra?

Ý nghĩa thị trường và hướng đi tiếp theo

Nếu các kết quả được xác thực, OpenAGI có thể trở thành một nhân tố quan trọng trong cuộc đua AI, đặc biệt ở phân khúc doanh nghiệp cần agent tùy biến với chi phí hợp lý. Tuy nhiên, con đường từ tuyên bố ấn tượng đến việc giành thị phần và niềm tin người dùng còn dài—bao gồm các bài kiểm tra an toàn, tính minh bạch và tuân thủ quy định.

OpenAGI cho biết sẽ công bố thêm dữ liệu kiểm tra, mở rộng bản demo cho cộng đồng và làm việc với các đối tác đánh giá độc lập trong thời gian tới. Báo chí và nhà nghiên cứu được khuyến nghị theo dõi các đợt cập nhật chính thức để có cơ sở đánh giá toàn diện hơn.

Đọc thêm:

KhoGameHub – Diễn đàn Công Nghệ & Gaming, nơi chia sẻ trò chơi PC, Console, Retro online và phần mềm hữu ích

OpenAGI tuyên bố 'đè bẹp' OpenAI và Anthropic khi ra mắt công khai