Robin Li, nhà sáng lập Baidu, công khai nhận định nhu cầu đối với các mô hình AI tạo sinh chỉ xử lý văn bản như DeepSeek đang thu hẹp, trong khi thị trường chuyển dịch mạnh sang các mô hình đa phương tiện tích hợp xử lý văn bản, hình ảnh, âm thanh và video.
Tại hội nghị phát triển AI ở Vũ Hán, Baidu công bố hai mô hình mới: Ernie 4.5 Turbo và X1 Turbo, nổi bật với khả năng suy luận logic vượt trội, đa phương thức và chi phí thấp hơn đáng kể so với DeepSeek.
Robin Li chỉ ra các điểm yếu của DeepSeek: chỉ hỗ trợ văn bản, tỷ lệ ảo giác cao, tốc độ phản hồi chậm, chi phí sử dụng cao, khó ứng dụng trong các lĩnh vực rủi ro như tài chính, y tế và thương mại điện tử.
DeepSeek từng gây tiếng vang lớn tại Trung Quốc với mô hình R1 ra mắt tháng 1/2025, thu hút 125 triệu người dùng chỉ sau 1 tuần, nhưng hiện đối mặt cạnh tranh gay gắt từ Baidu, Alibaba (Qwen), ByteDance (Doubao), Tencent (Yuanbao) và nhiều startup AI khác.
Baidu đã tích hợp DeepSeek vào các sản phẩm như Qianfan, bản đồ, tìm kiếm, nhưng song song đó chủ động phát triển và mở nguồn mô hình riêng, giảm chi phí cho doanh nghiệp và nhà phát triển.
Baidu triển khai cụm máy chủ 30.000 chip Kunlun P800 để hỗ trợ huấn luyện và vận hành mô hình AI, khẳng định không thiếu tài nguyên tính toán cho phát triển AI quy mô lớn.
Giá sử dụng Ernie X1 Turbo chỉ 0,14 USD/1 triệu tokens đầu vào và 0,55 USD/1 triệu tokens đầu ra; Ernie 4.5 Turbo còn rẻ hơn, lần lượt 0,11 USD và 0,44 USD/1 triệu tokens, chỉ bằng 25% giá DeepSeek R1.
DeepSeek vẫn tiếp tục phát triển các phiên bản mới như R2, V4, nhưng bị đánh giá là chưa bắt kịp xu hướng đa phương thức và ứng dụng thực tiễn.
Baidu ra mắt ứng dụng AI agent Xinxiang, cạnh tranh trực tiếp với Quark của Alibaba và Manus AI, đẩy mạnh ứng dụng AI vào các lĩnh vực pháp lý, du lịch, phân tích tri thức.
Cổ phiếu Baidu tăng hơn 4% sau các công bố mới, cho thấy thị trường đánh giá cao chiến lược chuyển hướng sang AI đa phương tiện và mở rộng ứng dụng.
Continue reading...
Bài viết liên quan