Công Bố Các Mô Hình AI Tư Duy Mới: OpenAI Gây Chấn Động Với O3 Và O3-Mini
OpenAI đã tạo ra bước đột phá với việc công bố mô hình AI tư duy mới mang tên o3 và o3-mini, đặt nền móng cho tương lai của trí tuệ nhân tạo.
Vào thứ Sáu, trong sự kiện "12 ngày OpenAI", CEO Sam Altman đã tiết lộ các mô hình "tư duy" AI mới nhất của công ty, o3 và o3-mini. Những mô hình này xây dựng dựa trên các phiên bản o1 đã được giới thiệu đầu năm nay. Trong khi chúng chưa được phát hành rộng rãi, OpenAI sẽ cung cấp các mô hình này cho thử nghiệm nghiên cứu và an ninh công cộng từ hôm nay.
Tận dụng phương pháp "chuỗi tư duy riêng", mô hình này tạm dừng để kiểm tra đối thoại nội bộ và lên kế hoạch trước khi đưa ra phản hồi, một dạng "tư duy mô phỏng" (SR) vượt ra ngoài các mô hình ngôn ngữ lớn cơ bản truyền thống.
O3 đã ghi dấu ấn với điểm số kỷ lục trên điểm chuẩn ARC-AGI - một chuẩn mực về lý luận trực quan ra đời từ năm 2019. Ở môi trường tính toán thấp, o3 đạt 75.7%, còn khi thử nghiệm với tính toán cao, mô hình này đạt đến 87.5% - một mức hiệu suất tương đương với con người.
Bên cạnh đó, báo cáo từ OpenAI cho biết o3 đạt 96.7% trong kỳ thi American Invitational Mathematics 2024, chỉ sai một câu hỏi. O3 cũng đạt 87.7% trên GPQA Diamond, với các câu hỏi trình độ sinh học, vật lý, hóa học tốt nghiệp. Trên điểm chuẩn Toán học Tiên phong từ EpochAI, o3 đã giải quyết được 25.2% các bài toán, trong khi không có mô hình nào khác vượt quá 2%.
Trong buổi phát trực tiếp, giám đốc Quỹ Giải thưởng ARC chia sẻ: "Khi tôi thấy những kết quả này, tôi cần phải thay đổi cách nhìn nhận về khả năng của AI."
Phiên bản o3-mini cũng được công bố cùng ngày, với tính năng thời gian suy nghĩ thích ứng, cung cấp ba mức tốc độ xử lý: thấp, trung bình, và cao. OpenAI báo cáo rằng khi sử dụng mức độ tính toán cao hơn, o3-mini cho kết quả vượt trội hơn so với tiền thân của nó, o1, trên điểm chuẩn Codeforces.
Công bố của OpenAI diễn ra trong bối cảnh nhiều công ty khác cũng đang phát triển các mô hình SR riêng, bao gồm Google với Gemini 2.0 Flash Thinking Experimental và DeepSeek với DeepSeek-R1. Những mô hình này dựa trên mô hình ngôn ngữ lớn truyền thống nhưng được tinh chỉnh để sản sinh quá trình chuỗi tư duy có khả năng tự đánh giá kết quả của mình, thay đổi đáng kể cách mà AI hoạt động trong khi hoạt động thay vì chỉ tập trung vào việc cải thiện trong quá trình huấn luyện.
OpenAI sẽ cung cấp các mô hình SR mới này trước tiên cho các nhà nghiên cứu an ninh để thử nghiệm. Altman cho biết công ty dự kiến sẽ ra mắt o3-mini vào cuối tháng Giêng, với mô hình o3 sẽ được phát hành sau đó không lâu.
Với các bước tiến đột phá từ OpenAI, tương lai của trí tuệ nhân tạo hứa hẹn sẽ trở nên sinh động và mạnh mẽ hơn bao giờ hết, mở ra nhiều cơ hội và thách thức mới trong lĩnh vực này.