OpenAI vừa cho ra mắt GPT-4o mini, một mô hình trí tuệ nhân tạo (AI) mới có kích thước nhỏ gọn. Theo thông tin từ OpenAI, GPT-4o mini có chi phí thấp hơn và vận hành hiệu quả hơn so với các mô hình AI hiện đại khác, hiện đã được cung cấp cho các nhà phát triển và người dùng qua ứng dụng web và di động , dự kiến sẽ đến tay người dùng doanh nghiệp vào tuần tới.
Theo thông tin từ OpenAI, GPT-4o mini có những ưu điểm nổi bật hơn so với các mô hình AI nhỏ hàng đầu hiện tại trong các nhiệm vụ liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được nâng cấp, chúng trở nên thu hút hơn đối với các lập trình viên nhờ vào tốc độ nhanh chóng và hiệu quả về chi phí so với những mô hình lớn hơn như GPT-4 Omni hay Claude 3.5 Sonnet. Những mô hình này là lựa chọn lý tưởng cho những tác vụ đơn giản và khối lượng lớn mà lập trình viên thường yêu cầu mô hình AI thực hiện nhiều lần.
GPT-4o mini sẽ thay thế GPT-3.5 Turbo để trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Theo OpenAI, GPT-4o mini đã đạt điểm 82% trên MMLU, một tiêu chuẩn dùng để đánh giá khả năng lý luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku (dữ liệu từ Artificial Analysis). Trong lĩnh vực toán học, đo lường bằng MGSM, GPT-4o mini cũng đạt được 87%, vượt trội hơn so với 78% của Flash và 72% của Haiku.
Bên cạnh đó, OpenAI cho biết rằng chi phí vận hành GPT-4o mini tiết kiệm hơn đáng kể so với các mô hình tiên phong trước đây, và giảm tới 60% so với GPT-3.5 Turbo. Hiện nay, GPT-4o mini hỗ trợ xử lý cả văn bản và hình ảnh thông qua API, và trong tương lai, OpenAI dự kiến sẽ bổ sung thêm khả năng xử lý video và âm thanh cho mô hình này.
“Để mọi ngóc ngách trên thế giới được AI hỗ trợ, chúng ta cần phải làm cho các mô hình trở nên dễ tiếp cận hơn nhiều”, Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự lớn theo hướng đó”.
Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, tương đương với độ dài của một cuốn sách, và được cập nhật dữ liệu đến tháng 10/2023.
OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó tương đương với các mô hình AI nhỏ khác như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, dựa trên các bài kiểm tra trước khi ra mắt trên LMSYS.org, một nền tảng thi đấu chatbot, OpenAI tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.
“So với các mô hình tương đương, GPT-4o mini hoạt động rất nhanh, với tốc độ xuất ra trung bình 202 token mỗi giây”, George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. “Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, đây là lựa chọn hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng dành cho người tiêu dùng và các cách tiếp cận mới mẻ để sử dụng mô hình ngôn ngữ lớn (LLM)”.