GPT-4.1, GPT-4.1 mini и GPT-4.1 nano хорошо справляются с программированием и выполнением инструкций. Эти мультимодальные модели обладают контекстным окном в 1 млн токенов, что позволяет им обрабатывать около 750 000 слов за один запрос (больше, чем объём «Войны и мира»). Это примерно в четыре раза превышает возможности GPT-4o.
Версии mini и nano работают быстрее и эффективнее, хотя и с небольшим снижением точности. При этом GPT-4.1 nano позиционируется как самая быстрая и экономичная модель из всех созданных OpenAI.OpenAI стремится выпускать ИИ-модели, способные разрабатывать программное обеспечение. Как заявила финансовый директор OpenAI Сара Фрайар, цель компании — разработать «автономного инженера-программиста». Будущие модели смогут самостоятельно создавать приложения «под ключ» — от написания кода до тестирования, контроля качества и подготовки документации. GPT-4.1 — шаг в этом направлении.
Модель улучшили на основе отзывов разработчиков, сделав акцент на кодировании интерфейсов, точности правок, соблюдении форматов и структуры ответов, а также стабильном использовании инструментов.
GPT-4.1 продемонстрировал результат 52-54,6% в тесте SWE-bench Verified, что значительно выше показателя GPT-4o в 33%. При этом OpenAI уступает Google и Anthropic: Gemini 2.5 Pro набрал 63,8%, а Claude 3.7 Sonnet — 62,3% в том же тесте. В другом исследовании GPT-4.1 проверили с помощью Video-MME — методики, оценивающей способность модели «понимать» видеоконтент. По заявлениям компании, GPT-4.1 достиг рекордной точности в 72% в категории «длинные видео без субтитров».
OpenAI признает, что надежность GPT-4.1 снижается по мере роста объема обрабатываемых токенов. В ходе внутреннего теста OpenAI-MRCR точность модели упала с примерно 84% при 8000 токенах до 50% при обработке 1 млн токенов. Кроме того, GPT-4.1 работает более «буквально» по сравнению с GPT-4o, что иногда требует более четких и детализированных запросов для получения оптимальных результатов.
Необычным шагом стало то, что GPT-4.1 доступна исключительно через API для разработчиков, а не в интерфейсе ChatGPT, где большинство пользователей взаимодействуют с технологиями OpenAI. Параллельно компания https://arstechnica.com/ai/2025/04/when-is-4-1-greater-than-... о постепенном отказе от GPT-4.5 Preview в API — временного решения, запущенного в феврале и получившего неоднозначные оценки. Хотя GPT-4.1 значительно превосходит GPT-4.5 Preview в тестах на программирование, последняя демонстрирует лучшие результаты в академических знаниях, следовании инструкциям и задачах, связанных с обработкой изображений. Возникает вопрос: зачем заменять, казалось бы, более универсальную модель.
OpenAI объясняет это экономической целесообразностью: GPT-4.1 обеспечивает сопоставимую производительность при значительно меньших затратах и задержках, тогда как GPT-4.5 остается ресурсоемким и дорогим решением.
GPT-4.1 стоит $2 за миллион входных и $8 за миллион выходных токенов, что на 26% выгоднее, чем GPT-4o для обычных запросов. GPT-4.1 mini: $0,40 (ввод), $1,60 (вывод) за миллион токенов. GPT-4.1 nano: всего $0,10 (ввод) и $0,40 (вывод) за миллион токенов. Для сравнения, GPT-4.5 был очень дорогим: $75 (ввод) и $150 (вывод) за миллион токенов через API.
Почему тогда OpenAI не внедряет в ChatGPT более совершенную GPT-4.1, если она превосходит GPT-4o? Компания объясняет это поэтапным внедрением улучшений — многие функции исследовательских моделей постепенно интегрируются в основную версию GPT-4o с перспективой дальнейших обновлений. Таким образом, в экосистеме OpenAI сложилась двойная структура: разработчики через API получают доступ к специализированным моделям (4.1, 4.1 mini, 4.1 nano и другим) с фиксированными характеристиками для точного соответствия задачам и бюджету, тогда как рядовые пользователи ChatGPT работают с постоянно эволюционирующей «универсальной» версией GPT-4o, которая незаметно обновляется по усмотрению компании.
Свежие комментарии