Прогресс

DeepSeek усилила «мышление» ИИ с помощью нового подхода

В сотрудничестве с исследователями из Университета Цинхуа компания DeepSeek разработала новую методику, сочетающую генеративное моделирование вознаграждений (Generative Reward Modeling, GRM) и самообучающуюся систему критической настройки (self-principled critique tuning). Этот двойной подход позволяет большим языковым моделям быстрее и точнее отвечать на общие запросы.

Полученные GRM-модели превзошли существующие методы. Исследователи отметили, что они «показали конкурентоспособные результаты» в сравнении с ведущими публичными моделями вознаграждения. Моделирование вознаграждений помогает языковым моделям лучше соответствовать человеческим предпочтениям. DeepSeek планирует сделать GRM-модели открытыми, но не называет конкретных сроков.

Научная работа была опубликована в период активного обсуждения дальнейших шагов DeepSeek. По данным Reuters, следующая версия, DeepSeek-R2, может быть выпущена уже в этом месяце. Ее предшественник, DeepSeek-R1, произвел сильное впечатление на технологическое сообщество, поскольку продемонстрировал производительность, сопоставимую с ведущими аналогами, при меньшей стоимости.

DeepSeek не комментирует слухи о скором выпуске модели R2. Хотя официальных заявлений по этому поводу не поступало, в прошлом месяце китайские СМИ сообщили, что служба поддержки компании опровергла данную информацию в чате с корпоративными клиентами.

DeepSeek базируется в Ханчжоу. Ее основал предприниматель Лян Вэньфэн в 2023 году. Хотя последние несколько месяцев компания находится в центре международного внимания, она редко выступает с публичными заявлениями.

Основные силы команда сосредоточила на исследованиях и разработках. В прошлом месяце компания выпустила обновленную версию своей модели V3. В DeepSeek-V3-0324 улучшены логические способности системы, оптимизированы функции веб-разработки и расширены возможности обработки китайского языка. В феврале компания открыла исходный код пяти своих репозиториев.

Лян также основал High-Flyer Quant — материнскую компанию DeepSeek. Её большие финансовые ресурсы помогают стартапу развивать технологии. В конце февраля Лян участвовал в конференции с предпринимателями в Пекине, организованной председателем КНР Си Цзиньпином. Там DeepSeek называли примером устойчивости страны к попыткам США замедлить развитие китайского ИИ.

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов