На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Хайтек+

23 подписчика

Свежие комментарии

  • Егор Горшков
    А почему бы и да, как говорится.Храните биткоины ...
  • Цуркан Арк
    Сказки, на три недели, а потом полгода жечь щепу?В Финляндии подкл...
  • Иван Вакула
    В России после распада СССР и стараниями либеральной власти образование перевели на западные методики, что из этого п...Различия в успева...

DeepSeek усилила «мышление» ИИ с помощью нового подхода

В сотрудничестве с исследователями из Университета Цинхуа компания DeepSeek разработала новую методику, сочетающую генеративное моделирование вознаграждений (Generative Reward Modeling, GRM) и самообучающуюся систему критической настройки (self-principled critique tuning). Этот двойной подход позволяет большим языковым моделям быстрее и точнее отвечать на общие запросы.

Полученные GRM-модели превзошли существующие методы. Исследователи отметили, что они «показали конкурентоспособные результаты» в сравнении с ведущими публичными моделями вознаграждения. Моделирование вознаграждений помогает языковым моделям лучше соответствовать человеческим предпочтениям. DeepSeek планирует сделать GRM-модели открытыми, но не называет конкретных сроков.

Научная работа была опубликована в период активного обсуждения дальнейших шагов DeepSeek. По данным Reuters, следующая версия, DeepSeek-R2, может быть выпущена уже в этом месяце. Ее предшественник, DeepSeek-R1, произвел сильное впечатление на технологическое сообщество, поскольку продемонстрировал производительность, сопоставимую с ведущими аналогами, при меньшей стоимости.

DeepSeek не комментирует слухи о скором выпуске модели R2. Хотя официальных заявлений по этому поводу не поступало, в прошлом месяце китайские СМИ сообщили, что служба поддержки компании опровергла данную информацию в чате с корпоративными клиентами.

DeepSeek базируется в Ханчжоу. Ее основал предприниматель Лян Вэньфэн в 2023 году. Хотя последние несколько месяцев компания находится в центре международного внимания, она редко выступает с публичными заявлениями.

Основные силы команда сосредоточила на исследованиях и разработках. В прошлом месяце компания выпустила обновленную версию своей модели V3. В DeepSeek-V3-0324 улучшены логические способности системы, оптимизированы функции веб-разработки и расширены возможности обработки китайского языка. В феврале компания открыла исходный код пяти своих репозиториев.

Лян также основал High-Flyer Quant — материнскую компанию DeepSeek. Её большие финансовые ресурсы помогают стартапу развивать технологии. В конце февраля Лян участвовал в конференции с предпринимателями в Пекине, организованной председателем КНР Си Цзиньпином. Там DeepSeek называли примером устойчивости страны к попыткам США замедлить развитие китайского ИИ.

 

Ссылка на первоисточник
наверх
Новости СМИ2