
Tencent выпустил ИИ-модель Hunyuan 2.0 с 406 млрд параметров
HY2.0 построена на архитектуре «смесь экспертов» (MoE): при общем размере до 406 млрд параметров одновременно задействуется только 32 млрд. Модель поддерживает сверхдлинный контекст — до 256 тыс. токенов, что позволяет ей работать с большими документами и сложными цепочками рассуждений. HY 2.0
...Далее



Свежие комментарии