На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Хайтек+

23 подписчика

Свежие комментарии

  • Егор Горшков
    А почему бы и да, как говорится.Храните биткоины ...
  • Цуркан Арк
    Сказки, на три недели, а потом полгода жечь щепу?В Финляндии подкл...
  • Иван Вакула
    В России после распада СССР и стараниями либеральной власти образование перевели на западные методики, что из этого п...Различия в успева...

Компилятор поможет оптимизировать модели ИИ

Современные методы оптимизации алгоритмов могут быть громоздкими и обычно позволяют разработчикам менять один из двух видов избыточности в структурах данных глубокого обучения: разреженность или симметрию. Команда из Массачусетского технологического института дает возможность создавать алгоритмы, которые не будут ограничиваться чем-то одним.

Эксперименты показали, что скорость вычислений может возрасти в некоторых случаях почти в 30 раз.

В машинном обучении данные зачастую представлены в виде тензоров, контейнеров со множеством измерений. Модели выполняют операции с тензорами при помощи повторяемых матриц умножения и сложения, но эти операции очень ресурсоемкие. Для упрощения работы с тензорами специалисты Лаборатории информатики и ИИ разработали новый компилятор SySTeC, https://news.mit.edu/2025/user-friendly-system-can-help-deve... MIT News.

Компилятор автоматически оптимизирует код для всех трех типов симметрии в тензорах данных и выполняет дополнительные преобразования для хранения исключительно ненулевых значений данных, повышая показатель разреженности в программе. Наконец, SySTeC генерирует готовый для использования код.

«Таким образом, мы получаем преимущества обеих видов оптимизации. А что касается симметрии, интересно, что чем больше измерений у тензора, тем дешевле получаются вычисления», - сказала Уиллоу Аренс, соавтор статьи, которую она и ее коллеги представили на Международном симпозиуме по генерации и оптимизации кода.

Поскольку SySTeC использует доступный программный язык, она годится для улучшения алгоритмов машинного обучения широкого спектра применения.

Будучи автоматизированной, она подходит для ученых, которые не разбираются в глубоком обучении, но хотят оптимизировать производительность алгоритмов для обработки данных.

Учитывая высокую стоимость и низкую скорость обучения больших языковых моделей (БЯМ), исследователи и разработчики активно обсуждают, в состоянии ли увеличение циклов вычислений повысить производительность БЯМ без необходимости в их переобучении. Специалисты из DeepMind и Калифорнийского университета https://hightech.plus/2024/08/27/deepmind-nashla-sposob-opti... новые способы повышения производительности БЯМ путем стратегического распределения ресурсов.

 

Ссылка на первоисточник
наверх
Новости СМИ2