На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Хайтек+

23 подписчика

Свежие комментарии

  • Иван Вакула
    В России после распада СССР и стараниями либеральной власти образование перевели на западные методики, что из этого п...Различия в успева...
  • Aleksandr Antonov
    Мы 33 цивилизация на земле, так что не надо, люди вобще появились более 1000000 назад. Но не однократно уничтожали ь ...Заселение Северно...

В MIT создали алгоритм автоматической дешифровки мертвых языков

Утерянные языки – не просто лингвистический курьез. Без них человечество лишается массива знаний о людях, которые некогда говорили на них. К сожалению, большинство из них настолько мало представлены в письменном виде, что алгоритмы машинного обучения вроде Google Translate не могут расшифровать их. У некоторых нет хорошо изученных родственных языков, с которыми их можно было бы сравнить.

Часто они бывают лишены привычных знаков препинания и пробелов.

Тем не менее, специалисты из лаборатории искусственного интеллекта (CSAIL) MIT совершили прорыв в этой области, разработав систему автоматической дешифровки мертвых языков без наличия хорошо изученных родственных языков. Система способна самостоятельно определять связи между языками, https://news.mit.edu/2020/translating-lost-languages-using-m... MIT News.

Система основана на нескольких принципах, взятых из исторического языкознания. К примеру, что у языка есть несколько предсказуемых путей развития. Так, язык редко приобретает или лишается целого звука, но способен заменять одни звуки другими. Звук [п] может измениться на [б], но вряд ли на [к] из-за значительной разницы в произношении.

Получившийся алгоритм смог обрабатывать большой объем возможных трансформаций языка. Он учился преобразовывать язык в многомерное пространство, в котором разница в произношении отражалась в виде дистанции между соответствующими векторами. В итоге модель смогла сегментировать слова древних языков и сопоставить их с родственными языками.

Таким образом, алгоритм может оценить сходство двух языков. Тесты на известных языках показали, что он точно идентифицирует языковые семьи.

Конечная цель исследователей – расшифровать мертвые языки, над которыми лингвисты ломают головы десятки лет, имея в своем распоряжении всего несколько тысяч слов.

Немецкие ученые https://hightech.plus/2019/12/04/uchenie-vpervie-smodelirova... процесс зарождения первых языков у людей. В ходе эксперимента они установили, что даже дети дошкольного возраста смогли спонтанно создать язык, обладающий основными свойствами естественного.

 

Ссылка на первоисточник
наверх
Новости СМИ2