Базу древнеславянских текстов создадут с помощью технологий искусственного интеллекта российские ученые при участии Комиссии по работе с ВУЗами и научным сообществом при Епархиальном совете Москвы.

Как сообщили в НИТУ «МИСиС», «коллаборация ученых Института русского языка имени В. В. Виноградова РАН, НИТУ «МИСиС», НИУ ВШЭ при поддержке Комиссии по работе с ВУЗами и научным сообществом при Епархиальном совете Москвы запустила масштабный проект по созданию с помощью технологий искусственного интеллекта и машинного обучения уникальной базы древнеславянских рукописных текстов – корпуса», передает РИА Новости.

Корпусом будет называться структурированная база данных языка, информационно-справочная система, основанная на собрании в электронной форме текстов на определенном языке.  

Он будет представлять собой подобранную и обработанную совокупность текстов, используемых в качестве основы для исследования лексики и грамматики языка.

Как ожидают ученые, создание корпуса древнеславянского языка даст исследователям-лингвистам и историкам инструмент для изучения всех современных национальных славянских языков и культур, а также поможет понять их наследие.

– Естественный язык является ключевым полигоном для развития технологий искусственного интеллекта. Именно благодаря этим технологиям задачи машинного перевода, построение диалоговых систем и задачи интерпретации текстов на естественном языке получили мощный толчок в последнее время. В некотором смысле такой проект является мостиком от культуры прошлого к технологиям будущего, – отметил ведущий эксперт Центра инфраструктурного взаимодействия и партнерства MegaScience НИТУ «МИСиС», руководитель Научно-учебной лаборатории методов анализа больших данных ВШЭ Андрей Устюжанин.

В рамках первого этапа создания корпуса планируется оцифровать и разметить комплекс древнеславянских миней XI-XVII веков на древнерусском, болгарском и сербском языках – служебных церковных книг, содержащих порядок служб всех дней церковного года.

Сегодня рукописи этих книг хранятся в собраниях Государственного исторического музея, Российской национальной и государственной библиотек, Российского госархива древних актов, Свято-Троицкой Сергиевой лавры.

Читайте также:

Мир, который увидят наши дети

0
0
Сохранить
Поделиться: