В Институте языкознания с помощью нейросетей разработали аудиокорпус, который позволяет переводить записи народного языка в текст. Об этом в Международный день родного языка рассказал корреспонденту директор Института языкознания им. Якуба Коласа Центра исследований белорусской культуры, языка и литературы НАН Игорь Копылов.

"Мы с помощью нейросетей разработали аудиокорпус, который позволяет переводить звуковые записи местного, народного, диалектного языка в текстовый формат. На протяжении десятилетий, начиная с послевоенной поры и до сегодняшнего дня ученые выезжали в разные экспедиции во все регионы Беларуси. По итогам был собран богатый аудиофонд, который требует расшифровки. Вручную сделать это очень сложно, поэтому помогает ИИ", - сказал Игорь Копылов.
Он добавил, что аудиокорпус был создан абсолютно недавно. Проект еще не запущен широко, сейчас идет апробация.
По словам Игоря Копылова, ИИ также помогает расшифровать старые печатные книги, писавшиеся с использованием различных графических средств, ведь это тоже тяжелая работа, которая занимает много времени. Трудности возникают только с текстами, собранными на Полесье, поскольку там достаточно особенная речь.
Еще в прошлом году был создан синтезатор белорусской речи для тех, кто хочет получать информацию на белорусском, пользуясь, например, банкоматом. Для людей с плохим зрением он обеспечивает перевод текстовой информации в звуковую.


