
Нижегородские учёные разработали уникальную модель для узбекского языка
Учёные Нижегородского государственного лингвистического университета имени Добролюбова представили новую модель обработки узбекского языка на основе программы «Фразеоэкстрактор». Разработанная система не имеет аналогов и позволяет анализировать использование слов в иностранном языке.
По словам старшего научного сотрудника Научно-образовательного центра дизайна и проектирования инновационной среды дополнительного образования Максима Чикова, стандартных инструментов для перевода зачастую недостаточно. Именно поэтому появилась необходимость в «Фразеоэкстракторе». Программа способна автоматически формировать словари из устойчивых словосочетаний на основе текстов на русском, английском, немецком, французском, испанском, китайском, корейском, турецком, а теперь и узбекском языках. Разработка модели началась в 2022 году.
«Мы создали систему обработки узбекского языка с нуля, и теперь необходимо пополнять её словарную базу — сначала 5000 слов, затем десятки тысяч и более. Восточные языки, особенно узбекский, — это наше конкурентное преимущество!» — отметил Чиков.
Узбекский стал вторым тюркским языком после турецкого, который можно переводить на русский с помощью данной программы. Исполняющий обязанности ректора НГЛУ Никита Авралев подчеркнул, что изучение узбекского и турецкого языков крайне важно для региона, поскольку Узбекистан и Турция являются стратегическими партнёрами.
Пока учёные разрабатывают пользовательский интерфейс, студенты НГЛУ уже могут работать с программным кодом в онлайн-редакторе.