Нижегородские учёные разработали уникальную модель для узбекского языка

Нижегородские учёные разработали уникальную модель для узбекского языка

Учёные Нижегородского государственного лингвистического университета имени Добролюбова представили новую модель обработки узбекского языка на основе программы «Фразеоэкстрактор». Разработанная система не имеет аналогов и позволяет анализировать использование слов в иностранном языке.

По словам старшего научного сотрудника Научно-образовательного центра дизайна и проектирования инновационной среды дополнительного образования Максима Чикова, стандартных инструментов для перевода зачастую недостаточно. Именно поэтому появилась необходимость в «Фразеоэкстракторе». Программа способна автоматически формировать словари из устойчивых словосочетаний на основе текстов на русском, английском, немецком, французском, испанском, китайском, корейском, турецком, а теперь и узбекском языках. Разработка модели началась в 2022 году.

«Мы создали систему обработки узбекского языка с нуля, и теперь необходимо пополнять её словарную базу — сначала 5000 слов, затем десятки тысяч и более. Восточные языки, особенно узбекский, — это наше конкурентное преимущество!» — отметил Чиков.

Узбекский стал вторым тюркским языком после турецкого, который можно переводить на русский с помощью данной программы. Исполняющий обязанности ректора НГЛУ Никита Авралев подчеркнул, что изучение узбекского и турецкого языков крайне важно для региона, поскольку Узбекистан и Турция являются стратегическими партнёрами.

Пока учёные разрабатывают пользовательский интерфейс, студенты НГЛУ уже могут работать с программным кодом в онлайн-редакторе.