Словарь подготовлен в рамках совместного проекта с университетом города Тромсё “Информационная инфраструктура языков коренных народов Европейского Севера” при финансовой поддержке Министерства национальной политики Республики Коми. Университет города Тромсё (Норвегия) стал одним из первых, кто откликнулся и поддержал новый проект.
Программа, заявленная еще осенью прошлого года, базируется “на трех китах”: словаре, морфоанализаторе и корпусе текстов. При полной и глубокой разработке данных условий язык будет функционировать в полную силу в Интернете и электронных программах.
Реализует столь сложный проект команда единомышленников. Это руководитель лаборатории Марина Федина и Алексей Иванов из Республики Коми, Андрей Чемышев из Марий Эл, Öньö Лав (Вячеслав Степанов) из Пермского края, ученый-лингвист из Финляндии Джек Рютер и профессор университета города Тромсе Тронд Тростеруд.
На презентации каждый из них продемонстрировал свое направление работы над проектом. Джек Рютер представил коми-русский словарь как собрание лексем, а также словарь переводов коми слов на английский и финский. Тронд Тростеруд объяснил действие морфоанализатора и коснулся проблемной темы раскладки клавиатуры в разных языках. Он отметил, что создание клавиатуры для коми языка – не проблема, в отличие от других языков, в алфавитах которых есть свои оригинальные буквы.
Ученый-полиглот Öньö Лав подробно рассказал о работе над корпусами текстов. Данная подпрограмма позволяет найти введенное пользователем слово в различных текстах, понять, в каком значении оно применяется, и проследить частоту употребления в языке данного слова. Кроме того, с помощью этой подпрограммы можно будет сортировать слова как по алфавиту, так и по частоте употребления. Корпус текста действует как словарная база для формирования толкового и морфологического словарей. Öньö Лав в создании корпусов текста уже имеет большой опыт. За 8 лет кропотливой работы им сформирована огромная электронная база слов коми-пермяцкого языка.
Андрей Чемышев продемонстрировал возможности сканирования коми текста с помощью усовершенствованной им программы ABBYY FineReader. Андрей ввел в список поддерживаемых программой словарей отдельные коми-зырянский и коми-пермяцкий словари. Это позволяет сканировать коми тексты без каких-либо искажений. Сотрудники лаборатории обратятся к правообладателям программы ABBYY FineReader с просьбой официально внести коми-зырянский и коми-пермяцкий словари в список поддерживаемых.
Коми-русский электронный словарь, включающий в себя на сегодняшний день 15 тысяч понятий, уже доступен в Интернете. С ним можно познакомиться на лингвистическом сайте giellatekno.uit.no. В планах лаборатории запланированы обучающие курсы по пользованию новыми программами, разработанными в рамках данного большого проекта.
Осталось подчеркнуть, что все продукты, выпущенные Межрегиональной лабораторией информационной поддержки функционирования финно-угорских языков при Коми республиканской академии государственной службы и управления, находятся под свободной лицензией.
Ольга Худяева
Источник: ИЦ “Финноугория”