53
эффективнее использовать словарь аффиксов и набор правил. В процессе написания
тезис была создана и алгоритмически реализована
морфологическая модель
узбекского языка.
Ключевые слова:
генерация. стемматизация, Портера, аффикс, суффикс.
Abstract.
Algorithms for the synthesis and analysis of word forms of the Uzbek language
are developed on the basis of the principles of dividing nouns, adjectives and verbs into
inflectional classes based on the task. It is much more efficient
to use an affix dictionary
and a set of rules. In the process of writing the thesis, a morphological model of the Uzbek
language was created and algorithmically implemented.
Key words:
generation, stemmatization, Portera, affix, suffix.
Annotatsiya:
O‘zbek tilining so‘z shakllarini sintez qilish va tahlil qilish algoritmlari
topshiriq asosida ot, sifat va fe’llarni flektiv sinflarga bo‘lish tamoyillari asosida ishlab
chiqilgan. Affiks lug‘at va qoidalar to‘plamidan foydalanish ancha samarali. Ushbu tezisda
o‘zbek tilining
morfologik modeli yaratilib, algoritmik tarzda amalga oshirildi.
Kalit so‘zlar:
generator, stemmatizatsiya, Porter, affiks, qo‘shimcha.
Процесс
информирования
общественности
становится
требованием
современности. Все сферы деятельности человека неразрывно связаны с процессами
получения, обработки и усвоения информации. Сегодня компьютерные и
информационные технологии становятся основой нашей повседневной жизни,
поскольку они быстро обновляются, изменяются и развиваются. В то
же время
Узбекистан постепенно входит в систему оцифровки. В связи с этим развитие
компьютерной лингвистики является актуальной задачей.
Морфологическая основа узбекского языка характеризуется большим
разнообразием аффиксов, добавляющихся к
основе слова в определенной
последовательности и придающих ему самые разные характеристики, а также
огромным количеством глагольных форм, позволяющих создавать до 150-200
вариантов,
отличающихся по смыслу, порой, кардинально, но при этом
образованных от одного глагола. Программные средства,
которые автоматически
находят нужные словоформы в изучаемых текстах, являются важным помощником в
проведении лингвистических исследований.
Диалект - помогает людям, живущим в определенном районе, взаимодействовать
друг с другом. В узбекском языке диалект отличается от литературного языка более
или менее фонетически, лексически и грамматически.
Есть только устная форма народных диалектов.
Набор тесно связанных диалектов называется диалектом (диалект - это
сочетание диалектов и диалектов).
В узбекском языке три диалекта:
1. Карлукский диалект (юго-восточная группа).
2. Кипчакский диалект (юго-западная группа).
3. Огузский диалект (северо-западная группа).
1) Буква “k” в конце слова произносится как “y” :
ela