Существительные мужского рода неодушевленные
001
телефон +*),
ом, ы, ов
002
тираж +,
ом, и, ей
003
огонь
ь, ем, и, ей
См. п. 012
004
перебой
й, ем, и, ев
См. п. 005
85
Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии. - М.:
Русский мир, 2004. – C. 68-90.
106
005
санаторий
й, ем, и, ев
Основы на букву
«и»
006
бланк +,
ом, и, ов
007
сапог +,
ом, и, +
010
лес +,
ом, а, ов
011
колодец +,
ем, ы, ев
012
путь (класс состоит
из одного слова)
013
край
й, ем, я, ев
014
брус
+, ом, я, ев
015
глаз +,
ом, а, +
016
зародыш +,
ем, и, ей
017
волос +,
ом, ы, +
020
лагерь
ь, ем, я, ей
Существительные мужского рода одушевленные
021
кузнец +,
ом, ы, ов
022
солдат +,
ом, ы, +
023
сосед +,
ом, и, ей
См. п. 024
024
врач +,
ом, и, ей
Основы на ж, ч, ш,
щ
025
пролетарий
й, ем, и, ев
026
воробей
ей, ем, и, ев
027
конь
ь, ем, и, ей
030
учитель
ь, ем, я, ей
031
сапожник +,
ом, и, ов
032
испанец +,
ем, ы, ев
033
юноша
а, ей, и, ей
034
мужчина
а, ой, ы, +
035
судья
я, ей, и, ей
036
товарищ +,
ем, и, ей
037
гражданин +,
ом, е, +
040
профессор +,
ом, а, ов
041
муж
+, ем, я, ей
042
Иванов
+, ым, ы, ых
043
сын +,
ом, я, ей
Существительные женского рода одушевленные
044
женщина
а, ой, ы, +
045
переводчица
а, ей, ы, +
046
нутрия
я, ей, и, й
Основы на букву
«и»
047
швея
я, ей, и, й
см. п. 046
050
цапля
я, ей, и, ь
051
санитарка
а, ой, и, +
052
мышь
ь, ю, и, ей
053
Иванова
а, ой, ы, ых
107
Существительные женского рода неодушевленные
054
речь
ь, ю, и, ей
Основы на ж, ч, ш,
щ
055
грань
ь, ю, и, ей
см. п. 054
056
колба
а, ой, ы, +
057
задача
а, ей, и, +
060
заготовка
а, ой, и, +
061
линия
я, ей, и, й
Основы на букву
«и»
062
галерея
я, ей, и, й
см. п. 061
063
земля
я, ей, и, ь
064
эскадрилья
я, ей, и, ий
065
статья
я, ей, и, ей
066
башня
я, ей, и, +
067
улица
а, ей, ы, +
Существительные среднего рода
070
место
о, ом, а, +
071
облако
о, ом, а, ов
072
поле
е, ем, я, ей
073
сомнение
е, ем, я, и
074
жилище
е, ем, а, +
075
перо
о, ом, я, ев
076
время
я, ем, а, +
077
побережье
е, ем, я, ий
100
колено
о, ом, и, ей
101
очко
о, ом, и, ов
102
ружье
е, ем, я, ей
*) Символ + обозначает нулевое окончание.
Прилагательные
№ п/п Слово-
представитель
Окончания:
1) им. п., муж. р.,
ед.ч.,
2) им. п., жен. р.,
ед.ч.,
3) род. п., муж. р.,
ед.ч.,
4) им. п., мн.ч.
Примечание
103
главный
ый, ая, ого, ые
104
передний
ий, яя, его, ие
108
105
хороший
ий, ая, его, ие
106
легкий
ий, ая, ого, ие
107
годовой
ой, ая, ого, ые
110
плохой
ой, ая, ого, ие
111
третий
ий, я, его, и
112
этот, сам +,
а, ого, и
113
мой, твой, свой
и, я, его, и
114
наш, ваш +,
а, его, и
115
весь
ь, я, его, е
Глаголы в личной форме
№ п/п
Слово-
представитель
Окончания 1, 2 и 3-
го лица ед. ч. и 3-го
лица мн. ч.
Примечание
116
делать
ю, ешь, ет, ют
117
строить
ю, ишь, ит, ят
120
писать
у, ешь, ет, ут
121
стучать
у, ишь, ит, ат
122
бежать
у, ишь, ит, ут
123
хотеть
у, ешь, ет, ят
124
зависеть
у, ишь, ит, ят
Morfologik analiz morfemalarga ajratish hamda grammatik ma’lumotlar
tahlilini o’z ichiga oladi. Morfologik sintez esa matnga avtomatik ishlov berish
jarayonida yoki uning so’nggi bosqichida (natijalarni inson hukmiga havola
qilishda) so’zlarning turli shakllarini chiqarish, analiz natijalarini
umumlashtirishdan iborat. Morfologik analiz va sintez jarayoni kompyuterda
kodlash-dekodlash tamoyili asosida ishlaydi. Bunda so’z turkumlari maxsus kodlar
yordamida belgilanadi. Quyidagi jadvalda RETRANS (inglizcha-ruscha, ruscha-
inglizcha frazeologik mashina tarjimasi tizimi) avtomatik tarjima tizimida
morfologik analiz jarayonida foydalaniladigan inglizcha so’zlarning grammatik
tasnifini berib o’tamiz:
15-jadval
Inglizcha so’zlarning grammatik tasnifi
СУЩЕСТВИТЕЛЬНЫЕ
11
Собственно существительные
12
Местоименные существительные
13
Количественные числительные
14
Отглагольные существительные
ПРИЛАГАТЕЛЬНЫЕ
109
21
Собственно прилагательные
22
Местоименные прилагательные
23
Порядковые числительные
24
Отглагольные прилагательные
ГЛАГОЛЫ
31
Вспомогательные глаголы
32
Глаголы настоящего времени, инфинитив
33
Глаголы прошедшего времени
34
Модальные глаголы
НАРЕЧИЯ
41
Собственно наречия
42
Местоименные наречия
43
Наречия сравнительной степени,
прилагательные сравнительной степени
44
Отглагольные наречия (инговая форма)
ПРЕДЛОГИ
51
Предлог of
52
Остальные предлоги
СОЮЗЫ
61
Сочинительные союзы
62
Подчинительные союзы
АРТИКЛИ
71
Определенный артикль
72
Неопределенный артикль
ЧАСТИЦЫ
81
Частица to
82
Частицы not и no
83
Остальные частицы
Ushbu jadvalda “1” simvoli otlarni, “2” simvoli sifatlarni, “3” simvoli
fe’llarni, “4” simvoli ravishlarni, “5” simvoli predloglarni, “6” simvoli
bog’lovchilarni, “7” simvoli artiklni, “8” simvoli yuklamalarni bildiradi.
Morfologik analaiz jarayonida
ushbu simvollar orqali so’zlar kodlanadi. Masalan,
inglizcha matn fragmentining RETRANS avtomatik tarjima tizimida morfologik
analiz namunasiga e’tibor beraylik.
110
Inglizcha matn fragmentining morfologik analiz namunasi
Language 0/11 engineering 0/11 is 0/31 the 0/71
core 0/11 of 0/51 information 0/11 technology 1/11
and 0/61
information 0/11
technology 1/11
will 0/31
be 0/31
the 0/71
key 0/1121
industry 1/11
of 0/51
the 0/71
next 0/21
decades 1/11 .
Inglizcha matn fragmentining RETRANS avtomatik tarjima tizimida
morfologik analiz namunasi
NNo
Результаты
Классы
п/п
анализа
словоформ
16 No
0/82 6
82
17 Balkan
0/21
v
21
18
state 0/1132
T 1132 = 11
19 wished
0/2433
э 2433
20 to
0/81 5
81
21 become
0/2432
д 2432
22 embroiled
0/2433
э 2433
23 in
0/52 И 52
ZZZ6v T э5дэИ = 11
.
. . . . . . . . . . . . . . . . . . . . . . . . .
16 No
0/82 6
82
17 Balkan
0/21
v
21
18 state
0/1132
T
1132
19 wished
0/2433
э 2433 = 33
20 to
0/81 5
81
21 become
0/2432
д 2432
22 embroiled
0/2433
э 2433
111
23 in
0/52 И 52
24 the
0/71 3
71
ZZ6vT э 5дэИ3 = 33
.
. . . . . . . . . . . . . . . . . . . . . . . . .
16 No
0/82 6
82
17 Balkan
0/21
v
21
18 state
0/1132
T
1132
19 wished
0/2433
э 2433
20 to
0/81 5
81
21 become
0/2432
д 2432 = 32
22 embroiled
0/2433
э 2433
23 in
0/52 И 52
24 the
0/71 3
71
25 "
"
26
Great 0/21
v 21
6vTэ5 д эИ3"v = 32
.
. . . . . . . . . . . . . . . . . . . . . . . . .
17 Balkan
0/21
v
21
18 state
0/1132
T
1132
19 wished
0/2433
э 2433
20 to
0/81 5
81
21 become
0/2432
д 2432
22 embroiled
0/2433
э 2433 = 24
23 in
0/52 И 52
24 the
0/71 3
71
25 "
"
26
Great 0/21
v 21
27
War 0/11
A 11
vTэ5д э И3"vA = 24
Bu yerda ayrim so’zlar grammatik omonimiyaning hisobiga dastlab (“tahlil
natijalari”da) ikki xil raqam bilan berilgan, so’nggi bosqichda ular kontekstdagi
holatidan kelib chiqib aniq tasnifi keltiriladi. Yuqoridagi matn fragmentida shunday
so’zlar sirasiga "state" so’zini misol qilish mumkin. "State" so’zi dastlabki tahlilda
0/1132 kodi orqali beriladi, bunda “0” raqami so’zda qo’shimchaning yo’qligini (nol
morfemani), “11” raqami ot so’z turkumini, “32” raqami esa hozirgi zamon
shaklidagi fe’l yoki infinitivni bildiradi. Bunga o’xshash yana bir so’z "wished"
so’zining dastlabki tahlilida bir qiymatli bo’lmagan ma’lumotlarga ega bo’lamiz.
“Wished” so’zi 0/2433 kodi bilan beriladi, bunda “0” raqami yuqoridagidek nol
112
morfemani, “24” fe’l asosida hosil bo’lgan sifat turkumini, “33” o’tgan zamon
shaklidagi fe’lni anglatadi.
So’zlarning qaysi turkumga mansubligini aniqlashda chappa (ters) lug’atlardan
foydalaniladi. Bunga turli xil turkumga mansub so’zlarning morfologik analizini
ko’rsatuvchi inglizcha so’z shakllarning grammatik chappa lug’ati yaqqol misol bo’la
oladi.
16-jadval
Inglizcha so’z shakllarning grammatik chappa lug’ati fragmenti (ushbu
lug’at 54000 leksik birlikni o’z chiga oladi)
So’z Grammatik ma’lumot
OT (Noun)
Sifat (Adjective)
Fe’l (Verb)
America 0/11
morphologic 0/21
tightened 0/2433
Africa 0/11
epidemiologic 0/21
shortened 0/2433
Corsica 0/11
physiologic 0/21
fastened 0/2433
Arctica 0/11
immunologic 0/21
moistened 0/2433
Antarctica 0/11
hydrologic 0/21
flattened 0/2433
Casablanca 0/11
geohydrologic 0/21
aligned 0/2433
Canada 0/11
paleohydrologic 0/21
standardize 0/32
transcanada 0/11
micrometeorologic 0/21
focalize 0/32
Granada 0/11
metrologic 0/21
realize 0/32
Nevada 0/11
neurologic 0/21
specialize 0/32
Andromeda 0/11
paleontologic 0/21
commercialize 0/32
Florida 0/11
allergic 0/21
rationalize 0/32
Propaganda 0/11
readable 0/21
neutralize 0/32
addenda 1/11
achine-readable 0/21
visualize 0/32
agenda 0/11
degradable 0/21 conceptualize
0/32
thermobalance 0/11
biodegradable 0/21
stabilize 0/32
microbalance 0/11
upgradable 0/21
utilize 0/32
heatbalance 0/11
decidable 0/21
straightening 0/142444
resemblance 0/11
undecidable 0/21
heightening 0/142444
surveillance 0/11
formidable 0/21
brightening 0/142444
ambulance 0/11
avoidable 0/21
whitening 0/142444
conformance 0/11
artifical 0/21
fastening 0/142444
performance 0/11
strategical 0/21
listening 0/142444
high-performance 0/11
pedagogical 0/21
peculiarities 3/11
maintenance 0/11
logical 0/21
similarities 3/11
standartization 0/11
mineralogical 0/21
polarities 3/11
stochastization 0/11
pharmacological 0/21
multipolarities 3/11
analyzation 0/11
gynecological 0/21 micropolarities
3/11
radioabsorbtion 0/11
silent 0/21 particularities
3/11
action 0/11
excellent 0/21
regularities 3/11
co-action 0/11
repellent 0/21
singularities 3/11
113
reaction 0/11
violent 0/21 stabilizes
1/32
prereaction 0/11
turbulent 0/21
utilizes 1/32
photoreaction 0/11
|