|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)Manzura Abjalova
~ 34 ~
Otabekning mashinasi
kabi. Demak, bunday holda soʻzning ot
turkumligi oʻzining oldida kelayotgan qaratqich kelishigidagi ism orqali
belgilanadi. Ingliz tilidan misolga e’tibor qaratamiz: oldingi soʻz artikl
boʻlsa, u holda undan keyin kelayotgan soʻz ot turkumiga oid leksik
birlik sanaladi. Masalan,
an egg, a book, the train, the windows
kabi.
PoS teglaridagi bunday holatlar qoidalar shaklida kodlanadi.
Ushbu qoidalar quyidagilarni tashkil etishi mumkin:
1.
Lingvistik me’yorlarga asoslangan qoidalar
. Tilning orfografik
qoidalariga asoslangan yuzlab qoidalar umumiy, xususiy va istisnoli
qoidalar bazasi tarzida shakllantiriladi.
2.
Kontekstli shablon qoidalari
, ya’ni gap tarkibidagi koʻchma
ma’noga ega soʻzning muntazam ravishda konnotativ ma’noda
qoʻllanishi dastur xotirasida saqlanadi, natijada keyingi jarayonlarda
oʻsha konnotativ soʻz bilan bogʻliq noaniqliklar bartaraf etiladi.
Qoidalarga asoslangan metodga binoan soʻz turkumlarini teglash
ikki bosqichda amalga oshiriladi:
Birinchi bosqichda
PoS-tegger (izohli, imlo, morfologik yoxud
orfografik) lugʻat(lar)ga tayanadi. U lugʻat yordamida har bir soʻzning
turkum(lar)ini aniqlab chiqadi.
Ikkinchi bosqichda
polifunksional yoki omonim soʻzlarning
turkumlari qoʻlda yoziladi va bunday soʻzlarni jumla tarkibidagi
vazifasini aniqlash qoidalarining katta roʻyxati ishlab chiqiladi.
Qoidalarni avtomatik generatsiya qilish metodining yaqqol
namunasi – amerikalik lingvist Erik Brill metodidir
35
.
Qoidalarga asoslangan ST teglari xususiyatlari
Qoidalarga asoslangan PoS teglari quyidagi xususiyatlarga ega:
–
Ushbu tegerlar bilimga asoslanadi.
–
Qoidalar qoʻlda yaratiladi.
–
Axborotlar qoidalar shaklida kodlanlanadi.
–
Qoidalar cheklangan boʻladi. Raqamli texnologiya uchun
cheksizlik mavhumlikni ifodalaydi, “
va shu kabilar
”, “...” (koʻp nuqta),
35
Brill E. 1995. Transformation-Based Error-Driven Learning and Natural Language
Processing: A Case Study in Part-of-Speech Tagging // Computational Linguistics. Vol. 21. – P.
543-565. http://acl.ldc.upenn.edu/J/J95/J95-4004.pdf
|
| |