Kompyuter lingvistikasida modellashtirish va analogiya metodlari




Download 78,05 Kb.
bet8/14
Sana29.12.2020
Hajmi78,05 Kb.
#13002
1   ...   4   5   6   7   8   9   10   11   ...   14
Simvollar

Simvollar

birikuvi

1

S - boshlang‘ich simvol, u inglizcha «Sentence» («gap») so‘zining bosh harfidan olingan.

S = NP + VP

2

VP - kesim guruhining simvoli, u inglizcha «Verb Phrase» birikmasidan olingan.

VP = Verb + NP

3

NP -ega guruhining simvoli, u inglizcha «Noun Phrase» birikmasidan olingan.

NP = Det + N

4

Verb - kesim gap bo‘lagining simvoli, u inglizcha «Verb» so‘zidan olingan.

V = Aux + V

5

Det - artiklning simvoli, u inglizcha «Determiner» («aniqlagich») so‘zidan olingan.

Det = the, a, ...

6

N -ot so‘z turkumining simvoli, u inglizcha «Noun» so‘zidan olingan.

N = book, computer...

7

Aux - yordamchi (ko‘makchi) fe’llarning simvoli, u inglizcha «Auxiliary» so‘zidan olingan.

Aux = will, can ...

8

V — fe’l so‘z turkumining simvoli, u inglizcha «Verb» so‘zidan olingan.

V = see, know ...

Jadvaldagi 5 - 8-qatorlarda ko‘rsatilgan simvollar (Det, N, Aux, V) ter­minal simvollar deyiladi, chunki ular lug‘atdagi aniq so‘zlardir. 1 - 4-qa- tordagi simvollar esa noterminal simvollar deb ataladi.

Gap hosil qilish jarayoni noterminal simvollarni o‘ng qismga davomiy o‘rin almashtirish asosida yuz beradi. Bunda boshlang‘ich simvol S o‘ziga mos keluvchi simvollar birikuvi NP hamda VP ga almashtiriladi. So‘ng NP va VP simvollari ham, o‘z navbatida, Det + N hamda Verb + NP ga almash­tiriladi. Bu jarayon barcha simvollar noterminal bo‘lguncha davom eta- veradi. Masalan, ingliz tilidagi quyidagi jumlani bevosita ishtirokchilar modeli asosida tahlil etaylik. Birinchi bosqichda jumla NP va VPga ajratiladi: The old man | saw a black dog there - Keksa odam и yerda qora itni кo‘rdi. Keyingi bosqichda yuqoridagi ajralish, o‘z navbatida, yana ikki qism- ga ajratiladi: The || old man \ saw a black dog || there. So‘nggi bosqichda jumla bevosita ishtirokchilar modeli asosida «daraxt» («sentence tree») ko‘rinishida tasvirlanishi mumkin:1

Context-free grammar – matndan xoli bo‘lgan grammatika, chunki undagi qoidalar universal hisoblanib, ma’lum matnga tayanib tahlil etishga asoslanmaydi, balki u avvaldan empirik tarzda belgilab olinadi. Hozirda ushbu grammatika sun’iy programmalash tillariga (Pascal, C++, Delphi, HTML) faol tatbiq etilgan, shuningdek, tabiiy tillarni formallashtirish jarayonida ham grammatikani bayon qilishning eng optimal usuli hisoblanadi.

Formallashtirish - bu bilimlar majmuasini, mazmunini muayyan shakllar yordamida sun’iy til belgilari orqali ifodalashdir. Grammatikani for­mallashtirish tendensiyasi XX asrning o‘rtalarida kuchaydi. Bu bevosita tilning strukturasini yanada aniq parametrlarda ifodalashga intilish, uni kompyuterga moslashtirishga urinish bilan bog‘liqdir. Formal grammati- ka nazariyasi matematik mantiq, matematik linvistikaning rivojlanishi natijasida yuzaga kelgan. Grammatikani formallashtirish (lotincha «for­ma» - «shakl», «tashqi ko‘rinish») konsepsiyasining asoschisi amerikalik tilshunos Noam Chomskiydir. Formal grammatika abstrakt simvollar orqa­li bayon etiladigan grammatika hisoblanib, unda til qoidalari, so‘z yasa­lishi, birikma va gap qurilishi turli xil lingvistik modellar, struktur sxemalar yordamida tavsiflanadi. Formal grammatika 3 ta birlik asosida ish ko‘radi:


  1. Word-classes - so‘z turkumlari (tub va yasama so‘zlar).

  2. Phrases - gap bo‘laklari.

  3. Sentences - gap konstruksiyalari sxemalari, modellari.

N.Chomskiy qoidalarning ifodalanish turiga qarab formal grammati­kani 4 tipga ajratgan va bu Chomskiy iyerarxiyasi deb nomlanadi:


  1. Download 78,05 Kb.
1   ...   4   5   6   7   8   9   10   11   ...   14




Download 78,05 Kb.

Bosh sahifa
Aloqalar

    Bosh sahifa



Kompyuter lingvistikasida modellashtirish va analogiya metodlari

Download 78,05 Kb.