|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)Manzura Abjalova
~ 54 ~
5-rasm.
Oʻzbek tilining ta’limiy korpusi “Lugʻatlar” ruknida qidiruv
natijasi
10.
RUS TILI MILLIY KORPUSI VA UNING STRUKTURASI
Rus tilining milliy korpusi (Национальный корпус русского языка
– НКРЯ) – mustaqil korpuslar to‘plami bo‘lib, mazkur korpus
tarkibidagi har bir korpus ma‘lum lingvistik muammolarni hal qilishga
mo‘ljallab yaratilgan. Korpusning dastlabki matnlari 2000-2003-yillarda
lingvistik annotatsiyalangan bo‘lib, 2004-yilning 27-aprel sanasida
foydalanuvchilarga taqdim etilganligi haqida rasman xabar berilgan.
Aslida korpus 2003-yilda ishga tushirilgan. Korpus bazasi va qidiruv
tizimi Yandeks tizimi tomonidan qo‘llab-quvvatlanadi. 2022-yilning
avgustidan boshlab ushbu korpus zamonaviy ko‘rinishga o‘tgan. Hozirgi
kunda RTMK 1.5 mlrd.dan ortiq so‘zni qamrab olgan 4.5 mln rus tilidagi
matnlar mavjud
44
Rus tili milliy korpusi tarkibidagi korpuslarning har biri hajmi
jihatidan katta va muvofiqlashtirilgan boʻlib, ushbu xususiyatlar
korpuslarni miqdoriy va samarali tadqiqotlar uchun qimmatli materialga
44
https://ruscorpora.ru/
KORPUS LINGVISTIKASI
Manzura Abjalova
~ 55 ~
aylantiradi. Lingvistik vazifalarning spetsifikasi, ya’ni oʻziga xos
xususiyati korpusning tarkibi va unda qoʻllanilayotgan lingvistik
izohlarni aniqlashdan iborat. Masalan,
poetik korpus
nazmni oʻrganish
uchun asos boʻlib xizmat qiladi, shuning uchun u she’riyatning asosiy
tushunchalari – vazn va qofiya bilan bogʻliq maxsus belgi (izoh)larga
ega.
Aksentologik korpus
rus tilidagi urgʻuning tarixiga bagʻishlangan
boʻlib, urgʻuni izohlash bunda muhim hisoblanadi.
Ogʻzaki korpus
ning
lingvistik izohi ovozli nutqning urgʻusi va boshqa oʻziga xos
xususiyatlarini
aks
ettiradi.
Multimediali
korpus
da
matn
sinxronlashtirilgan video yoki audio yozuv bilan birga keladi, ayrim
filmlarda imo-ishoralar ham izohlanadi.
Sintaktik korpus
da gaplarga
sintaktik strukturaning maxsus murakkab izohlari qoʻyiladi.
Ta’limiy
korpus
rus maktablari oʻquv dasturiga moslashtirilgan janr va morfologik
izohlarni oʻz ichiga oladi.
RTMK adabiy til standarti talabiga mos zamonaviy rus tilidagi
matnlardan tashqari rus tilining tarixiy va geografik xilma-xilligini
namoyish etishga harakat qiladi. Shu bois bir qator korpuslardan
tarixiy
korpus
matnlarning alohida kolleksiyalari qadimgi rus tilini (XI-XIV
asrlarga tegishli, shuningdek, ukrain va belorus tillarining umumiy bobo
tili), eski rus tilini (XV-XVII asrlardagi rus tili) va cherkovslavyancha
tilning rus tilidagi versiyasini aks ettiradi. Alohida tarixiy korpus XI-XV
asrlardagi qayin poʻstloqli yorliqlar kabi oʻziga xos tarixiy manbani
birlashtiradi. Ammo
yozma matnlarning asosiy korpusi
tarkibiga XVIII
asrga taalluqli Karamzin va Pushkindan oldin yozilgan matnlarni qamrab
olgan. Bunday erta davrning tili zamonaviy oʻquvchi uchun, albatta,
doim ham tushunarli boʻlmaydi (rus tilining klassik manbalarida ham
shunday holat uchraydi). Shu bois ayni damda RTMKni tuzuvchilari
unda bir necha asrlar davomida soʻz yoki grammatik tuzilish tarixini
kuzatishga imkon beradigan tarixiy va zamonaviy korpusdagi umumiy
qidiruv imkoniyatini yaratishga harakat qilishmoqda.
Shevalar korpusi
butun Rossiyadagi an’anaviy rus shevalari
vakillaridan fonetik yozuvda va leksika hamda grammatikasining barcha
xususiyatlarini saqlab qolgan holda yozilgan ogʻzaki matnlarni oʻz ichiga
|
| |