|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)KORPUS LINGVISTIKASI
Manzura Abjalova
~ 57 ~
✓
xotira va biografik adabiyotlar;
✓
jurnal publitsistikasi va adabiy tanqid;
✓
gazeta publitsistikasi va yangiliklari;
✓
ilmiy, ilmiy-ommabop va oʻquv matnlari;
✓
diniy va diniy-falsafiy matnlar;
✓
ishlab chiqarishga aloqador va texnik matnlar;
✓
rasmiy-idoraviy va yuridik matnlar;
✓
kundalik matnlar (shu jumladan, nashr etishga moʻljallanmagan
matnlar: shaxsiy yozishmalar, kundaliklar va boshqalar) qamrab olingan.
Asosiy korpusning
XVIII asr oʻrtalari – XX asr yarimiga tegishli
matnlar
qismida ham nasrning turli janrlari (badiiy adabiyot, shu
jumladan, nasriy dramaturgiya, ilmiy matnlar, publitsistika, shaxsiy
yozishmalar, hujjatlar) mavjud, elektron versiyalar va zamonaviy
nashrlar kam boʻlsa-da, ushbu davr uchun badiiy adabiyotning ulushi XX
asrning ikkinchi yarmiga qaraganda ancha yuqori. Ushbu davrga (XIX
asr oxirigacha) tegishli matnlar rus adabiy tilining rivojlanishida hissasi
juda katta boʻlgani uchun tarjima matnlari bilan kiritilgan.
Eski orfografiya asosida yozilgan matnlar (1918-yilgacha)ning
oxirgi qayta nashrlari oʻzgargan orfografiya boʻyicha berilgan. Lekin
bugungi kunda asl eski orfografiya boʻyicha yozilgan matnlar salmogʻi
korpusda oshib bormoqda. Bunday matnlardagi soʻzshakllar 2022-yilgi
statistikada 12.7 mln.ni tashkil etmoqda. Bunday ulkan hajmni alohida
korpus tarzida shakllantirish ham mumkin. Shunda bunday korpusda
bugungi kundagi soʻzning eski rus orfografiyasidagi variantini maxsus
qidiruv orqali toppish qulaylashadi. Masalan,
копейка soʻzining
копѣйка
variantini topish mumkin.
RTMK tarkibidagi tarixiy korpus bir nechta kichik korpuslarga
bo‘lingan:
● cherkov slavyan korpusi: http://ruscorpora.ru/search-orthlib.html
(hajmi taxminan 500 ming birlik);
● o‘rta rus: http://ruscorpora.ru/search-mid_rus.html (taxminan 3
mln birlik);
|
| |