47
Shu ma’noda statistika yuzasidan shunday hazilomuz gap aytiladi:
“Yolg’onning uch
turi bor: a) yolg’on; b) g’irt yo’lg’on; c) statistika”.
Statistikaning til hodisalariga tatbiq etilishi natijasida
lingvostatistika sohasi
shakllandi, unda til birliklari, lisoniy hodisalar, matnlar statistik tahlil etiladi.
Matnning
statistik tahlili – tilni ehtimollik belgilariga ko’ra tahlil qilish, til hodisalarini statistik
xarakteristikalari asosida baholash demakdir. Til birligining
gapda yoki matnda
qo’llanish chastotasi (sur’ati) ehtimollik deyiladi. Til hodisalari haqidagi haqiqatlar
lingvostatistik tadqiqotlar yordamida aniqlanadi. Masalan, o’zbek tili uchun qaysi
bo’g’in
strukturasi tipik ekanligini, gap modellaridan qaysi biri eng asosiy konstruksiya
ekanligini, bosh kelishikdagi otlarning asosan qaysi gap bo’lagi vazifasida kelishini,
tanlangan matnda so’z turkumlarining qay darajada ishlatilishini
aniqlash uchun
lingvostatistik tahlillarga ehtiyoj seziladi.
Til hodisalarini statistik metod asosida tahlil qilish uchun doim ma’lum bir matn
yoki matnlar to’plami olinadi. Ular badiiy adabiyotdan, gazeta va jurnallardan,
publitsistik maqolalardan,
ilmiy asarlardan, dialektologlarning jonli nutqidan yozib
olgan materiallaridan tanlanadi. Statistik xususiyati o’rganilayotgan muayyan matnlar
“tanlama” deyiladi.
Tanlamaning hajmi tekshirilayotgan
hodisalarning umumiy
sonidir, uni
“H” bilan belgilash mumkin. Masalan, 100 ta so’z; 37 ta bosh kelishik
shaklidagi ot kabi. Aniqlanayotgan hodisani ko’rsatadigan miqdor (masalan, ot oldida
aniqlovchi vazifasida keladigan takrorlangan otlar miqdori)
absolyut chastota
hisoblanadi, uni
“M” harfi bilan belgilash mumkin. 37 ta otdan 30 tasining aniqlovchi
vazifasida kelishi absolyut chastotadir. Absolyut chastota (M) ning tanlama hajmi (H)
ga nisbati (M/H) dan
nisbiy chastota kelib chiqadi.
48
Nisbiy chastota “P”
harfi bilan
belgilanadi. Nisbiy chastota uch xil usul bilan aniqlanadi:
a) oddiy kasr hisobida: P = M/H
b) protsent asosida: P = M×100/H
c) promil hisobida: P = M × 1000/H.
Matnning statistik tahlilida Zif qonunidan o’rinli foydalaniladi. Katta hajmdagi
matnlarda har bir so’zning qanchalik tez takrorlanishini (chastotasini) va ularning
takrorlanish
tezligini hisoblashda Zif qonuni amal qiladi.
49
Bunda so’zning chastotasi