Manzura Abjalova
~ 92 ~
Scritto)
ichiga oladi. So‘z turkumlari teglangan,
xolos.
Nemis
tili
korpusi
Cosmas II
(das Projekt COSMAS II)
http://www.ids-
mannheim.de/cosmas2/
Umumiy hajmi 8,7 milliard so‘zdan ortiq
bo‘lgan 100 dan ortiq turli xil kichik
korpuslarni birlashtirgan Germaniya milliy
korpusining ikkinchi versiyasi. Morfologik
va sintaktik izohlarni o‘z ichiga oladi.
Fransuz tilining leksik
ma’lumotlari
bazasi
FRANTEXT
(le corpus Frantext)
http://artfl-project.uchicago.edu
Afsuski, fransuz tilining yaxshi milliy
korpusi mavjud emas. Mazkur korpusning
umumiy hajmi 200 mln so‘zdan ortiq.
XVIII-XX asr matnlar to‘plangan, ammo
lingvistik izohlar berilmagan.
Yunon milliy korpusi
(Εθνικός
Θησαυρός
Ελληνικής Γλώσσας)
http://hnc.ilsp.gr/en
XX asrning ikkinchi yarmi va XXI asr
boshlariga oid turli janrdagi 47 milliondan
ortiq so‘zlardan iborat korpus. Lemmalar
izohi va so‘z turkumlari teglanishiga ega.
Xitoy tilining Lankaster
korpusi
(LCMC,
Lancaster
Corpus
of
Mandarin
Chinese)
www.lancaster.ac.uk/fass/projects/
corpus/ LCMC
Xitoy tilining zamonaviy mandarin tilida
yozilgan
matnlardan
iborat
bo‘lib,
taxminan 1 mln LB mavjud. Matnlarga
meta-belgilar ko'rsatiladi, so‘z turkumi
teglari mavjud.