|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)Manzura Abjalova
~ 32 ~
son, fe’l, ravish, olmosh so‘z turkumlarini aniqlaydi. Korpus
lingvistikasida bu so‘zning turkumlik tegi hisoblanadi. So‘z turkumlarini
teglash (ingliz tilida bu
part-of-speech tagging
(
POS tagging
yoki
PoS
tagging
yoxud
POST
), rus tilida
частеречная разметка
deyiladi)
matnni avtomatik qayta ishlash bosqichi boʻlib, uning vazifasi matnda
qoʻllangan soʻz (shakl)larning turkumi va grammatik xususiyatlarini
aniqlash hisoblanadi. Shu vazifasi bilan POS-tagging matnni avtomatik
tahlil qilishning dastlabki bosqichlaridan biri sanaladi.
Korpus
bazasidagi
birliklarni
annotatsiyalash
uchun
so‘z
turkumlarini teglash (
POS-tagging,
Part of Speech tagging – so‘z
turkumini anglatuvchi belgi qo‘yish) muhim ahamiyat kasb etadi. STni
bunday belgilash zarurati kompyuterning omonimlarni ajratmasligi bilan
bog‘lanadi.
Yaratilgan korpuslarning bunday xususiyatlari va o‘ziga xosliklari
ular bilan ishlash imkoniyati hamda korpuslarning ahamiyatini oshiradi.
Korpus lingvistikasida so‘z turkumlarini teglash, grammatik
kategoriyalarni teglash
32
va so‘zlarni toifalashda noaniqliklarni bartaraf
etish uchun so‘zni faqat uning lug‘atdagi shakliga asoslanib emas, balki
matn (jumla)dagi ifodasi bo‘yicha uning turkumlik tegi va jumla
(xatboshi, ibora)da boshqa so‘zlar bilan birikish imkoniyatini hisobga
olish muhim sanaladi. Gap bo‘laklari teglarini identifikatsiyalash bir
muncha qiyin jarayon. Sababi o‘zbek tilidagi jamiki so‘zlarni universal
holda 12 turkum doirasida teglash imkoniyati yo‘q. So‘z uning jumla
tarkibida reallashish holati va N-gramm
33
so‘zlarning semantik
valentligiga
binoan
polifunksional bo‘lishi mumkin. Masalan:
“
Shifoxonaga bemorni keltirishdi
” va “
Shifoxonaga bemor odamni
keltirishdi
” jumlalarining 1-sida
bemor
so‘zi turkumlik belgisi (kim?
so‘rog‘iga javob berayotgan tushum kelishigidagi so‘z)ga ko‘ra ot
turkumi, 2-jumlada esa (qanday? so‘rog‘iga javob beryapti) sifat turkumi
32
Asiryan, A.K. 2017. Сравнение инструментов морфологической разметки.
Научный
взгляд в будущее, 10.30888/2415-7538.2017-07-01-027.
33
Abjalova, M.A. 2020. Tahrir va tahlil dasturlarining lingvistik modullari. [Matn] :
monografiya / M.A. Abjalova. - Toshkent: Nodirabegim. –176 b. ISBN 978-9943-6939-0-6. – B.
73-77.
|
| |