|
Jobasi: I. Kirisiw Text mining haqqinda túsinik Text miningniń 5 tiykarǵi basqishi
|
bet | 4/4 | Sana | 14.01.2024 | Hajmi | 43,12 Kb. | | #137167 |
Bog'liq Jobasi I. Kirisiw Text mining haqqinda t sinik Text miningni 5II. Juwmqlaw
Juwmaq etip aytqanda, Text miningkompaniyalarǵa óz maǵlıwmatlarınan maksimal dárejede paydalanıwǵa járdem beredi, bul bolsa maǵlıwmatlarǵa tiykarlanǵan biznes qararların jaqsılaw qabıllawǵa alıp keledi. Maǵlıwmatlar ishki bolıwı múmkin (chatlar, elektron pochta xabarları, sorawlar, elektron kesteler, maǵlıwmatlar bazaları hám basqalar arqalı óz-ara baylanıslar ) yamasa sırtqı (social tarmaqlar, túsindiriwler saytları, jańalıqlar hám basqa veb-saytlar maǵlıwmatları ).
Ekinshi qádem - maǵlıwmatlarıńızdı tayarlaw. Text miningsistemaları sizdiń mashinańızdı úyreniw modelingizning kiriwlerin jaratıw ushın bir neshe NLP usıllarınan paydalanadı - júzimenizatsiya, analiz qılıw, lemmatizatsiya, stemming hám óshiriwdi toqtatıw. Keyin, tekstti analiz qılıw waqtı keldi. Bul bólimde biz tekstti qazib alıwdıń eń keń tarqalǵan eki usılı tiykarınan qanday islewin túsintiremiz: tekstti klassifikaciyalaw hám tekstti shıǵarıw.
Tekstti klassifikaciyalaw - tekstlerge olardıń mazmunına qaray tegler yamasa taypalar belgilew procesi. Avtomatlastırılgan tekst klassifikaciyası sebepli tekst maǵlıwmatlarınıń úlken kompleksin belgilew hám qolda qılıwdıń barlıq qıyınshılıqların basdan keshirmesten júdá qısqa waqıt ishinde jaqsı nátiyjelerge erisiw múmkin. Bul túrli tarawlarda qızıqlı qosımshalarǵa iye.
Qaǵıydalarǵa tiykarlanǵan sistemalar. Bul túrdegi tekstlerdi klassifikaciyalaw sistemaları lingvistik qaǵıydalarǵa tiykarlanadı. Qaǵıydalar degende biz málim bir lingvistik naǵıs hám teg ortasındaǵı insan tárepinen jaratılǵan assotsiatsiyalarni názerde qamtımız. Algoritm bul qaǵıydalar menen kodlangandan keyin, ol túrli lingvistik strukturalardı avtomatikalıq túrde anıqlawı hám tiyisli teglerdi belgilewi múmkin. Qaǵıydalar ádetde sintaktik, morfologiyalıq hám leksik qáliplerge siltemelerden ibarat. Olar semantik yamasa fonologik tárepler menen de baylanıslı bolıwı múmkin
III. Paydalanilǵan ádebiyatlar dizimi
Ananiadou, S. and McNaught, J. (Editors) (2006). Text Mining for Biology and Biomedicine. Artech House Books. ISBN 978-1-58053-984-5
Bilisoly, R. (2008). Practical Text Mining with Perl. New York: John Wiley & Sons. ISBN 978-0-470-17643-6
Feldman, R., and Sanger, J. (2006). The Text Mining Handbook. New York: Cambridge University Press. ISBN 978-0-521-83657-9
Hotho, A., Nürnberger, A. and Paaß, G. (2005). "A brief survey of text mining". In Ldv Forum, Vol. 20(1), p. 19-62
Indurkhya, N., and Damerau, F. (2010). Handbook Of Natural Language Processing, 2nd Edition. Boca Raton, FL: CRC Press. ISBN 978-1-4200-8592-1
Kao, A., and Poteet, S. (Editors). Natural Language Processing and Text Mining. Springer. ISBN 1-84628-175-X
Konchady, M. Text Mining Application Programming (Programming Series). Charles River Media. ISBN 1-58450-460-9
Manning, C., and Schutze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, MA: MIT Press. ISBN 978-0-262-13360-9
Miner, G., Elder, J., Hill. T, Nisbet, R., Delen, D. and Fast, A. (2012). Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Elsevier Academic Press. ISBN 978-0-12-386979-1
McKnight, W. (2005). "Building business intelligence: Text data mining in business intelligence". DM Review, 21-22.
|
| |