Linqvistik təminat vasitələri
Mətni axtarış sistemlərində tammətnli sənədlərlə işləyərkən təbii dilin emalı vasitələrindən istifadə edilir. Bu vasitələr sözügedən sistemlərin son dərəcə mürəkkəb komponentləridir. Təbii dilin emalı vasitələri mətn sənədlərindəki və sorğulardakı term- ləri (söz və söz birləşmələrini, frazaları) təhlil edib onların məzmununu aydınlaşdırır, termlər arasındakı münasibətləri aşkarlayır və səmərəli axtarışı təmin edir. Bu məqsədlə mətni axtarış sistemlərində linqvistik təminat vasitələri kompleksindan istifadə edilir. Bu kompleksə müxtəlif lüğətlər, tezauruslar, sistemin predmet oblastının ontoloji xüsusiy- yətlərini əks etdirən materiallar daxildir.
Sistem lüğətləri. Təbii dilin emalı ilə məşğul olan mətni axtarış sistemlərində həm ümumdil leksikası, həm də predmet oblastı leksikası üzrə lüğətlərdən istifadə edilir. Bu lüğətlər mətnin morfoloji təhlilinə və axtarış zamanı müxtəlif qrammatik formalardakı sözləri tanımağa imkan verir.
Tezauruslar. Mətn sənədlərinin formal təqdimatında tezaurus adlanan xüsusi lüğətlər mühüm rol oynayır. Tezaurus – dilin əsas anlayışları lüğətidir. Tezaurus həm də sorğunu genişləndirmək üçündür.
Ontoloji materiallar. Təbii dildə təqdim edilmiş mətn sənədlərinin və axtarış sorğularının adekvat dərki (interpretasiyası) üçün sistem predmet oblastının əsas anlayışlarını və onların arasındakı müxtəlif semantik əlaqələri təyin edən vasitə olmalıdır ki, buna da ontoloji materiallar deyilir. Buraya predmet oblastının tezaurusu, birinci dərəcəli məntiq dilləri və s. aiddir.
Axtarış modelləri
Axtarış modeli anlayışı. Axtarış modeli dedikdə, sənədlərin və sorğuların təqdimatı üsulları və relevantlıq kriterisinin növü və bunların əlaqələndirilməsi nəzərdə tutulur.
Sadə axtarış modeli. Bu modellər deskriptorlu və klassifikatorlu axtarışı təsvir edir.
Aidi axtarış modeli. Mətndə tez-tez rast gələn söz və söz birləşmələri əsasında
Məntiqi (Bul) axtarış modeli. Bu halda VƏ, VƏ YA, DEYİL operatorlarından istifadə edilir.
Vektor axtarış modeli. Bu halda sənəd və sorğular vektor kimi təsəvvür edilir. Sənəddəki və sorğudakı söz və sözbirləşmələrinin lüğətdəki koordinatları əsas rol oynayır. Axtarılan söz sənəddə varsa, onun koordinatına 1, əks halda 0 yazılır.
Mətni axtarış sistemlərinin vəziyyəti və yeni tələblər
İlk mətni axtarış sistemləri kitabxana işi üçün nəzərdə tutulsa da, hal-hazırda bu, insan fəaliyyətinin bir çox sahələrinə uğurla tətbiq edilir. Xüsusən qlobal informasiya məkanı olan Veb-lə bağlı təkamül intensiv xarakter almışdır.
Mətni axtarış sahəsinin problemləri. Müasir dövrdə mətni axtarış problematikası olduqca genişlənmişdir. Belə ki, buraya: konkret axtarış modellərinin inkişafı; sistemlər üzərində eksperiment aparılması, onların testləşdirilməsi və qiymətləndirilməsi metodo- logiyası; mətni axtarışın reallaşdırılması metodları; mətni axtarış və VB texnologiya- larının inteqrasiya edilməsi üçün tətbiq edilən yanaşmalar; Veb mühitində axtarış; verilənlərin sıxılması metodları; sorğuların emalı səmərəliliyinin qiymətləndirilməsi; təbbi dilin emalı; mətn sənədlərinin təsnifləşdirilməsi və klasterləşdirilməsi metodları; elektron kitabxanalardakı informasiya axtarışı üzrə proqram əlavələri; mətnlərin dərin təhlili; multimediya informasiyasının indeksləşdirilməsi və axtarışı texnologiyaları;
―insan – kompüter‖ interfeysləri və s. aiddir. Bu istiqamətlərin hamısında böyük uğurlar əldə edilmişdir.
Mətn sistemlərinin funksional imkanlarının genişləndirilməsi
Mətni axtarış sistemləri həm baza funksiyalarının icra mexanizmlərinin təkmilləş- diriliməsi, həm də əlavə imkanların yaradılması istiqamətində inkişaf etdirilir. Əlavə imkanlardan bəziləri aşağıdakilardır:
Axtarış dəqiqliyinin yüksəldilməsi. İstifadəçi sorğusundaskı termlər müxtəlif qiy- mətlilik nümayiş etdirdiyindən, bəzi sistemlər sorğuda iştirak edən termlərin əhəmiy- yətini xarakterizə edən əmsallar da verir. Bu informasiya relevantlığın qiymətləndiril- məsi zamanı istifadə edilərək axtarış dəqiqliyini yüksəltməyə imkan verir.
Sorğulara görə sənədlərin ranqlaşdırılması. Bir sıra səbəblərə görə mətni axtarış
dərəcədə uyğun gələn sənədləri sorğuya yaxınlıq dərəcəsinə görə ardıcıl düzmək lazım gəlir.
Relevantlıq üzrə əks-əlaqə. Bu, axtarışın nəticəsi istifadəçini təmin etmədikdə sor- ğunu dəqiqləşdirmək üçün yaradılan imkandır. Yəni axtarışın nəticəsi kimi təqdim edilmiş sənədlərin siyahısında istifadəçini təmin etməyən sənədlərin qeyd edilməsi yolu ilə axtarışın dəqiqləşdirilməsi həyata keçirilir.
İstifadəçi sorğularının avtomatik genişləndirilməsi. Bu, istifadəçi sorğusuna avto- matik əlavələr edilməsi yolu ilə edilir və axtarışın səmərəliliyini artırır.
Sənədlərin avtomatik indeksləşdirilməsi. Bu, işi əhəmiyyətli dərəcədə sürətləndirir.
Multi-dilli axtarış. Bu, bir neçə təbii dildə təqdim edilmiş sənədləri axtarmağa im- kan verir. Burada əsas problem sənəd və ya onun fraqmentinin hansı dildə tərtib edil- diyini düzgün təyin etməkdən ibarətdir.
Kross-dilli axtarış. Bu o halda tətbiq edilir ki, sorğu bir dildə, axtarılan sənəd isə başqa dildə tərtib edilmiş olsun. Burada, ilk növbədə, sorğu və sənədin hansı dillərdə tərtib edildiyi müəyyən edilir, sonra ya sorğu sənədin, ya da sənəd sorğunun dilinə tərcümə edilir.
VB sistemlərində mətni axtarış. VB resurslarının mətn sənədləri kolleksiyaları ilə inteqrasiya edilməsi mühüm əhəmiyyət daşıyır. Bir sıra relyasiyalı və obyekt-relyasiyalı serverlərdə, məsələn, İBM kompaniyasının DB2, Oracle kompaniyasının Oracle Corp., Microsoft Corp. kompaniyasının SQL Server 7.0 və SQL-server 2000 VBİS-lərində mətni axtarış mexanizmləri mövcuddur. Lakin bu sistemlərdəki axtarış yalnız məntiqi (bul) modelə əsaslanır.
Veb-də mətn resurslarının axtarışı. Veb resursları zənginləşdikcə bu mühitdə mətni axtarış aktuallaşır. Çünki ənənəvi naviqasiya mexanizmləri informasiya resurslarına kifayət qədər operativ müraciəti təmin etmir. Veb mühitində ilk mətni axtarış axtarış maşınları vasitəsilə icra edilirdi və bu zaman yalnız aidi axtarış aparmaq mümkün idi. Sonralar Veb mühitində məntiqi (bul) axtarışı tətbiq edildi. Hal-hazırda bir sıra universal və predmet oblastına yönəldilmiş Veb-axtarış sistemləri mövcuddur. Bunlardan: çoxdilli AltaVista, Yahoo!, Google və s. nəhəng axtarış sistemlərini misal göstərmək olar.
Sözügedən istiqamətdə növbəti ciddi uğurlar XML platforması standartlarına əsaslanan yeni nəsil texnologiya ilə bağlı olacaqdır. Çünki bu texnologiya axtarış
Mətni axtarış sistemləri qarşısında qoyulan əsas tələblər aşağıdakılardır: Çox iri sənəd kolleksiyaları ilə səmərəli mətni axtarışın təmin edilməsi;
Sənədin və sorğunun məzmununu daha yaxşı təqdim edən metodların işlənib hazırlanması;
Mətn, şəkil, audio, video və s. təbiətli sənədlərin birgə emalı imkanının yaradılması;
Həm statik sənədlərin, həm də sənəd axınlarındakı sənədlərin axtarışını təmin edən səmərəli metodların işlənib hazırlanması;
Mətni axtarış sistemlərinin qiymətləndirilməsi metodologiyasının yaradılması.
|