2.2. Turli xil kompyuter dasturlari o‘rtasidagi o‘zaro bog‘liqlik
Muhim masala - bir xil kirish ma’lumotlar to‘plami va bir xil PID chegara
qiymati bilan oziqlanadigan turli dasturlarning natijalarini taqqoslash. Ikki ortiqcha
bo‘lmagan ma’lumotlar to‘plami o‘rtasidagi o‘xshashlik kattaroq ma’lumotlar
to‘plamida joylashgan kichikroq ma’lumotlar to‘plamidagi oqsillarning foizi
sifatida o‘lchanadi. 5-jadvalda turli dasturlar va bir xil chegara qiymatlari o‘rtasidagi
o‘xshashlik qiymatlari ko‘rsatilgan. O‘rtacha 90 % atrofida, 88 % dan 100 % gacha.
5-jadvalda ko‘rsatilgan natijalar o‘rtasidagi nomuvofiqlikni bir nechta faktlar bilan
izohlash mumkin; birinchidan, turli dasturlar turli xil tekislash algoritmlarini
qo‘llaydi - bu, xususan, global tekislashdan foydalanadigan SkipRedundant-ga
tegishli, boshqalari esa mahalliy tekislashdan foydalanadi; ikkinchidan, agar ikki
yoki undan ortiq dastur bir xil tekislash algoritmidan foydalansa ham, algoritmni
nozik sozlash har xil bo‘lishi mumkin; uchinchidan, klaster vakillarini tanlash
klasterlash algoritmiga qarab turli usullar bilan amalga oshiriladi.
Bir xil kirish ma’lumotlar to‘plamiga va bir xil PID chegarasiga asoslangan har
biri boshqa dastur bilan olingan to‘rtta ortiqcha bo‘lmagan ma’lumotlar
27
to‘plamining bir-biriga mos kelishiga misol 2-rasmda keltirilgan. bir xil kirish
ma’lumotlar to‘plami va maksimal PID bilan ta’minlangan dasturlar hajmi va
mazmunida sezilarli darajada o‘xshashlikka ega.
Protein ketma-ketligi ma’lumotlar bazalaridan ortiqcha narsalarni olib tashlash
uchun keng tarqalgan bo‘lib foydalaniladigan turli xil kompyuter dasturlarini keng
miqyosda taqqoslash amalga oshirildi. Turli xil hisoblash yondashuvlari aniq bir oz
boshqacha natijalar beradi. Agar bu mutlaqo kutilmagan bo‘lmasa, bu
algoritmlarning barchasida bir nechta farqlar kuzatilganligi sababli, bu juda qiziq.
Dasturni afzal ko‘rish ko‘p jihatdan texnik masalalarga bog‘liq bo‘lib, oddiy va
foydalanuvchilarga qulay bo‘lgan mustaqil bajariladigan dastur mavjudligi, bu
ayniqsa keng ko‘lamli tadqiqotlar uchun jozibador bo‘lib, mahalliy serverni
o‘rnatishda muammolarni bartaraf etadigan veb-server mavjudligiga emas. dasturiy
ta’minotning nusxalari. Ko‘pgina bioinformatikachilar ortiqcha miqdorni
kamaytirish odatiy va oddiy qadam bo‘lib, mavjud dasturlarning har qandayida
amalga oshirilishi mumkin deb hisoblashadi. Biroq, biz turli dasturlar tomonidan
chiqarilgan ortiqcha bo‘lmagan oqsil ketma-ketliklarining ro‘yxatlari, hatto ketma-
ketliklarning ortiqcha kirish to‘plami bir xil bo‘lsa va ketma-ketlik identifikatorining
foiz chegarasi bir xil bo‘lsa ham, har xil ekanligini hujjatlashtirdik. Taxminan 10 %
gacha bo‘lgan kelishmovchiliklar juda keng tarqalgan.
Bu ushbu kompyuter dasturlari ortiqcha narsalarni olib tashlashda
qiyinchiliklarga duch kelganligini bildirmaydi. Darhaqiqat, ularning barcha
natijalari chiqishlarda guruhlangan yozuvlar o‘rtasidagi qoldiq o‘xshashlik nuqtai
nazaridan maqbuldir. Biroq, bu aniq ko‘rsatib turibdiki, bioinformatikada yaxshi
amaliyot oqsillar ketma-ketligi ansambllaridan ortiqcha narsalarni olib tashlash
uchun bir nechta kompyuter ilovalaridan foydalanish bo‘lishi kerak. Shunday qilib,
barcha hisob-kitoblar ikki yoki undan ortiq ortiqcha bo‘lmagan ketma-ketliklar
to‘plamidan foydalangan holda parallel ravishda amalga oshiriladi va hisob-
kitoblarning yakuniy natijalarini taqqoslash ularning ichki qiymatini kuchaytiradi.
|