|
Turli xil kompyuter dasturlari o‘rtasidagi o‘zaro bog‘liqlik
|
bet | 10/18 | Sana | 17.02.2024 | Hajmi | 1,73 Mb. | | #158021 |
Bog'liq Biologik ketma-ketlikni taqqoslash. Gomologik ketma-ketliklar 2.2. Turli xil kompyuter dasturlari o‘rtasidagi o‘zaro bog‘liqlik
Muhim masala - bir xil kirish ma’lumotlar to‘plami va bir xil PID chegara qiymati bilan oziqlanadigan turli dasturlarning natijalarini taqqoslash. Ikki ortiqcha bo‘lmagan ma’lumotlar to‘plami o‘rtasidagi o‘xshashlik kattaroq ma’lumotlar to‘plamida joylashgan kichikroq ma’lumotlar to‘plamidagi oqsillarning foizi sifatida o‘lchanadi. 5-jadvalda turli dasturlar va bir xil chegara qiymatlari o‘rtasidagi o‘xshashlik qiymatlari ko‘rsatilgan. O‘rtacha 90 % atrofida, 88 % dan 100 % gacha. 5-jadvalda ko‘rsatilgan natijalar o‘rtasidagi nomuvofiqlikni bir nechta faktlar bilan izohlash mumkin; birinchidan, turli dasturlar turli xil tekislash algoritmlarini qo‘llaydi - bu, xususan, global tekislashdan foydalanadigan SkipRedundant-ga tegishli, boshqalari esa mahalliy tekislashdan foydalanadi; ikkinchidan, agar ikki yoki undan ortiq dastur bir xil tekislash algoritmidan foydalansa ham, algoritmni nozik sozlash har xil bo‘lishi mumkin; uchinchidan, klaster vakillarini tanlash klasterlash algoritmiga qarab turli usullar bilan amalga oshiriladi.
Bir xil kirish ma’lumotlar to‘plamiga va bir xil PID chegarasiga asoslangan har biri boshqa dastur bilan olingan to‘rtta ortiqcha bo‘lmagan ma’lumotlar
to‘plamining bir-biriga mos kelishiga misol 2-rasmda keltirilgan. bir xil kirish ma’lumotlar to‘plami va maksimal PID bilan ta’minlangan dasturlar hajmi va mazmunida sezilarli darajada o‘xshashlikka ega.
Protein ketma-ketligi ma’lumotlar bazalaridan ortiqcha narsalarni olib tashlash uchun keng tarqalgan bo‘lib foydalaniladigan turli xil kompyuter dasturlarini keng miqyosda taqqoslash amalga oshirildi. Turli xil hisoblash yondashuvlari aniq bir oz boshqacha natijalar beradi. Agar bu mutlaqo kutilmagan bo‘lmasa, bu algoritmlarning barchasida bir nechta farqlar kuzatilganligi sababli, bu juda qiziq. Dasturni afzal ko‘rish ko‘p jihatdan texnik masalalarga bog‘liq bo‘lib, oddiy va foydalanuvchilarga qulay bo‘lgan mustaqil bajariladigan dastur mavjudligi, bu ayniqsa keng ko‘lamli tadqiqotlar uchun jozibador bo‘lib, mahalliy serverni o‘rnatishda muammolarni bartaraf etadigan veb-server mavjudligiga emas. dasturiy ta’minotning nusxalari. Ko‘pgina bioinformatikachilar ortiqcha miqdorni kamaytirish odatiy va oddiy qadam bo‘lib, mavjud dasturlarning har qandayida amalga oshirilishi mumkin deb hisoblashadi. Biroq, biz turli dasturlar tomonidan chiqarilgan ortiqcha bo‘lmagan oqsil ketma-ketliklarining ro‘yxatlari, hatto ketma- ketliklarning ortiqcha kirish to‘plami bir xil bo‘lsa va ketma-ketlik identifikatorining foiz chegarasi bir xil bo‘lsa ham, har xil ekanligini hujjatlashtirdik. Taxminan 10 % gacha bo‘lgan kelishmovchiliklar juda keng tarqalgan.
Bu ushbu kompyuter dasturlari ortiqcha narsalarni olib tashlashda qiyinchiliklarga duch kelganligini bildirmaydi. Darhaqiqat, ularning barcha natijalari chiqishlarda guruhlangan yozuvlar o‘rtasidagi qoldiq o‘xshashlik nuqtai nazaridan maqbuldir. Biroq, bu aniq ko‘rsatib turibdiki, bioinformatikada yaxshi amaliyot oqsillar ketma-ketligi ansambllaridan ortiqcha narsalarni olib tashlash uchun bir nechta kompyuter ilovalaridan foydalanish bo‘lishi kerak. Shunday qilib, barcha hisob-kitoblar ikki yoki undan ortiq ortiqcha bo‘lmagan ketma-ketliklar to‘plamidan foydalangan holda parallel ravishda amalga oshiriladi va hisob- kitoblarning yakuniy natijalarini taqqoslash ularning ichki qiymatini kuchaytiradi.
|
| |