• Sinov muhiti
  • Ma’lumotlar to‘plami
  • Aniq va tabiiy fanlar




    Download 1,9 Mb.
    Pdf ko'rish
    bet7/20
    Sana07.02.2024
    Hajmi1,9 Mb.
    #152551
    1   2   3   4   5   6   7   8   9   10   ...   20
    Bog'liq
    Biologik ketma –ketliklarni ma’lumot bazalari bo’yicha ko’plik

    5-rasm. Protein Data Bank 
    Dasturiy ta’minot 
    Besh xil kompyuter dasturidan foydalanilgan: Decrease Redundancy, cd-hit, 
    Pisces, BlastClust va SkipRedundant. Ulardan ba’zilari, masalan, cd-hit va Pisces, 
    mustaqil ilovalar bo‘lib, boshqalari BLAST (BlastClust) va EMBOSS 
    (SkipRedundant) kabi mustaqil paketlarning bir qismidir, biri esa veb-server sifatida 
    mavjud (ortiqchalikni kamaytirish). Ushbu tadqiqotda foydalanilgan kompyuter 
    dasturlari versiya raqami (ma’lum bo‘lsa) va URL manzili 1-jadvalda keltirilgan. 
    Identifikatsiya (PID) chegaralarining to‘rt xil foizi ishlatilgan: 40 %, 50 %, 75 % va 


    19 
    90 %. Kichikroq va qattiqroq qiymatlar ishlatilmadi, chunki ularni barcha 
    kompyuter dasturlari ishlatib bo‘lmaydi. 
    Sinov muhiti 
    Barcha mustaqil ilovalar, shu jumladan mustaqil dastur paketlarining bir qismi 
    bo‘lganlar bir xil sinov platformasida sinovdan o‘tkazildi: Intel Xenon 3,4 GHz (4 
    protsessor), 2 Gb tezkor xotira, Red Hat 4.1.2-13 (Linux versiyasi 2.6.22.2-42.fc6) 
    ). Barcha sinovdan o‘tgan mustaqil ilovalar kompyuterda protsessor yoki xotira 
    talablarini qo‘ymaydi. Biroq, ilovalar Needleman-Wunsch yoki Smit-Waterman 
    ketma-ketligini moslashtirish algoritmlaridan foydalanganligi sababli, ularning 
    ikkalasi ham vaqt va makon murakkabligi O(MxN) (M - ketma-ketliklar soni va N 
    - ketma-ketliklarning uzunligi), hisoblash talablari soni va soniga bog‘liq. ketma-
    ketliklarning o‘lchami va dasturning o‘zi emas. Decrease redundancy dasturi 
    o‘zining veb-serveri yordamida sinovdan o‘tkazildi, chunki mustaqil dasturiy 
    ta’minot tarqatilmagan. 
    Ma’lumotlar to‘plami 
    Turli xil kompyuter dasturlarini sinab ko‘rish uchun zarur bo‘lgan oqsil ketma-
    ketliklari to‘plamlari tasodifiy sonlar generatori yordamida UniProt ma’lumotlar 
    bazasidan olingan. Chiqarilgan ketma-ketliklar 100, 1000 va 10 000 ta protein 
    ketma-ketliklarining tasodifiy to‘plamlarini yaratish uchun ishlatilgan. Ushbu 
    protsedura faqat 100 dan kam qoldiqli kichik oqsillarni o‘z ichiga olgan ma’lumotlar 
    to‘plamini, kattaroq oqsilli ma’lumotlar to‘plamini (100-200 qoldiq, 200-300 qoldiq 
    va boshqalar) va faqat 1000 dan ortiq qoldiqli katta oqsillarni o‘z ichiga olgan 
    ma’lumotlar to‘plamini yaratish uchun takrorlandi. Shunday qilib, 2-jadvalda 
    (qo‘shimcha materialga qarang) jamlangan 33 ta ma’lumotlar to‘plami tuzildi. 
    Ularning barchasi 1-jadvaldagi kompyuter dasturlari uchun kirish sifatida ishlatilgan 
    (qo‘shimcha materialga qarang), veb-server protsessorining cheklovlari tufayli faqat 
    100 yoki undan kam ketma-ketlikdagi ma’lumotlar to‘plamini qayta ishlash mumkin 
    bo‘lgan Ortiqchalikni kamaytirish bundan mustasno. 

    Download 1,9 Mb.
    1   2   3   4   5   6   7   8   9   10   ...   20




    Download 1,9 Mb.
    Pdf ko'rish