• Sinov muhiti
  • Ma’lumotlar to‘plami
  • Aniq va tabiiy fanlar




    Download 1,73 Mb.
    bet6/18
    Sana17.02.2024
    Hajmi1,73 Mb.
    #158021
    1   2   3   4   5   6   7   8   9   ...   18
    Bog'liq
    Biologik ketma-ketlikni taqqoslash. Gomologik ketma-ketliklar

    4-rasm. Protein Data Bank


    Dasturiy ta’minot
    Besh xil kompyuter dasturidan foydalanilgan: Decrease Redundancy, cd-hit, Pisces, BlastClust va SkipRedundant. Ulardan ba’zilari, masalan, cd-hit va Pisces, mustaqil ilovalar bo‘lib, boshqalari BLAST (BlastClust) va EMBOSS (SkipRedundant) kabi mustaqil paketlarning bir qismidir, biri esa veb-server sifatida mavjud (ortiqchalikni kamaytirish). Ushbu tadqiqotda foydalanilgan kompyuter dasturlari versiya raqami (ma’lum bo‘lsa) va URL manzili 1-jadvalda keltirilgan.
    Identifikatsiya (PID) chegaralarining to‘rt xil foizi ishlatilgan: 40 %, 50 %, 75 % va
    90 %. Kichikroq va qattiqroq qiymatlar ishlatilmadi, chunki ularni barcha kompyuter dasturlari ishlatib bo‘lmaydi.

    Sinov muhiti


    Barcha mustaqil ilovalar, shu jumladan mustaqil dastur paketlarining bir qismi bo‘lganlar bir xil sinov platformasida sinovdan o‘tkazildi: Intel Xenon 3,4 GHz (4 protsessor), 2 Gb tezkor xotira, Red Hat 4.1.2-13 (Linux versiyasi 2.6.22.2-42.fc6)
    ). Barcha sinovdan o‘tgan mustaqil ilovalar kompyuterda protsessor yoki xotira talablarini qo‘ymaydi. Biroq, ilovalar Needleman-Wunsch yoki Smit-Waterman ketma-ketligini moslashtirish algoritmlaridan foydalanganligi sababli, ularning ikkalasi ham vaqt va makon murakkabligi O(MxN) (M - ketma-ketliklar soni va N
    - ketma-ketliklarning uzunligi), hisoblash talablari soni va soniga bog‘liq. ketma- ketliklarning o‘lchami va dasturning o‘zi emas. Decrease redundancy dasturi o‘zining veb-serveri yordamida sinovdan o‘tkazildi, chunki mustaqil dasturiy ta’minot tarqatilmagan.

    Ma’lumotlar to‘plami


    Turli xil kompyuter dasturlarini sinab ko‘rish uchun zarur bo‘lgan oqsil ketma- ketliklari to‘plamlari tasodifiy sonlar generatori yordamida UniProt ma’lumotlar bazasidan olingan. Chiqarilgan ketma-ketliklar 100, 1000 va 10 000 ta protein ketma-ketliklarining tasodifiy to‘plamlarini yaratish uchun ishlatilgan. Ushbu protsedura faqat 100 dan kam qoldiqli kichik oqsillarni o‘z ichiga olgan ma’lumotlar to‘plamini, kattaroq oqsilli ma’lumotlar to‘plamini (100-200 qoldiq, 200-300 qoldiq va boshqalar) va faqat 1000 dan ortiq qoldiqli katta oqsillarni o‘z ichiga olgan ma’lumotlar to‘plamini yaratish uchun takrorlandi. Shunday qilib, 2-jadvalda (qo‘shimcha materialga qarang) jamlangan 33 ta ma’lumotlar to‘plami tuzildi. Ularning barchasi 1-jadvaldagi kompyuter dasturlari uchun kirish sifatida ishlatilgan (qo‘shimcha materialga qarang), veb-server protsessorining cheklovlari tufayli faqat 100 yoki undan kam ketma-ketlikdagi ma’lumotlar to‘plamini qayta ishlash mumkin bo‘lgan Ortiqchalikni kamaytirish bundan mustasno.

      1. Download 1,73 Mb.
    1   2   3   4   5   6   7   8   9   ...   18




    Download 1,73 Mb.