20
Sekans identifikatori foizini aniqlash (PID)
Ikki tekislangan oqsil ketma-ketligi uchun ketma-ketlik
identifikatorining
(PID) ulushi mos belgilar (aminokislotalar) bir xil bo‘lgan hizalangan pozitsiyalar
soniga (agar mavjud bo‘lsa, bo‘shliqlar ham) bo‘lingan holda aniqlanadi. Bu ta’rif
ortiqcha emas, chunki ketma-ketlik identifikatorining operativ ta’rifida ko‘pincha
noaniqliklar mavjud.
Turli xil usullarning umumiy ko‘rinishi
Ushbu
ishda
foydalaniladigan
kompyuter
dasturlarining
asosiy
xarakteristikalari 3-jadvalda keltirilgan (qo‘shimcha materialga qarang). Ko‘pgina
dasturlar 0 dan 100 foizgacha bo‘lgan diapazonda PID chegarasini tanlashga imkon
beradi, ammo ularning ba’zilari, masalan, Baliq va CD-hit, ma’lum
darajada
cheklangan diapazonlarga ega. Proteinning maksimal qabul qilingan uzunligi ko‘p
hollarda e’lon qilinmaydi,
cd-hit bundan mustasno, maksimal uzunlik maksimal
butun son bilan cheklangan. Dasturlar qayta ishlashga qodir bo‘lgan
ketma-
ketliklarning maksimal soni ham ushbu dasturlarning hech biri tomonidan e’lon
qilinmagan.
Barcha dasturlar kirish fayllarini FASTA formatida qabul qiladi,
lekin faqat
Decrease Redundancy, cd-hit va SkipRedundant bir xil formatdagi natijalarni beradi.
Baliq va BlastClust kabi boshqalar faqat chiqish faylida oqsil identifikatsiya kodlari
ro‘yxatini taqdim etadi. Shuningdek, biz chiqish kiritish tartibiga bog‘liq yoki
yo‘qligini tekshirdik, ya’ni ortiqcha bo‘lmagan chiqish ma’lumotlar to‘plami kirish
ma’lumotlar to‘plamidagi ketma-ketliklarning biz chiqish kiritish tartibiga bog‘liq
yoki yo‘qligini tekshirdik, ya’ni ortiqcha bo‘lmagan chiqish ma’lumotlar to‘plami
kirish ma’lumotlar to‘plamidagi ketma-ketliklarning almashtirishlaridan qat'i nazar,
har doim bir xil bo‘ladimi yoki yo‘qmi. Baliqlar va BlastClust holatlarida chiqish
kirish tartibiga bog‘liq emas. Biroq, chiqish kirish ketma-ketligi tartibiga bog‘liq
bo‘lgan boshqa dasturlarda bunday emas.
Bundan tashqari, barcha kompyuter
dasturlari tomonidan chiqarilgan ortiqcha bo‘lmagan
ketma-ketliklar soni kirish
ma’lumotlar to‘plamining almashtirishlariga bog‘liq emas.