-rasm. Nucleic Acids Research




Download 1,9 Mb.
Pdf ko'rish
bet4/20
Sana07.02.2024
Hajmi1,9 Mb.
#152551
1   2   3   4   5   6   7   8   9   ...   20
Bog'liq
Biologik ketma –ketliklarni ma’lumot bazalari bo’yicha ko’plik

1-rasm. Nucleic Acids Research 
INSDC bir qator asosiy hamkorlik vositalarini ishlab chiqish va texnik xizmat 
ko‘rsatish orqali ma’lumotlar almashinuvi quvurlarini qo‘llab-quvvatlaydi. Ulardan 
eng qadimiysi INSDC Feature Table Document bo‘lib, unda funksional izohlash 
konventsiyalari ham sintaktik, ham semantik darajada tasvirlangan. Odatda-yiliga 
ikki marta yangilanadi, eng soʻnggi versiyasini quyidagi manzilda topish mumkin: 
http://www.insdc.org/documents/feature_table.html. Vaqt o‘tishi bilan ushbu 



spetsifikatsiya INSDCdan tashqarida ma’lumotlarni taqdim etish, almashish va tahlil
vositalariga kiritish formati darajasida ham, xususiyat kalitiga asoslangan
annotatsiya tizimlari va texnologiyalarini ishlab chiqish uchun boshlang‘ich nuqta
sifatida ishlatiladigan bioinformatika standartini aniqladi. va sifatlovchi ta’riflari.
Hamkorlikning ikkinchi asosiy vositasi bu yagona qo‘shilish tizimidir.
Qo‘shilish nom maydonini almashish orqali INSDC qo‘shilishlari hamkorlar
xizmatlarida universal bo‘lib, so‘rovlar saytidan qat'i nazar, bitta ulanish bir xil
ketma-ketlikni qaytaradi [12].
Uchinchi asosiy hamkorlik vositasi - bu SRA asosidagi ma’lumotlar modeli.
SRAda namuna, eksperimental dizayn, kutubxona yaratish va mashina
konfiguratsiyasiga oid ma’lumotlarga ega metama’lumotlar bir qator XML
hujjatlarida ifodalanadi va almashiladi. Ketma-ket o‘qish, sifat va o‘qishni
moslashtirish ma’lumotlari ikkilik ma’lumotlar fayllarida saqlanadi va SRA
metama’lumotlar qatlami bilan bog‘lanadi.
Muhim ahamiyatga ega bo‘lgan yana bir hamkorlik quroli INSDC maqom
konventsiyasidir (http://www.insdc.org/insdc_status.html), unda INSDC hamkorlari
bo‘ylab berilgan yozuvlar uchun barqaror mavjudlik darajasi saqlanadi. Ushbu tizim
to‘liq ochiq ma’lumotlar, nashrdan oldin maxfiy saqlangan ma’lumotlar va
yangilangan takomillashtirilgan ma’lumotlar mavjud bo‘lganda bostirilgan
ma’lumotlar kabi tushunchalarni qo‘llab-quvvatlaydi [17, 18].
Nihoyat, 2010-yil davomida ma’lumotlar provayderlari va INSDC ma’lumotlar
bazasi kuratorlari to‘liq genomlar, transkriptomlar, transkriptomlar va boshqalarni
maqsad qilib olgan izchil izlanishlar bilan bog‘liq bo‘lgan yuqori darajadagi
ma’lumotlarni jamlaydigan BioProjects ma’lumotlar bazasini yaratishga katta kuch
sarflandi. metagenomika loyihalari, maqsadli lokalizatsiya tadqiqotlari va boshqalar.
INSDC hamkorlari ushbu tashabbus doirasida ma’lumot to‘plashgan bo‘lsa-da,
2011-yilda kutilayotgan asosiy yangi sxema ma’lumotlarga kirish va qazib olish
vositalarini qo‘llab-quvvatlaydi.
INSDC hamkorlari muvofiqlashtirilgan va integratsiyalashgan xizmatlarni
yaqindan ishlaydi. Ma’lumot yuboruvchi uchun faqat sheriklardan biriga ketma-



ketlik ma’lumotlarini taqdim etish kerak. Ketma-ketliklar bitta nom maydoni 
bo‘ylab qo‘shiladi, shunday qilib qo‘shilish qidiruvi qaysi hamkor institut qidiruv 
ob'ektini taqdim etganidan qat'iy nazar bir xil ma’lumotlar mazmunini beradi. 
Mahalliy talablarni qondirish va INSDC dan tashqari hamkor institut resurslari bilan 
optimal integratsiyani taklif qilish uchun hamkor institutlarda taqdim etish va taqdim 
etish vositalari mustaqil ravishda ishlab chiqiladi va saqlanadi. Ushbu vositalarni 
quyidagi 
manzillarda 
topish 
mumkin: 
http://www.ddbj.nig.ac.jp/, 
http://www.ebi.ac.uk/ena/ va http://www.ncbi.nlm.nih.gov/ DDBJ, ENA va NCBI 
uchun mos ravishda va http://www.insdc.org/ dan havola qilingan.
INSDC ma’lumotlar bazalari tomonidan ma’lumotlarga egalik qilishning aniq 
tamoyillari ishlab chiqilgan. Muhimi, INSDC ma’lumotlar bazalari egalari emas, 
balki ma’lumotlar xostlaridir; kiruvchi ma’lumotlar uchun ma’lum sintaktik va 
semantik muvofiqlikni tekshirish mavjud bo‘lsa-da, ma’lumotlarga egalik qilish va 
shuning uchun ilmiy tarkibni tahririyat nazorati asl ma’lumot provayderida qoladi. 
Bundan tashqari, faqat ma’lumotlar egalari va ularning tasdiqlangan delegatlari o‘z 
yozuvlarini yangilashlari mumkin. Hamkorlardan biriga taqdim etilgan ma’lumotlar 
qabul qiluvchi INSDC instituti vositachiligida yangilanadi; ya’ni qabul qiluvchi 
institut har qanday berilgan yozuv yoki yozuvlar to‘plami bo‘yicha topshiruvchi va 
INSDC o‘rtasidagi o‘zaro aloqa uchun doimiy javobgarlikni o‘z zimmasiga oladi. 
Shubhasiz, bunday tizim xolislikni ta’minlasa-da, ilmiy sifat nazoratini 
ma’lumotlar provayderlari qo‘liga topshiradi, ular ba’zan uzoq vaqt davomida o‘z 
yozuvlariga doimiy yangilanishlarni qo‘llab-quvvatlay olmaydilar, odatda diqqat 
markazida o‘zgarish natijasida. topshiruvchining laboratoriyasi yoki xodimlarning 
ushbu tadqiqot sohasini tark etishi natijasida. Birlamchi arxiv sifatida INSDC 
ma’lumotlar provayderlariga imkon qadar kamroq to‘siqlar qo‘yishi muhim, chunki 
ularning ma’lumotlari va talqinlari ilmiy yozuvning bir qismi sifatida to‘liq 
tarqatiladi. Shu sababli, INSDC tarkibi tahlilga ma’lumotlar tasmasi sifatida 
to‘liqlik, puxtalik va pirovardida ishonchlilikning ko‘p darajalarini qamrab oladi. 
Ushbu muammoni e’tirof etgan holda, INSDC ma’lumotlar bazalarining siyosati 
sifat, to‘liqlik va puxtalik baholanishi va foydalanuvchilarga turli tahlillar ostida turli 


10 
INSDC yozuvlariga ishonch bo‘yicha eng yaxshi xulosalar chiqarish imkonini 
beradigan tizimlarga intilishdir. 
Yangi ketma-ketlik tasvirlangan har qanday maqolada maqola mualliflari 
tomonidan taqdim etilgan ketma-ketliklar bilan bog‘liq bo‘lgan INSDC kirish 
raqamlari keltirilishi bioinformatikadagi asosiy dogma bo‘lsa-da, bu "majburiy 
topshirish" tushunchasi passiv tarzda emas, balki sa’y-harakatlar natijasida paydo 
bo‘lgan. INSDC a’zo institutlari va ochiq ma’lumotlar almashinuvining boshqa 
tarafdorlari. Ommaviy ma’lumotlarni tarqatish bo‘yicha ilg‘or amaliyotga misol 
sifatida, INSDC hamkorlari hayot fanlari bo‘yicha yirik jurnallar noshirlarining 
ushbu tashabbusda doimiy qo‘llab-quvvatlanayotganini e’tirof etadilar. 
INSDC ma’lumotlari foydalanuvchilarga ochiq va bepul taqdim etiladi. 
Ko‘pgina yozuvlar topshirilgandan so‘ng darhol ommaga ochiq bo‘lsa-da, nashr 
etilishidan oldin maxfiy saqlanganlar asar nashrda taqdim etilishi bilanoq ommaga 
e’lon qilinadi. Tartibga solish uchun material taqdim etgan inson donorlarining 
rozilik kelishuvlariga rioya qilish uchun ba’zi yozuvlarga kirish huquqini talab qilish 
kerak; INSDC institutlari xavfsizlikning tegishli darajalariga erishish uchun tegishli 
axloqiy organlar va qo‘mitalar bilan tegishli qonunchilik tizimlari ostida ishlaydi. 
INSDC uzoq vaqtdan beri tashkil etilgan Xalqaro maslahat qo‘mitasiga ega 
bo‘lib, u INSDCga rivojlanish va siyosat masalalari bo‘yicha ilmiy va strategik 
maslahatlar 
berish 
bilan 
shug‘ullanadi 
(qarang: 
http://www.insdc.org/advisors.html). Qo‘mita tarkibiga kiruvchi katta olimlar 
INSDC [http://www.insdc.org/documents/open_letter.txt] himoyachilari sifatida 
ham muhim rol o‘ynaydi. 
2010-yilda INSDC ma’lumotlar bazalari bazalar soni bo‘yicha umumiy 
hisobda taxminan 3 baravar o‘sdi (1-rasm). Ushbu mutlaq o‘sish ortida yig‘ilgan 
ketma-ketliklar sonining 19 % ga o‘sishi (164 dan 195 million ketma-ketlikgacha) 
va SRAda keyingi avlodga asoslangan tajribalar sonining ikki baravardan ko‘proq 
o‘sishi (taxminan 13 000 dan 13 000 gacha) bor. 31 000). INSDC ma’lumotlar 
bazalarida ma’lumotlar o‘sishining eng katta komponentiga yangi avlod 
sekvensiyasining xom ashyosi hissa qo‘shishi ajablanarli bo‘lmasa-da, yig‘ilgan 


11 
ketma-ketliklarni to‘plash tezligining biroz, ammo barqaror pasayishi aniq. Buning 
sabablari noaniq bo‘lsa-da, ko‘plab mumkin bo‘lgan tushuntirishlar orasida kamroq 
to‘liq (an'anaviy ma’noda) genom ketma-ketligi tendentsiyasi va shuning uchun 
an'anaviy yig‘ilgan ketma-ketlik va funktsional izohlarni ommaga taqdim etish 
uchun ma’lumotlar generatorlariga ehtiyojning pastligi; Darhaqiqat, yig‘ilgan 
ketma-ketlik asoslarini taqsimlashdan ko‘rinib turibdiki, butun genom o‘q otishni 
o‘rganishdan olingan ketma-ketlik yozuvlari endi yig‘ilgan ketma-ketliklarning 
tobora muhim tarkibiy qismiga hissa qo‘shmoqda. Qo‘shimcha tushuntirishlar, 
ehtimol, ketma-ket yig‘ish usullariga kamroq mos keladigan kapillyar elektroforez 
platformalari bilan solishtirganda, chiqishi haligacha saqlanib qolgan keyingi avlod 
sekvensiyalash mashinalari tomonidan ketma-ketlik qobiliyatini to‘yinganligini o‘z 
ichiga oladi. 
2-rasm. (a) Vaqt o‘tishi bilan INSDC da asosiy juftliklar, Trace Arxive 
(kapillyar sekvensiya platformalaridan olingan xom ma’lumotlar) bundan mustasno. 
Vaqt o‘tishi bilan tayanch juftliklarda jamlangan ma’lumotlar hajmi. (b) INSDC da 
2002-yildan beri vaqt o‘tishi bilan tanlangan ma’lumotlar komponentlariga 


12 
bo‘lingan asosiy juftliklar. Yig‘ilgan ketma-ketlikka (butun genom ov miltig‘i 
usullari va boshqalar) va yangi avlod ketma-ketligining xom ashyosiga bo‘lingan 
bazaviy juftlikdagi jami ma’lumotlar hajmi. 
INSDC ma’lumotlar bazalariga yig‘ilgan ketma-ketlikni taqdim etishda 
o‘sishning sekinlashishiga qaramay, jamoat mulki genomlari katalogi tez sur'atlar 
bilan o‘sishda davom etishi aniq (2-rasm). Bundan tashqari, to‘liq genomlarning 
taksonomik xilma-xilligi vaqt o‘tishi bilan ortib borayotgan sur'at bilan o‘sib 
borayotgan bo‘lsa-da, umumiy taksonomik qamrov, juda siyrak ketma-ketlik vakili 
bo‘lgan ko‘plab taksonlar uchun bo‘lsa ham, vaqt o‘tishi bilan ortib borayotgan 
o‘sishni boshdan kechirganligi aniq (3-rasm). 
3-rasm. To‘liq genomlarda o‘sish. Qatlamli diagramma vaqt o‘tishi bilan 
INSDC ma’lumotlar bazalarida mavjud bo‘lgan to‘liq genomlar sonini ko‘rsatadi. 
2010-yil oxiri vaqti konservativ (chiziqli) 2010-yil oktabrdagi raqamlardan 
ekstrapolyatsiya qilingan bo‘lib, ular taqdim etish vaqtida mavjud bo‘lgan eng oxirgi 
hisoblanadi. 


13 

Download 1,9 Mb.
1   2   3   4   5   6   7   8   9   ...   20




Download 1,9 Mb.
Pdf ko'rish