|
-rasm. (a) Vaqt o‘tishi bilan INSDC da asosiy juftliklar
|
bet | 4/18 | Sana | 17.02.2024 | Hajmi | 1,73 Mb. | | #158021 |
Bog'liq Biologik ketma-ketlikni taqqoslash. Gomologik ketma-ketliklar 1-rasm. (a) Vaqt o‘tishi bilan INSDC da asosiy juftliklar.
Trace Arxive (kapillyar sekvensiya platformalaridan olingan xom ma’lumotlar) bundan mustasno. Vaqt o‘tishi bilan tayanch juftliklarda jamlangan ma’lumotlar hajmi. (b) INSDC da 2002-yildan beri vaqt o‘tishi bilan tanlangan ma’lumotlar komponentlariga bo‘lingan asosiy juftliklar. Yig‘ilgan ketma-ketlikka (butun genom ov miltig‘i usullari va boshqalar) va yangi avlod ketma-ketligining xom ashyosiga bo‘lingan bazaviy juftlikdagi jami ma’lumotlar hajmi.
INSDC ma’lumotlar bazalariga yig‘ilgan ketma-ketlikni taqdim etishda o‘sishning sekinlashishiga qaramay, jamoat mulki genomlari katalogi tez sur'atlar bilan o‘sishda davom etishi aniq (2-rasm). Bundan tashqari, to‘liq genomlarning taksonomik xilma-xilligi vaqt o‘tishi bilan ortib borayotgan sur'at bilan o‘sib borayotgan bo‘lsa-da, umumiy taksonomik qamrov, juda siyrak ketma-ketlik vakili bo‘lgan ko‘plab taksonlar uchun bo‘lsa ham, vaqt o‘tishi bilan ortib borayotgan o‘sishni boshdan kechirganligi aniq (3-rasm).
2-rasm. To‘liq genomlarda o‘sish.
Qatlamli diagramma vaqt o‘tishi bilan INSDC ma’lumotlar bazalarida mavjud bo‘lgan to‘liq genomlar sonini ko‘rsatadi. 2010-yil oxiri vaqti konservativ (chiziqli) 2010-yil oktabrdagi raqamlardan ekstrapolyatsiya qilingan bo‘lib, ular taqdim etish vaqtida mavjud bo‘lgan eng oxirgi hisoblanadi.
3-rasm. Taksonomik qamrov.
Vaqt o‘tishi bilan bog‘liq ketma-ketlikka ega bo‘lgan taksonlar sonining o‘sishi (yoki tegishli ketma-ketlikka ega bo‘lgan bo‘ysunuvchi taksonlar bilan).
INSDC nukleotidlar bazasining qulaylik va kamchiliklari
Yangi avlod texnologiyalari yangi texnik muammolarni keltirib chiqaradi. Mikro-suyuqlik va tasvirlash texnologiyasidagi so‘nggi yutuqlardan foydalanish hozirgi yangi avlod platformalarini, xususan, Roche/454, Illumina va Life Technologies/SOLiD-ni klonal ravishda kuchaytirilgan yagona molekulalardan ko‘p sonli parallel o‘qishlarni olish imkoniyatini beradi. "Keyingi avlod" deb ataladigan platformalar ilg‘or tasvirlash va boshqa sensor texnologiyalaridan foydalanish orqali parallel chiqishning ushbu darajasini to‘g‘ridan-to‘g‘ri bitta molekula ketma- ketligiga etkazishni va’da qiladi. Parallel chiqish darajasi o‘z-o‘zidan ma’lumotlar hajmining ta’sirchan bosqichma-bosqich o‘zgarishiga olib kelgan bo‘lsa-da, biz hozirgacha ko‘rgan o‘tkazish qobiliyatining misli ko‘rilmagan o‘sishi, ehtimol, qiyinroqdir. Haddan tashqari holatlarda biz yangi avlod platformasi uchun tajovuzkor texnologiya yaxshilanishlariga guvoh bo‘ldik, rentabellikni ikki baravar oshirish muddati 5 oygacha. Taxminan ikki baravar ko‘paygan vaqtdan farqli o‘laroq, masalan, birlik narxiga disk zichligi - 18 oy, barqaror iqtisodiy model ostida keyingi avlod ma’lumotlarini arzon saqlash vositalarida saqlash asosiy texnik muammo ekanligi ayon bo‘ladi. Manfaatdor tomonlar sifatida INSDC hamkorlari tajovuzkor ketma-ketlik texnologiyasi o‘sishi muammosini hal qilish uchun ma’lumotlarni qisqartirish, siqish va boshqa metodologiyalarni ishlab chiqish bo‘yicha mahalliy va jamoat harakatlariga hissa qo‘shmoqda va ular bilan ishtirok etmoqda. Ushbu faoliyatning bir qismi algoritmik ishlab chiqish va usullarni optimallashtirish bilan shug‘ullanadi, ikkinchisi arxivimizda saqlaydigan turli ma’lumotlar komponentlarining qiymatiga oid muhim savollarni beradi.
Nuklein kislotalar ketma-ketligining butun tarixi davomida eksperimentalistlar va ma’lumotlar resurslari provayderlari avtomatlashtirishning kuchayishi va molekulyar usullarning asosiy hayot fanlarida keng qo‘llanilishi natijasida ma’lumotlarning eksponentsial o‘sishiga o‘rganib qolgan (1-rasm). Ushbu an'anaviy eksponentsial o‘sish texnik, ijtimoiy va iqtisodiy darajalarda qiyinchiliklar tug‘dirgan bo‘lsa-da, so‘nggi texnologiyaning "keyingi avlod" sekvensiya
platformalariga o‘tishi o‘sish tabiatiga bosqichma-bosqich o‘zgarishlar kiritdi, bu INSDC uchun bugungi kunga qadar eng katta qiyinchilik tug‘diradi. hamkorlar.
Nuklein kislotalar ketma-ketligining butun tarixi davomida eksperimentalistlar va ma’lumotlar resurslari provayderlari avtomatlashtirishning kuchayishi va molekulyar usullarning asosiy hayot fanlarida keng qo‘llanilishi natijasida ma’lumotlarning eksponentsial o‘sishiga o‘rganib qolgan (1-rasm). Ushbu an'anaviy eksponentsial o‘sish texnik, ijtimoiy va iqtisodiy darajalarda qiyinchiliklar tug‘dirgan bo‘lsa-da, so‘nggi texnologiyaning "keyingi avlod" sekvensiya platformalariga o‘tishi o‘sish tabiatiga bosqichma-bosqich o‘zgarishlar kiritdi, bu INSDC uchun bugungi kunga qadar eng katta qiyinchilik tug‘diradi. hamkorlar.
Yangi avlod texnologiyalari yangi texnik muammolarni keltirib chiqaradi. Mikro-suyuqlik va tasvirlash texnologiyasidagi so‘nggi yutuqlardan foydalanish hozirgi yangi avlod platformalarini, xususan, Roche/454, Illumina va Life Technologies/SOLiD-ni klonal ravishda kuchaytirilgan yagona molekulalardan ko‘p sonli parallel o‘qishlarni olish imkoniyatini beradi. "Keyingi avlod" deb ataladigan platformalar ilg‘or tasvirlash va boshqa sensor texnologiyalaridan foydalanish orqali parallel chiqishning ushbu darajasini to‘g‘ridan-to‘g‘ri bitta molekula ketma- ketligiga etkazishni va’da qiladi. Parallel chiqish darajasi o‘z-o‘zidan ma’lumotlar hajmining ta’sirchan bosqichma-bosqich o‘zgarishiga olib kelgan bo‘lsa-da, biz hozirgacha ko‘rgan o‘tkazish qobiliyatining misli ko‘rilmagan o‘sishi, ehtimol, qiyinroqdir. Haddan tashqari holatlarda biz yangi avlod platformasi uchun tajovuzkor texnologiya yaxshilanishlariga guvoh bo‘ldik, rentabellikni ikki baravar oshirish muddati 5 oygacha. Taxminan ikki baravar ko‘paygan vaqtdan farqli o‘laroq, masalan, birlik narxiga disk zichligi - 18 oy, barqaror iqtisodiy model ostida keyingi avlod ma’lumotlarini arzon saqlash vositalarida saqlash asosiy texnik muammo ekanligi ayon bo‘ladi. Manfaatdor tomonlar sifatida INSDC hamkorlari tajovuzkor ketma-ketlik texnologiyasi o‘sishi muammosini hal qilish uchun ma’lumotlarni qisqartirish, siqish va boshqa metodologiyalarni ishlab chiqish bo‘yicha mahalliy va jamoat harakatlariga hissa qo‘shmoqda va ular bilan ishtirok etmoqda. Ushbu faoliyatning bir qismi algoritmik ishlab chiqish va usullarni
optimallashtirish bilan shug‘ullanadi, ikkinchisi arxivimizda saqlaydigan turli ma’lumotlar komponentlarining qiymatiga oid muhim savollarni beradi.
Keyingi avlod ketma-ketlik texnologiyasining paydo bo‘lishi yana bir qiyinchilik tug‘diradi, buning uchun echimlar ilg‘or texnik ishlanmalardan kamroq, balki ijtimoiy va tashkiliy innovatsiyalardan kelib chiqadi. Xarajatlarning sezilarli darajada pasayishi funktsional izohlash uchun an'anaviy genom va transkriptom sekvensiyasidan tashqarida keng ko‘lamli ilovalar bo‘ylab ketma-ketlikni keng qo‘llashga olib keldi. Keyingi avlod ketma-ketligiga asoslangan epigenomika, sekvensiya, metatranskriptomika va miqdoriy ifoda kabi yangi yondashuvlarning mavjudligi tufayli sekvensiya endi hayot olimi uchun asosiy umumiy tahlil platformasiga aylandi. Bundan tashqari, ko‘p hollarda foydalanuvchi o‘z ishining ketma-ketlikka asoslangan tarkibiy qismlarining nozik tomonlarini to‘liq tushunishi endi kerak emas. Xo‘sh, INSDC qanday qilib kengayayotgan foydalanuvchilar bazasiga eng yaxshi xizmat ko‘rsatishni davom ettira oladi? Trening va yangi ishga yollash orqali INSDC doirasidagi barcha yangi ketma-ketlik bilan bog‘liq ilovalar bo‘yicha tajribani rivojlantirish barqaror bo‘lishi dargumon. INSDC tomonidan qabul qilingan strategiya funktsional genomik tajribalar uchun GEO (6) va ArrayExpress kabi maxsus tajribaga ega bo‘lgan guruhlar bilan yaqin hamkorlikni o‘rnatishdan iborat. Ushbu kelishuvlarda INSDC ma’lumotlariga kirish ixtisoslashtirilgan ma’lumotlarni taqdim etish, taqdim etish va integratsiya vositalari bilan ta’minlash uchun yaxshiroq joylashtirilgan ushbu hamkorlik guruhlari orqali ta’minlanadi. Yana bir misolda, Hayotning shtrix kodlash konsorsiumi va Genomik standartlar konsorsiumi bilan ishlash INSDC tomonidan taqdim etilgan kalit so‘zni shtrix-kod ma’lumotlari standarti va jamiyat tomonidan ishlab chiqilgan Minimal ma’lumot kabi standartlarga mos keladigan yozuvlarga qo‘llashga olib keldi. Genom ketma-ketligi (MIGS) standarti.
Ushbu model nafaqat ishni to‘g‘ri taqsimlagani uchun umumiy bioinformatika va ma’lumotlar infratuzilmasi bo‘yicha ishlar INSDCga o‘tadi va ixtisoslashgan biologik sohalardagi ishlar faqat tegishli mutaxassislarga topshiriladi.
|
| |