Mavzu : Bioinformatika va genomika fanlari haqida tushuncha.
REJA :
1. Bioinformatika fanining maqsadi va uning genomika fani rivojlanishidagi ahamiyati.
2. Odam genomini to’la yechilishidagi algoritmik dasturlar ahamiyati.
4. Bioinformatika va genomika fanlari kelajagi, genetik informatsiyalar banki.
XXI asrning boshlanishi molekulyar biologiya va bioinformatika sohasida erishilgan
ulkan yutuqlar bilan sharaflidir. DNKning alohida qismlarining va turli ko‘rinishdagi
organizmlarning keng ko‘lamdagi genom ketma-ketliklarini ma’nosini ochishga imkon beruvchi
DNK asosining ketma-ketliklarini aniqlash uchun avtomatlashtirilgan tizimlarni yaratilishini
haqli ravishda muhim deb hisoblash mumkin. (Venter et al, 2001.)Inson genomlarini, hayvonlar,
o‘simliklar, bakteriyalar va viruslar genomlarini sekvenirlash bo‘yicha keng ko‘lamdagi
loyihalarni amalga oshirish nukleotid ketma-ketliklar to‘g‘risidagi axborotlar hajmini bamisoli
ko‘chkisimon o‘sishga olib keldi [http://www.ncbi.nlm. nih.gov/Genbank/ genbankstats.html]
Genetik molekulalarning vazifalari va ularning tuzilishi haqidagi bilimlarning to‘planishi va
umumlashtirilishi, ularning tahlili molekulyar genetikaning postgenom davridagi birmuncha
muhim muammolari sirasiga kiradi. Ma’lumotlar bazasida to‘plangan ilmiy tajriba axborotlar va
DNK ketma-ketliklari tahlili asosida kompyuter dasturlari yordamida yangi genlarning vazifaviy
qisqa ma’lumoti ushbu muammoni echishga yondashuvlardan biridir.
So‘nggi 10-15 yillar mobaynida ilmiy jamiyatlar DNK ketma-ketliklarini to‘plashga
kuchli e’tibor qaratmoqdalar va taxminan 310 nukleotid juftdan iborat bo‘lgan inson
genomining aniqlangani ushbu faoliyatning cho‘qqisi bo‘ldi [Venter et al, 2001] Ayni paytda
ma’lumotlarning asosiy molekulyar-genetik bankida [EMBL, GenBank, DDBJ]
mikroorganizmlar to‘la sekvenirlangan 180 ta genomlari va inson genomlarini ham qo‘shganda
o‘nlab eukariot genomlar to‘g‘risida ma’lumotlar to‘plab bo‘lingan, boz ustiga aniqlangan
ketma-ketliklar hajmi shitob bilan o‘sib bormoqda.[
http://www.ncbi.nhn.nih.gov/
genomes/
MICRO-BES /Complete.html] Fan uchun, tibbiyot va inson hayotining boshqa jabhalari uchun
olingan axborotlar qiymatini ortiqcha baholab bo‘lmaydi. Biroq, ushbu axborotdan samarali
foydalanish uchun uning biologik mazmunini tushunish, ketma-ketlik vazifasini belgilash,
ularning tartibga solishdagi rolini va o‘zaro tadrijiy munosabatlarini aniqlash zarur. Ayni paytda
63
ulkan miqdordagi DNK ketma-ketliklari va aminokislotalar ulkan mehnat talab qilgani va
salmoqli qiymatga ega bo‘lgani bois, ularni izlash, qiyoslash, xaritalash uchun ilmiy tajriba
uslublarni shunchaki to‘g‘ridan-to‘g‘ri qo‘llab bo‘lmaydi. Birinchi navbatdagi vazifa zamonaviy
kompyuter texnologiyalariga biopolimerlarni jalb etish va DNK, RNK va oqsillar kabi genetik
makromolekulalar ketma-ketligini tahlil qiluvchi kompyuter dasturlari va matematik algoritmlar
yaratishdan iborat. SHaxsiy kompyuterlarda genetik ma’lumotlarni tahlil qilish dasturidan
foydalanishning qulayligi va ulkan hajmdagi ma’lumotlarga ishlov berish imkoniyati
bioinformatiklarning tajriba ishida zarur vosita bo‘lib xizmat qiladi. Tirik hujayralarda
o‘tayotgan barcha molekulyar jarayonlar to‘g‘risidagi bilimlarga to‘la ega bo‘lmaganligimiz
bois, DNK, RNK va oqsillar ketma-ketligini tahlil qilish uchun matematik uslublar tajribaviy
uslublarning o‘rnini bosa olmaydi. Biroq kompyuter uslublarida ixtisoslashgan ma’lumotlar
bazasida to‘plangan DNK ketma-ketliklari to‘g‘risidagi ulkan miqdordagi ilmiy tajriba
ma’lumotlar genomlar tuzilishi va tadriji haqidagi sifat jihatdan yangi bilimlarni olishning
imkonini beradi. [Kanehisa and Bork, 2003; Galperin, 2004]Aynan genom ma’lumotlarining
statistik tahlili asosida genetik axborotni tashkil etish to‘g‘risidagi yangi bilimlarga ega bo‘lish
mazkur ishda tavsiya etilgan kompyuter tadqiqotlarining asosiy maqsadidir. XXI asrning
boshlarida DNK va oqsillar ketma-ketligining tuzilishi va xossasini o‘rganishga yo‘naltirilgan
dasturiy mahsulotlarning keng doirasi yaratildi. [Kolchanov, 1988; Wang et al, 1999; Pevzner,
2000; Momit, 2001; Koonin and Galperin, 2002]Bu dasturlarga joylashtirilgan ko‘plab
algoritmlar texnikasini biopolimerlar ketma-ketligini qurishda statistik xossalar va
qonuniyatlarni tadqiq qilish uchun diskret matematikada [Gusfield, 1997] hamda matematik
statistika va ehtimollar nazariyasida qo‘llash muhim ahamiyat kasb etadi. Ketma-ketliklar
o‘zgarishining tadrijiy cheklovini hisobga oluvchi matematik baholash yordamida genetik
ma’lumotlar murakkabligining tahlilini o‘tkazish muhim muammolardan biridir. Eukariot genlari
ta’sirliligini tartibga soluvchi ketma-ketliklar genomida kompyuter tadqiqotini o‘tkazish va
izlash muammosi birmuncha muhimdir. Ketma-ketliklarni tartibga soluvchi ma’lumot
murakkabligining miqdoriy tahlili va ma’lumotiy tashkillashuvini har taraflama tadqiq qilish
uchun zamonaviy Internetbop kompyuter dasturlarini yaratish zarur.[Durbin et al, 1998; Ewens
and Grant, 2001] Bugungi kunda birmuncha to‘la bo‘lgan molekulyar-biologik resurslarni
[GenBank, EMBL], ixtisoslashgan ma’lumotlar bazasini ham e’tiborga olgan holda, gen
ta’sirliligini [TRRD, TRANSFAC, EPD] tartibga solish bo‘yicha DNK ketma-ketliklari
to‘g‘risidagi ma’lumotlarga ishlov berish dolzarb bo‘lib qolmoqda.
Tavsiya etilayotgan dissertatsiya ishida genetik ma’lumotlarni statistik tahlilida yangi
kompyuter uslublarini ishlab chiqish va qo‘llash, genomli DNKlardagi tartibiga solinuvchi
joylarni va vazifaviy saytlarni oldindan aytish, genomlardagi takrorlanishlarni izlash va ularning
tuzilmasini tahlil qilish kabi vazifalar qo‘yilgan.
64
Eukariot genlarni tartiblovchi ketma-ketliklarni aniqlash va uning vazifaviyqisqa mazmuni
"postgenom" davriga kirgan molekulyar biologiya uchun muhim ahamiyat kasb etadi. Ko‘plab
tadqiqotchilar nazdida ommaviy sekvenirlash davriga qadar vazifaviy sohasi bir ma’noli bo‘lib,
o‘ta oddiy tuzilmaga ega bo‘lgan. Aslida esa DNK ketma-ketligi bo‘yicha vazifalarni aniqlash
muammosi birmuncha murakkab bo‘lib, genetik ma’lumotni kodlashning ma’nodosh
bo‘lmagani bilan bog‘liqdir.[Frank-Kamenetskiy, 1990; Pevzner, 2000] Tartiblovchi oqsillar
bilan bog‘liq bo‘lgan DNK maydonlari u qadar ma’nodosh emas. Ularni nukleotid ketma-
ketlikdan izlash birmuncha murakkab vazifa hisoblanadi.
RNK-polimerazalarni bog‘lovchi saytlar, RNK translyasiyasini boshlanish maydonlari,
splaysing maydonlari va boshqalar murakkab tuzilishga ega bo‘lib, ikkilamchi tuzilmalar
elementini o‘z ichiga olgan, ko‘pincha o‘zgaruvchan masofada joylashgan bir nechta blokdan
iborat bo‘ladi.
Ko‘plab holatlar kabi o‘xshash vazifalarni bajaruvchi vazifaviy saytlar birlamchi
tuzilmasidan to‘la farqlanishi mumkin. Bu nukleotid saytlarga taalluqli bo‘lish bilan bir
qatorda, oqsillarning faol saytlariga ham tegishlidir.[Valuev et al, 2002].SHu sababli vazifaviy
signallardagi DNK ketma-ketligining kodlangan tahlili ulkan hajmdagi ma’lumotlarni ishlab
chiqish bilan bog‘liq bo‘lgan ko‘rinishlarni aniqlash hamda hisoblash mashaqqatlarini engish
uchun statistik yondashuv va maxsus eng qulay algoritmlarning yanada mukammal uslublarini
qo‘llashni talab qiladi.Oqsillarni kodlovchi qismlar o‘xshashligini, oqsillar bilan bog‘lanuvchi
saytlarni, transkripsiya va translyasiya signallarini genomli DNKning vazifaviy xususiyatini
bashorat qilish masalalari sirasiga kiritish mumkin .[Pevzner, 2000]
Bu sohadagi taraqqiyot molekulyar-biologiya sohasida to‘plangan bilimlar darajasiga
bevosita bog‘liqdir. Aniqlashning yanada mukammal uslublariga qaramay, oqsillarni kodlovchi
genlarni tenglashtirish masalasidan yiroq hatto kompyuterning turli uslublari yordamida
topilgan inson genomidagi genlar sonini baholash ham sezilarli darajada farq qiladi.Oqsillar
uchun 20 xildagi aminokislotalar va DNK va RNKlar uchun nukleotid tipidagi alifboga muvofiq
belgilar ketma-ketligini cheklovchi ko‘rinishdagi tabiiy makromolekulalar tushunchasini genetik
ma’lumot deb yuritamiz.DNK, RNK molekulalarini va oqsillarni genetik ma’lumot sifatida
taqdim etish,ularda genetik informatsiya mavjudligi va ularni yozish va saqlashning chiziqli
usuli kabi birmuncha sodda va birmuncha muhim jihatlarini ifodalaydi. Genomdagi nukleotid
ketma-ketlikni qisqacha qilib so‘zlar deya ataymiz. Birmuncha keng (va eng oz) tarqalgan
so‘zlarni o‘rganish, genom qismlarini ifodalash, qaytarilishlarni farqlovchi nukleotidlar va
nukleotid so‘zlarni qo‘llash genetik ma’lumotlar va ularning tadrijiy nazariyasi qismlalarining
fuksional roli to‘g‘risidagi yangi farazlarni ilgari surishga imkon beradi. [Karlin et al, 1983;
Ratner, 1993; Gelfand, 1993; Karlin and Ladunga, 1994; Kolchanov Lim, 1994; Haring and
65
Kypr, 1999; Uotermen, 1999; Abe et al, 2003].Tarixan genetik til to‘g‘risidagi ilk tasavvurlardan
biri 1970 yillarda V.A.Ratner tomonidan kiritilgan .[Ratner 1970, 1975].
Ma’lumotni lingvistik tasavvur qilish va ma’lumotlarni kodlashning matematik
nazariyasi bilan bog‘liq bo‘lgan yondashuv sermahsul bo‘ldi. [Trifonov, 0; Grumbach and Tahi,
1994; Rivals et al, 1996; Stem et al, 2001; Troyanskaya et al, 2002; n et al, 2003]. Genetik
ketma-ketliklarning statistik tahlili vazifaviy va tadrijiy darajada tushuntirish zarur bo‘lgan turli
xildagi takrorlashlar bilan boyitilgan ulkan miqdordagi o‘xshash tasniflarni namoyon qildi. [Sox
and Mirkin, 1997;vv Toth et al, 2000].Genetik ma’lumotlarni matematik modellar yordamida
hamda Markov zanjiri nazariyasi apparati yordamida batafsil yoritish uchun maxsus
yondashuvlar zarur. Bunday modellar gomologiyaning statistik xususiyatini, ma’lumotlarning
muxtasar axborot tasnifini (entropiyalarni, keragidan ortig‘ini, murakkablikni baholash),
nukleotid “so‘zlar” takrorlanishi to‘qnashuvini bashorat qilishni baholash uchun zarur.
Ma’lumotning geterogenlik darajasi (almashinuvchi belgilar xilma-xilligi), ma’lumotqismining
o‘zaro bog‘lanishi va ularning nisbatan joylashuvining eskiligi to‘g‘risida savol tug‘iladi.
SHunday qilib, mazkur ishda o‘rganilayotgan genetik ma’lumotlar murakkabligi
tahlilining muammosi yuzaga keladi. Genomli DNKning sekvenirlash bo‘yicha tadqiqot ishlari
jadallik bilan rivojlanib bormoqda. 2004 yilning avgustiga kelib prokariot genomlarining 180
tasi ma’lum edi. SHu jumladan arxebakteriyalarning 19 genomi va eubakteriyalarning 161
genomi ma’lumbo‘lib ular; A thaliana o‘simligi, C.elegans nematoda, D.melanogaster hasharoti,
|