Дараалал зэрэгцүүлэхэд ижил төстэй байдал ба ижил төстэй байдлын гол ялгаа нь ижил төстэй байдал нь харьцуулахдаа хоёр дарааллын хоорондох ижил төстэй байдал (төсөөлт) бөгөөд ижил төстэй байдал нь хоёр өөр дарааллын хооронд яг таарч байгаа тэмдэгтүүдийн тоо юм.
Биомэдээлэл зүй нь молекул биологи ба генетик, компьютерийн шинжлэх ухаан, математик, статистикийг голчлон оролцуулдаг салбар дундын шинжлэх ухааны салбар юм. Дарааллын дараалал нь биоинформатикийн томоохон нэр томъёо юм. Энэ нь ДНХ, РНХ эсвэл уургийн дарааллыг дарааллын хоорондох функциональ, бүтцийн эсвэл хувьслын харилцааны үр дагавар болох ижил төстэй бүс нутгийг тодорхойлохын тулд зохион байгуулах процедур юм. Тохируулгын төгсгөлд тэдгээрийг матриц доторх мөр хэлбэрээр харуулах болно. Дараалсан багана дахь ижил тэмдэгтүүдийг зэрэгцүүлэхийн тулд үлдэгдэл хоорондын зай завсар байна.
Ижил төстэй байдал гэж юу вэ?
Дараалал зэрэгцүүлэх ижил төстэй байдал нь харьцуулах үед хоёр дарааллын ижил төстэй байдал юм. Энэ баримт нь дарааллын онцлогоос хамаарна. Ижил төстэй байдал нь үлдэгдэл хэр зэрэг нийцэж байгааг харуулдаг. Тиймээс ижил төстэй дараалал нь ижил төстэй шинж чанартай байдаг. Био-информатикийн хувьд ижил төстэй байдал нь хоёр уургийн ижил төстэй байдлыг үнэлэх хэрэгсэл юм.
Зураг 01: Дэс дарааллын ижил төстэй байдал
Тэгцүүлэх үйл явцыг дараалалд оруулах хоёр үндсэн алхам байдаг. Эхний алхам нь BLAST, FastA, LALIGN зэрэг алгоритмуудыг ашиглан хоёр дарааллын (цоорхойг оруулаад) хамгийн оновчтой байрлалыг олоход тусалдаг хосоор тэгшлэх явдал юм. Тохирох алгоритм нь засварлах үйлдлүүдийн хамгийн бага тоог олдог; нэг дарааллыг нөгөө дараалалтай зэрэгцүүлэхийн тулд in-dels болон орлуулалт. Хосоор зэрэгцүүлсний дараа хосын харьцуулалт бүрээс хоёр тоон үзүүлэлтийг авах шаардлагатай. Эдгээр нь ижил төстэй байдал, ижил төстэй байдал юм.
Identity гэж юу вэ?
Дараалал зэрэглэлийн таних тэмдэг нь хоёр өөр дарааллын хооронд яг таарч байгаа тэмдэгтүүдийн тоо юм. Тиймээс таних чадварыг үнэлэхэд цоорхойг тооцохгүй. Хэмжилтийг хоёр дарааллын дундах богино дараалалтай хамааралтай гэж үзнэ. Энэ нь дарааллын таних тэмдэг нь шилжилт хөдөлгөөнгүй үед нөлөө үзүүлдэг болохыг ихээхэн харуулж байна. Хэрэв X=Y ба Y=Z бол X нь Z-тэй тэнцүү байх албагүй. Үүнийг таних зайны хэмжүүрээр гаргаж авна.
Зураг 02: Дараалал дахь таних тэмдэг
Жишээ нь X нь AAGGCTT, Y нь AAGGC, Z нь AAGGCAT-ын дараалалтай. X ба Y-ийн хоорондох ижил төстэй байдал нь 100% {5 ижил нуклеотид / мин[урт(X), урт(Y)]}. Y ба Z хоорондын ижилсэл нь мөн 100% байна. Харин X ба Z хоёрын ижил төстэй байдал нь ердөө 85% {(6 ижил нуклеотид / 7)} байна.
Дараалсан зэрэглэлийн ижил төстэй байдал болон ижил төстэй байдлын хооронд ямар ижил төстэй зүйл байдаг вэ?
- Ижил төстэй байдал болон ижил төстэй байдал нь бидний дараалсан зэрэгцүүлэхэд ашигладаг хоёр нэр томъёо юм.
- Мөн тэд хоёр дарааллын ижил төстэй байдлыг илэрхийлдэг.
- Түүгээр ч барахгүй бид тэдгээрийг хувийн утгаар илэрхийлнэ.
Дараалсан зэрэглэлийн ижил төстэй байдал ба ижил төстэй байдлын хооронд ямар ялгаа байдаг вэ?
Зэрэгцүүлэх ижил төстэй байдал нь харьцуулах үед хоёр дарааллын ижил төстэй байдлыг илэрхийлдэг бол дарааллын зэрэглэл дэх ижил төстэй байдал нь хоёр өөр дарааллын хооронд яг таарч байгаа тэмдэгтүүдийн хэмжээг заана. Иймээс энэ нь дарааллын дагуу ижил төстэй байдал ба ижил төстэй байдлын гол ялгаа юм.
Тогтоон – Дараалалд ижил төстэй байдал ба ижил төстэй байдал
Дараалал хоорондын функциональ, бүтцийн эсвэл хувьслын хамаарлаас үүдэлтэй ДНХ, РНХ эсвэл уургийн ижил төстэй бүс нутгийг тодорхойлоход тусалдаг. Иймээс ижил төстэй байдал, ижил төстэй байдал нь дарааллын дагуух хоёр үндсэн нэр томъёо юм. Эдгээр хоёр нэр томъёоны гол ялгаа нь ижил төстэй байдал нь харьцуулахдаа хоёр дарааллын ижил төстэй байдал, харин ижил төстэй байдал нь хоёр өөр дарааллын хооронд яг таарч байгаа тэмдэгтүүдийн тоо юм. Тиймээс энэ нь дарааллын дагуу ижил төстэй байдал ба ижил төстэй байдлын ялгааны хураангуй юм.