FASTA болон FASTQ хоёрын ялгаа нь юу вэ?

Агуулгын хүснэгт:

FASTA болон FASTQ хоёрын ялгаа нь юу вэ?
FASTA болон FASTQ хоёрын ялгаа нь юу вэ?

Видео: FASTA болон FASTQ хоёрын ялгаа нь юу вэ?

Видео: FASTA болон FASTQ хоёрын ялгаа нь юу вэ?
Видео: Почему у вас такой низкий уровень сахара в крови натощак 2024, Арваннэгдүгээр
Anonim

FASTA болон FASTQ хоёрын гол ялгаа нь FASTA нь зөвхөн нуклеотид эсвэл уургийн дарааллыг хадгалдаг текстэд суурилсан формат бол FASTQ нь дараалал болон холбогдох дарааллын чанарын утгыг хадгалдаг текстэд суурилсан формат юм.

Биомэдээлэл зүй нь биологийн өгөгдөлд дүн шинжилгээ хийх, ойлгоход, ялангуяа өгөгдлийн багц нь нарийн төвөгтэй, том байх үед янз бүрийн программ хангамж ашигладаг салбар юм. Энэ салбар нь биологи, хими, физик, компьютерийн шинжлэх ухаан, мэдээллийн инженерчлэл, математик, статистикийг нэгтгэн биологийн өгөгдөлд дүн шинжилгээ хийж, тайлбарладаг. FASTA ба FASTQ нь биоинформатикийн чиглэлээр дарааллыг тэгшитгэх, дүн шинжилгээ хийх хоёр дарааллын дүрслэлийн формат юм. Үнэн хэрэгтээ FASTQ нь дарааллын чанарыг хадгалах чадвартай FASTA форматыг өргөтгөдөг дарааллын файлын формат юм.

ФАСТА гэж юу вэ?

FASTA нь ДНХ болон уургийн дарааллыг тохируулах программ юм. FASTA програм хангамж нь FASTA форматыг ашигладаг. Энэ нь нуклеотидын дараалал эсвэл амин хүчлийн (уураг) дарааллыг илэрхийлдэг текстэд суурилсан формат юм. Энд нэг үсэгний код нь эдгээр дарааллыг хоёуланг нь илэрхийлдэг. FASTA бол биоинформатик, биохимийн салбарт чухал хэрэгсэл юм. Энэ формат нь дарааллын нэр болон тайлбарыг дарааллын өмнө оруулахыг зөвшөөрдөг.

Хүснэгт хэлбэрээр FASTA ба FASTQ
Хүснэгт хэлбэрээр FASTA ба FASTQ

Зураг 01: FASTA дараалал

Энэ формат нь FASTA программ хангамжаас гаралтай бөгөөд 1985 онд Дэвид Ж. Липманн, Виллиам Р. Пирсон нар нэвтрүүлсэн. FASTA хэрэгсэл нь цаг хугацааны явцад олон өөрчлөлттэй байсан бөгөөд хамгийн сүүлийн хувилбар нь уураг:уураг, ДНХ-д зориулсан программуудаас бүрддэг.:ДНХ, уураг:орчуулсан ДНХ (фрэймийн шилжилттэй) ба эмх цэгцтэй эсвэл эмх цэгцгүй пептидийн хайлт. FASTA нь өгөгдсөн нуклеотид эсвэл амин хүчлийн дарааллыг уншиж, ижил төстэй мэдээллийн сангийн дарааллыг олохын тулд орон нутгийн дарааллын тохируулгыг ашиглан харгалзах дарааллын мэдээллийн санг хайдаг.

FASTQ гэж юу вэ?

FASTQ нь биологийн дараалал (ихэвчлэн нуклеотидын дараалал) болон түүнд харгалзах чанарын оноог хоёуланг нь хадгалдаг биоинформатикийн салбарт хэрэглэгддэг тохируулагч программ хангамж юм. FASTQ-г Wellcome Trust Sanger институтээс FASTA форматтай дараалал болон холбогдох чанарын өгөгдлийг багцлах зорилгоор анх боловсруулсан. Био-информатикийн салбарыг хөгжүүлснээр FASTQ нь өндөр хүчин чадалтай олон тооны дарааллын төхөөрөмжүүдийн гаралтыг хадгалах бодит стандарт болсон.

FASTQ формат нь нэг дараалалд дөрвөн өөр мөр ашигладаг. 1-р мөрөнд @ тэмдэгтээр эхэлж, дарааллын тодорхойлогч (FASTA гарчгийн мөртэй төстэй) байна. 2-р мөр нь түүхий дараалсан үсгүүдээс бүрдэнэ. 3-р мөрөнд дараалал нь '+' тэмдэгтээр эхэлж, дарааллаар нь ижил дарааллын тодорхойлогч байна.4-р мөрөнд 2-р мөрөнд байгаа дарааллын чанарын утгыг кодлох ба дарааллын үсэгтэй ижил тооны тэмдэгтээс бүрдэх ёстой.

FASTA болон FASTQ хоёрын ижил төстэй талууд юу вэ?

  • FASTA болон FASTQ зэрэгцүүлэх хэрэгсэл юм.
  • Эдгээр нь дараалсан дүрслэлийн хоёр формат юм.
  • Хоёулаа биоинформатикийн салбартай холбоотой.
  • FAST болон FASTQ хоёулаа хадгалах, дараалал тогтоох чухал хэрэгсэл юм.
  • FASTQ нь дарааллын чанарыг хадгалах чадвартай FASTA форматын өргөтгөл юм.

FASTA болон FASTQ хоёрын ялгаа юу вэ?

FASTA нь зөвхөн нуклеотид эсвэл уургийн дарааллыг хадгалдаг текстэд суурилсан формат бол FASTQ нь дараалал болон холбогдох дарааллын чанарын утгыг хадгалдаг текстэд суурилсан формат юм. Тиймээс энэ нь FASTA болон FASTQ хоёрын гол ялгаа юм. Түүнчлэн FASTA нь зураглал хийсний дараа дарааллын фрагментуудыг хадгалдаг бол FASTQ нь зураглал хийхээс өмнө дарааллын хэсгүүдийг хадгалдаг. Үүнээс гадна FASTA болон FASTQ хоёрын өөр нэг ялгаа нь FASTA нь нэг тайлбарын мөр, FASTAQ нь дөрвөн мөрөөс бүрддэг.

Доорх инфографик нь FASTA болон FASTQ хоёрын ялгааг зэрэгцүүлэн харьцуулахын тулд хүснэгт хэлбэрээр үзүүлэв.

Хураангуй – FASTA vs FASTQ

Биомэдээлэл зүй нь FASTA, FASTQ гэх мэт дарааллын өөр өөр форматыг ашигладаг. FASTA нь дарааллын фрагментуудыг зурагдсаны дараа хадгалдаг бол FASTQ нь зураглал хийхээс өмнө дарааллын хэсгүүдийг хадгалдаг. FASTA нь ДНХ болон уургийн дарааллыг тохируулах програм хангамж юм. Энэ нь уураг: уураг, ДНХ: ДНХ, уураг: орчуулагдсан ДНХ (фрэймийн шилжилттэй), эрэмбэлэгдсэн эсвэл эрэмбэлэгдээгүй пептидийн хайлт хийх програмуудаас бүрдэнэ. FASTQ нь биоинформатикийн салбарт хэрэглэгддэг тохируулагч программ хангамж бөгөөд биологийн дараалал (ихэвчлэн нуклеотидын дараалал) болон түүнд тохирох чанарын оноог хоёуланг нь хадгалдаг. FASTA нь нэг тайлбарын мөрөөс, FASTQ нь дөрвөн мөрөөс бүрдэнэ. Тиймээс, энэ нь FASTA болон FASTQ хоёрын ялгааг нэгтгэн харуулав.

Зөвлөмж болгож буй: