RDBMS болон Hadoop-ын гол ялгаа нь RDBMS нь бүтэцлэгдсэн өгөгдлийг хадгалдаг бол Hadoop нь бүтэцлэгдсэн, хагас бүтэцтэй, бүтэцгүй өгөгдлийг хадгалдагт оршино.
RDBMS нь харилцааны загварт суурилсан мэдээллийн сангийн удирдлагын систем юм. Hadoop нь бараа материалын кластерууд дээр өгөгдөл хадгалах, програмуудыг ажиллуулах програм хангамж юм.
RDBMS гэж юу вэ?
RDBMS нь харилцааны загварт суурилсан Relational Database Management System гэсэн товчлол юм. RDBMS-д хүснэгтүүдийг өгөгдөл хадгалахад ашигладаг бөгөөд түлхүүрүүд болон индексүүд нь хүснэгтүүдийг холбоход тусалдаг. Хүснэгт нь өгөгдлийн элементүүдийн цуглуулга бөгөөд тэдгээр нь аж ахуйн нэгж юм. Энэ нь мөр, багана агуулдаг. Мөрүүд нь хүснэгтийн нэг оруулгыг илэрхийлнэ. Баганууд нь шинж чанаруудыг илэрхийлдэг.
Жишээ нь, борлуулалтын мэдээллийн санд үйлчлүүлэгч болон бүтээгдэхүүний нэгж байж болно. Үйлчлүүлэгч нь хэрэглэгчийн_id, нэр, хаяг, утасны дугаар зэрэг шинж чанаруудтай байж болно. Тухайн зүйл нь product_id, name гэх мэт шинж чанаруудтай байж болно. Хэрэглэгчийн хүснэгтийн үндсэн түлхүүр нь customer_id, харин бүтээгдэхүүний хүснэгтийн үндсэн түлхүүр нь product_id юм. Хэрэглэгчийн хүснэгтэд product_id-г гадаад түлхүүр болгон байрлуулах нь эдгээр хоёр нэгжийг холбодог. Үүний нэгэн адил хүснэгтүүд хоорондоо холбоотой байдаг. Тэд өгөгдлийн бүрэн бүтэн байдал, хэвийн байдал болон бусад олон зүйлийг хангадаг. Нийтлэг RDBMS-ийн цөөхөн нь MySQL, MSSQL болон Oracle юм. Тэд асуулгад SQL ашигладаг.
Hadoop гэж юу вэ?
Hadoop нь Java хэл дээр бичигдсэн Apache нээлттэй эхийн хүрээ юм. Энэ нь энгийн програмчлалын загваруудыг ашиглан компьютерийн кластеруудад их хэмжээний өгөгдлийг хадгалах, боловсруулахад тусалдаг. Hadoop-ийн гол зорилго нь их хэмжээний нарийн төвөгтэй өгөгдлийг хэлдэг Big Data-г хадгалах, боловсруулах явдал юм. Тодорхой хугацааны дотор их хэмжээний өгөгдлийг боловсруулах хүчин чадал болох Hadoop-ийн нэвтрүүлэх чадвар өндөр.
Hadoop архитектурт дөрвөн модуль байдаг. Эдгээр нь Hadoop нийтлэг, YARN, Hadoop Distributed File System (HDFS), Hadoop MapReduce юм. Нийтлэг модуль нь Java сангууд болон хэрэгслүүдийг агуулдаг. Мөн Hadoop-ыг эхлүүлэх файлуудтай. Hadoop YARN нь ажлын хуваарь болон кластерийн нөөцийн удирдлагыг гүйцэтгэдэг.
Цаашилбал, Hadoop Distributed File System (HDFS) нь Hadoop хадгалах систем юм. Энэ нь мастер-боол архитектурыг ашигладаг. Мастер зангилаа нь NameNode бөгөөд файлын системийн мета өгөгдлийг удирддаг. Бусад компьютерууд нь slave node эсвэл DataNodes юм. Тэд бодит өгөгдлийг хадгалдаг. Нөгөө талаас, Hadoop MapReduce нь тархсан тооцооллыг хийдэг. Энэ нь өгөгдлийг боловсруулах алгоритмтай. HDFS-д Мастер зангилаа нь ажил хянагчтай байдаг. Энэ нь боол зангилаанууд дээр газрын зураг багасгах ажлыг ажиллуулдаг. Мэдээллийн боловсруулалтыг дуусгах, үр дүнг мастер зангилаа руу буцаан илгээх зорилгоор боол зангилаа бүрт Task Tracker байдаг. Ерөнхийдөө Hadoop нь өндөр боловсруулах хүчин чадалтай их хэмжээний өгөгдлийг хадгалах боломжийг олгодог.
RDBMS болон Hadoop хоёрын ялгаа юу вэ?
RDBMS vs Hadoop |
|
RDBMS нь харилцааны загварт суурилсан мэдээллийн сан үүсгэх, удирдахад зориулагдсан системийн програм хангамж юм. | Hadoop бол их хэмжээний өгөгдөл, тооцоололтой холбоотой асуудлыг шийдвэрлэхийн тулд олон компьютерийг холбосон нээлттэй эхийн програм хангамжийн цуглуулга юм. |
Өгөгдлийн төрөл | |
RDBMS нь бүтэцлэгдсэн өгөгдлийг хадгалдаг. | Hadoop нь бүтэцлэгдсэн, хагас бүтэцтэй, бүтэцгүй өгөгдлийг хадгалдаг. |
Өгөгдөл хадгалах | |
RDBMS нь дундаж өгөгдлийг хадгалдаг. | Hadoop нь RDBMS-ээс их хэмжээний өгөгдөл хадгалдаг. |
Хурд | |
RDBMS-д унших нь хурдан байдаг. | Hadoop дээр унших, бичих нь хурдан. |
Томжуулах боломжтой | |
RDBMS нь босоо өргөтгөх чадвартай. | Hadoop нь хэвтээ өргөтгөх чадвартай. |
Тоног төхөөрөмж | |
RDBMS дээд зэргийн сервер ашигладаг. | Hadoop нь барааны техник хангамж ашигладаг. |
Дамжуулах чадвар | |
RDBMS дамжуулах чадвар илүү өндөр. | Hadoop дамжуулах чадвар бага байна. |
Хураангуй – RDBMS vs Hadoop
Энэ нийтлэлд RDBMS болон Hadoop хоёрын ялгааг авч үзсэн. RDBMS болон Hadoop хоёрын гол ялгаа нь RDBMS нь бүтэцлэгдсэн өгөгдлийг хадгалдаг бол Hadoop нь бүтэцлэгдсэн, хагас бүтэцтэй, бүтэцгүй өгөгдлийг хадгалдагт оршино.