DBMS-ийн эсрэг Дата олборлолт
МБМС (Өгөгдлийн сангийн удирдлагын систем) нь өгөгдлийн сангийн агуулгыг хадгалах, өгөгдөл үүсгэх/засварлах, хайлт хийх болон бусад функцуудыг хийх боломжийг олгодог тоон мэдээллийн санг удирдахад ашигладаг иж бүрэн систем юм. Нөгөөтэйгүүр, Data Mining нь компьютерийн шинжлэх ухааны салбар бөгөөд түүхий өгөгдлөөс урьд өмнө мэдэгдээгүй, сонирхолтой мэдээллийг гаргаж авдаг. Ихэвчлэн Data mining процессын оролт болгон ашигладаг өгөгдлийг мэдээллийн санд хадгалдаг. Статистик мэдээлэлд дуртай хэрэглэгчид Data Mining ашигладаг. Тэд өгөгдлийн далд хэв маягийг хайхын тулд статистикийн загваруудыг ашигладаг. Өгөгдөл олборлогчид өөр өөр өгөгдлийн элементүүдийн хооронд ашигтай харилцааг олох сонирхолтой байдаг бөгөөд энэ нь эцэстээ бизнесүүдэд ашигтай байдаг.
DBMS
МБМС нь заримдаа өгөгдлийн сангийн менежер гэж нэрлэгддэг бөгөөд системд суулгасан бүх мэдээллийн санг (жишээ нь хатуу диск эсвэл сүлжээ) удирдахад (жишээ нь, зохион байгуулалт, хадгалалт, сэргээлт) зориулагдсан компьютерийн програмуудын цуглуулга юм.. Дэлхий дээр янз бүрийн төрлийн өгөгдлийн сангийн удирдлагын системүүд байдаг бөгөөд тэдгээрийн зарим нь тодорхой зорилгоор тохируулагдсан мэдээллийн санг зөв удирдахад зориулагдсан байдаг. Арилжааны мэдээллийн сангийн удирдлагын хамгийн алдартай системүүд нь Oracle, DB2, Microsoft Access юм. Эдгээр бүх бүтээгдэхүүнүүд нь өөр өөр хэрэглэгчдэд өөр өөр түвшний эрхүүдийг хуваарилах боломжийг олгодог бөгөөд энэ нь DBMS-ийг нэг администраторын төвлөрсөн байдлаар хянах эсвэл хэд хэдэн өөр хүмүүст хуваарилах боломжийг олгодог. Аливаа мэдээллийн сангийн удирдлагын системд дөрвөн чухал элемент байдаг. Эдгээр нь загварчлалын хэл, өгөгдлийн бүтэц, хайлтын хэл, гүйлгээний механизм юм. Загварын хэл нь DBMS-д байрлах мэдээллийн сан бүрийн хэлийг тодорхойлдог. Одоогийн байдлаар шаталсан, сүлжээ, харилцаа холбоо, объект гэх мэт хэд хэдэн түгээмэл хандлага практикт хэрэгжиж байна. Өгөгдлийн бүтэц нь бие даасан бүртгэл, файл, талбар, тэдгээрийн тодорхойлолт, харааны хэрэгсэл гэх мэт өгөгдлийг зохион байгуулахад тусалдаг. Өгөгдлийн хайлтын хэл нь нэвтрэх өгөгдөл, өөр өөр хэрэглэгчдэд хандах эрх, системд өгөгдөл нэмэх протоколуудыг хянах замаар мэдээллийн сангийн аюулгүй байдлыг хангадаг. SQL бол Relational Database Management Systems-д хэрэглэгддэг түгээмэл хайлтын хэл юм. Эцэст нь, гүйлгээ хийх боломжийг олгодог механизм нь харилцан уялдаатай, олон талт байдалд тусалдаг. Энэхүү механизм нь нэг бичлэгийг олон хэрэглэгч нэгэн зэрэг өөрчлөхгүй байх ба ингэснээр өгөгдлийн бүрэн бүтэн байдлыг хадгална. Нэмж хэлэхэд, DBMS нь нөөц болон бусад хэрэгслийг хангадаг.
Дата олборлолт
Өгөгдөл олборлолтыг Өгөгдөл дэх Мэдлэг илрүүлэх (KDD) гэж бас нэрлэдэг. Дээр дурдсанчлан, энэ нь урьд өмнө мэдэгдээгүй, сонирхолтой мэдээллийг түүхий өгөгдлөөс гаргаж авдаг компьютерийн шинжлэх ухаан юм. Өгөгдлийн экспоненциал өсөлтийн улмаас, ялангуяа бизнес гэх мэт салбарт өгөгдөл олборлох нь сүүлийн хэдэн арван жилд хэв маягийг гараар задлах боломжгүй мэт санагдах болсон тул энэ их хэмжээний өгөгдлийг бизнесийн оюун ухаанд хөрвүүлэх маш чухал хэрэгсэл болсон. Жишээлбэл, энэ нь одоогоор нийгмийн сүлжээний шинжилгээ, залилан илрүүлэх, маркетинг гэх мэт янз бүрийн програмуудад ашиглагдаж байна. Өгөгдлийн олборлолт нь ихэвчлэн кластер, ангилал, регресс, холбоо гэсэн дөрвөн ажлыг гүйцэтгэдэг. Бүтэцгүй өгөгдлөөс ижил төстэй бүлгүүдийг тодорхойлохыг кластер гэдэг. Ангилал гэдэг нь шинэ өгөгдөлд хэрэглэж болох сургалтын дүрэм бөгөөд ихэвчлэн дараах алхмуудыг багтаана: өгөгдлийг урьдчилан боловсруулах, загварчлах, суралцах/онцлогын сонголт, үнэлгээ/баталгаажуулалт. Регресс нь өгөгдлийг загварчлахад хамгийн бага алдаатай функцүүдийг олох явдал юм. Мөн ассоциаци нь хувьсагчдын хоорондын хамаарлыг хайж байдаг. Дата олборлолтыг ихэвчлэн Wal-Mart-аас ирэх жил өндөр ашиг олоход туслах гол бүтээгдэхүүн юу вэ? гэх мэт асуултуудад хариулахад ашигладаг.
DBMS болон Data mining хоёрын ялгаа нь юу вэ?
МБМС нь дижитал мэдээллийн сангуудыг байршуулах, удирдах бүрэн хэмжээний систем юм. Гэсэн хэдий ч Data Mining нь компьютерийн шинжлэх ухаанд ашиг тустай, урьд өмнө мэдэгдээгүй мэдээллийг түүхий өгөгдлөөс гаргаж авах арга техник эсвэл ойлголт юм. Ихэнх тохиолдолд эдгээр түүхий өгөгдөл нь маш том мэдээллийн санд хадгалагддаг. Тиймээс өгөгдөл олборлогчид өгөгдөл олборлох процессын өмнө болон явцад түүхий өгөгдлийг боловсруулах, удирдах, урьдчилан боловсруулахад DBMS-ийн одоо байгаа функцуудыг ашигладаг. Гэсэн хэдий ч DBMS системийг зөвхөн өгөгдөлд дүн шинжилгээ хийхэд ашиглах боломжгүй. Гэхдээ одоогийн байдлаар зарим DBMS нь өгөгдөлд дүн шинжилгээ хийх хэрэгсэл эсвэл чадамжтай.