Data Mining vs Query Tools
Асуулгын хэрэгсэл нь мэдээллийн сан дахь өгөгдөлд дүн шинжилгээ хийхэд тусалдаг хэрэгсэл юм. Эдгээр нь асуулга үүсгэх, асуулга засварлах, хайх, олох, тайлагнах, нэгтгэн дүгнэх функцуудыг хангадаг. Нөгөөтэйгүүр, Data mining нь компьютерийн шинжлэх ухааны салбар бөгөөд түүхий өгөгдлөөс урьд өмнө мэдэгдээгүй, сонирхолтой мэдээллийг гаргаж авдаг. Өгөгдөл олборлох процессын оролт болгон ашигладаг өгөгдлийг ихэвчлэн мэдээллийн санд хадгалдаг. Статистик мэдээлэлд дуртай хэрэглэгчид Data Mining ашигладаг. Тэд өгөгдлийн далд хэв маягийг хайхын тулд статистикийн загваруудыг ашигладаг. Өгөгдөл олборлогчид өөр өөр өгөгдлийн элементүүдийн хооронд ашигтай харилцааг олох сонирхолтой байдаг бөгөөд энэ нь эцэстээ бизнесүүдэд ашигтай байдаг.
Дата олборлолт
Өгөгдөл олборлолтыг Өгөгдөл дэх Мэдлэг илрүүлэх (KDD) гэж бас нэрлэдэг. Дээр дурдсанчлан энэ нь компьютерийн шинжлэх ухааны салбар бөгөөд түүхий өгөгдлөөс урьд өмнө мэдэгдээгүй, сонирхолтой мэдээллийг гаргаж авдаг. Өгөгдлийн экспоненциал өсөлтийн улмаас, ялангуяа бизнес гэх мэт салбарт өгөгдөл олборлох нь сүүлийн хэдэн арван жилд хэв маягийг гараар задлах боломжгүй мэт санагдах болсон тул энэ их хэмжээний өгөгдлийг бизнесийн оюун ухаанд хөрвүүлэх маш чухал хэрэгсэл болсон. Жишээлбэл, энэ нь одоогоор нийгмийн сүлжээний шинжилгээ, залилан илрүүлэх, маркетинг гэх мэт янз бүрийн програмуудад ашиглагдаж байна. Өгөгдлийн олборлолт нь ихэвчлэн кластер, ангилал, регресс, холбоо гэсэн дөрвөн ажлыг гүйцэтгэдэг. Бүтэцгүй өгөгдлөөс ижил төстэй бүлгүүдийг тодорхойлохыг кластер гэдэг. Ангилал гэдэг нь шинэ өгөгдөлд хэрэглэж болох сургалтын дүрэм бөгөөд ихэвчлэн дараах алхмуудыг багтаана: өгөгдлийг урьдчилан боловсруулах, загварчлах, суралцах/онцлогын сонголт, үнэлгээ/баталгаажуулалт. Регресс нь өгөгдлийг загварчлахад хамгийн бага алдаатай функцүүдийг олох явдал юм. Мөн ассоциаци нь хувьсагчдын хоорондын хамаарлыг хайж байдаг. Дата олборлолтыг ихэвчлэн Wal-Mart-аас ирэх жил өндөр ашиг олоход туслах гол бүтээгдэхүүн юу вэ? гэх мэт асуултуудад хариулахад ашигладаг.
Асуулгын хэрэгсэл
Асуулгын хэрэгсэл нь мэдээллийн сан дахь өгөгдөлд дүн шинжилгээ хийхэд тусалдаг хэрэгсэл юм. Ихэвчлэн эдгээр асуулгын хэрэгслүүд нь асуултуудыг шинж чанаруудын багц болгон оруулахад хялбар арга бүхий GUI урд төгсгөлтэй байдаг. Эдгээр оролтыг өгсний дараа уг хэрэгсэл нь мэдээллийн сангийн ашигладаг үндсэн асуулгын хэлнээс бүрдсэн бодит асуулга үүсгэдэг. SQL, T-SQL болон PL/SQL нь өнөөдөр олон алдартай мэдээллийн санд хэрэглэгддэг асуулгын хэлнүүдийн жишээ юм. Дараа нь эдгээр үүсгэсэн асуулга нь өгөгдлийн сангийн эсрэг хийгдэж, асуулгын үр дүнг хэрэглэгчдэд эмх цэгцтэй, ойлгомжтой байдлаар танилцуулж эсвэл мэдээлдэг. Ер нь хэрэглэгч Query хэрэглүүрийг ашиглахын тулд өгөгдлийн сангийн тусгай асуулгын хэлийг мэдэх шаардлагагүй. Query хэрэгслүүдийн гол онцлог нь нэгдсэн асуулга үүсгэгч, засварлагч, зуны тайлан, тоо, импорт, экспортын функцууд, дэвшилтэт хайх/хайх чадварууд юм.
Data mining болон Query Tools хоёрын ялгаа нь юу вэ?
Асуулгын хэрэгслийг хялбархан үүсгэж, мэдээллийн санд асуулга оруулахад ашиглаж болно. Асуулгын хэрэгслүүд нь өгөгдлийн сангийн тусгай асуулгын хэлийг сурах шаардлагагүйгээр асуулга үүсгэхэд маш хялбар болгодог. Нөгөөтэйгүүр, Data Mining нь компьютерийн шинжлэх ухаанд ашиг тустай, урьд өмнө мэдэгдээгүй мэдээллийг түүхий өгөгдлөөс гаргаж авах арга техник эсвэл ойлголт юм. Ихэнх тохиолдолд эдгээр түүхий өгөгдөл нь маш том мэдээллийн санд хадгалагддаг. Тиймээс өгөгдөл олборлогчид өгөгдөл олборлох процессоос өмнө түүхий өгөгдлийг урьдчилан боловсруулахын тулд Query Tools-ийн одоо байгаа функцуудыг ашиглаж болно. Гэсэн хэдий ч, Data mining техник болон Query хэрэгслийг ашиглах хоёрын гол ялгаа нь Query хэрэгслийг ашиглахын тулд хэрэглэгчид яг юу хайж байгаагаа мэдэх шаардлагатай байдаг бол өгөгдөл олборлолтыг ихэвчлэн хэрэглэгч юуны талаар тодорхойгүй ойлголттой үед ашигладаг. хайж байна.