Гол ялгаа – Хяналттай ба Хяналтгүй машин сургалт
Хяналттай суралцах ба хяналтгүй суралцах нь машин сургалтын хоёр үндсэн ойлголт юм. Хяналттай сургалт нь оролт-гаралтын хосын жишээн дээр тулгуурлан оролтыг гаралт руу буулгадаг функцийг сурах машин сургалтын даалгавар юм. Хяналтгүй сургалт гэдэг нь шошгогүй өгөгдлөөс далд бүтцийг дүрслэх функцийг гаргах машин сургалтын даалгавар юм. Хяналттай болон хяналтгүй машин сургалтын гол ялгаа нь хяналттай сургалт шошготой өгөгдлийг ашигладаг бол хяналтгүй сургалт нь шошгогүй өгөгдлийг ашигладагт оршино.
Machine Learning нь компьютерийн системд тодорхой програмчлуулалгүйгээр өгөгдлөөс суралцах боломжийг олгодог Компьютерийн шинжлэх ухааны салбар юм. Энэ нь өгөгдөлд дүн шинжилгээ хийх, тэдгээрийн хэв маягийг урьдчилан таамаглах боломжийг олгодог. Машин сургалтын олон хэрэглээ байдаг. Тэдгээрийн зарим нь царай таних, дохио зангаа таних, яриа таних юм. Машин сурахтай холбоотой янз бүрийн алгоритмууд байдаг. Тэдгээрийн зарим нь регресс, ангилал, кластерчлал юм. Машины сургалтанд суурилсан програмуудыг хөгжүүлэх хамгийн түгээмэл програмчлалын хэл бол R болон Python юм. Java, C++, Matlab зэрэг бусад хэлийг бас ашиглаж болно.
Хяналттай сургалт гэж юу вэ?
Машины сургалтанд суурилсан системд загвар нь алгоритмын дагуу ажилладаг. Удирдлагатай сургалтанд загвар нь хяналтанд байдаг. Нэгдүгээрт, загварыг сургах шаардлагатай. Олж авсан мэдлэгээрээ ирээдүйн тохиолдлуудын хариултыг урьдчилан таамаглах боломжтой. Загварыг шошготой өгөгдлийн багц ашиглан сургадаг. Системд түүврийн бус өгөгдлийг өгөхөд үр дүнг урьдчилан таамаглах боломжтой. Дараах нь алдартай IRIS өгөгдлийн багцаас жижиг ишлэл юм.
Дээрх хүснэгтээс үзэхэд Сепалын урт, Хажуугийн өргөн, Пателийн урт, Пателийн өргөн, Зүйлийг шинж чанарууд гэж нэрлэдэг. Багануудыг онцлог гэж нэрлэдэг. Нэг мөрөнд бүх шинж чанарын өгөгдөл байна. Тиймээс нэг мөрийг ажиглалт гэж нэрлэдэг. Өгөгдөл нь тоон болон категори хэлбэртэй байж болно. Загварт ажиглалтыг харгалзах зүйлийн нэрээр оруулсан болно. Шинэ ажиглалт хийх үед тухайн загвар нь ямар төрлийн зүйлд хамаарахаа урьдчилан таамаглах ёстой.
Хяналттай сургалтанд ангилал болон регрессийн алгоритмууд байдаг. Ангилал гэдэг нь хаяглагдсан өгөгдлийг ангилах үйл явц юм. Энэхүү загвар нь өгөгдлийн ангиллыг тусгаарласан хил хязгаарыг бий болгосон. Загварт шинэ өгөгдөл өгөх үед тухайн цэг хаана байгааг үндэслэн ангилж болно. Хамгийн ойрын хөршүүд (KNN) нь ангиллын загвар юм. k утгаас хамааран ангиллыг шийднэ. Жишээлбэл, k нь 5 байх үед тухайн өгөгдлийн цэг нь А ангилалд найман өгөгдлийн цэг, В ангилалд зургаан өгөгдлийн цэгт ойрхон байвал өгөгдлийн цэгийг A гэж ангилна.
Регресс гэдэг нь шинэ өгөгдлийн үр дүнг урьдчилан таамаглахын тулд өмнөх өгөгдлийн чиг хандлагыг урьдчилан таамаглах үйл явц юм. Регрессийн хувьд гаралт нь нэг буюу хэд хэдэн тасралтгүй хувьсагчаас бүрдэж болно. Урьдчилан таамаглахдаа ихэнх өгөгдлийн цэгүүдийг хамарсан шугам ашиглан хийдэг. Хамгийн энгийн регрессийн загвар бол шугаман регресс юм. Энэ нь хурдан бөгөөд KNN шиг тааруулах параметрүүдийг шаарддаггүй. Хэрэв өгөгдөл параболик хандлагыг харуулж байвал шугаман регрессийн загвар тохиромжгүй.
Эдгээр нь хяналттай сургалтын алгоритмуудын зарим жишээ юм. Ерөнхийдөө, оруулсан өгөгдөл нь сайн мэдэгдэж, шошготой байдаг тул хяналттай сургалтын аргуудаас бий болсон үр дүн нь илүү үнэн зөв, найдвартай байдаг. Тиймээс машин зөвхөн далд хэв маягт дүн шинжилгээ хийх ёстой.
Хяналтгүй сургалт гэж юу вэ?
Хяналтгүй суралцах үед загвар нь хяналтгүй байдаг. Загвар нь үр дүнг урьдчилан таамаглахын тулд бие даан ажилладаг. Энэ нь шошгогүй өгөгдөл дээр дүгнэлт гаргахын тулд машин сургалтын алгоритмуудыг ашигладаг. Ерөнхийдөө мэдээлэл багатай учраас хяналтгүй сургалтын алгоритм нь хяналттай сургалтын алгоритмаас илүү хэцүү байдаг. Кластер нь хараа хяналтгүй сургалтын нэг төрөл юм. Үүнийг алгоритм ашиглан үл мэдэгдэх өгөгдлийг бүлэглэхэд ашиглаж болно. k-дундаж болон нягтралд суурилсан кластер нь хоёр кластерийн алгоритм юм.
k-дундаж алгоритм, кластер бүрийн хувьд k төвийг санамсаргүй байдлаар байрлуулна. Дараа нь өгөгдлийн цэг бүрийг хамгийн ойрын төв хэсэгт хуваарилна. Өгөгдлийн цэгээс төв хүртэлх зайг тооцоолоход Евклидийн зайг ашигладаг. Өгөгдлийн цэгүүдийг бүлэгт ангилдаг. k центроидуудын байрлалыг дахин тооцоолно. Төвийн шинэ байрлалыг бүлгийн бүх цэгүүдийн дундажаар тодорхойлно. Дахин хэлэхэд өгөгдлийн цэг бүрийг хамгийн ойрын төв хэсэгт хуваарилдаг. Центроидууд өөрчлөгдөхгүй болтол энэ үйл явц давтагдана. k-mean нь хурдан кластер хийх алгоритм боловч кластерын цэгүүдийг эхлүүлэх тодорхой заагаагүй байна. Мөн кластерын цэгүүдийг эхлүүлэхэд үндэслэсэн кластерын загваруудын олон янз байдал бий.
Бас нэг кластер хийх алгоритм бол нягтралд суурилсан кластерчлал юм. Үүнийг дуу чимээтэй нягтралд суурилсан орон зайн кластерын програмууд гэж бас нэрлэдэг. Энэ нь кластерыг хамгийн их нягтралтай холбогдсон цэгүүд гэж тодорхойлох замаар ажилладаг. Эдгээр нь нягтралд суурилсан кластер хийхэд хэрэглэгддэг хоёр параметр юм. Эдгээр нь Ɛ (эпсилон) ба хамгийн бага цэгүүд юм. Ɛ нь хөршийн хамгийн их радиус юм. Хамгийн бага оноо нь кластерыг тодорхойлох Ɛ орчмын хамгийн бага оноо юм. Эдгээр нь хяналтгүй суралцахад хамаарах кластерын зарим жишээ юм.
Ерөнхийдөө хяналтгүй сургалтын алгоритмаас гарсан үр дүн нь тийм ч үнэн зөв, найдвартай биш байдаг, учир нь машин нь далд хэв маяг, функцийг тодорхойлохын өмнө оролтын өгөгдлийг тодорхойлж, шошголох ёстой.
Хяналттай болон хяналтгүй машин сургалтын хооронд ямар ялгаа байдаг вэ?
Хяналттай болон хяналтгүй сургалт нь машин сургалтын төрөл юм
Хяналттай болон хяналтгүй машин сургалтын хооронд ямар ялгаа байдаг вэ?
Хяналттай ба Хяналтгүй машин сургалт |
|
Хяналттай сургалт нь жишээ оролт-гаралтын хос дээр тулгуурлан оролтыг гаралт руу буулгадаг функцийг сурахад зориулагдсан Машин сургалтын даалгавар юм. | Хяналтгүй сургалт нь шошгогүй өгөгдлөөс далд бүтцийг тайлбарлах функцийг гаргах машин сургалтын даалгавар юм. |
Үндсэн функц | |
Хяналттай сургалтанд загвар нь шошготой оролтын өгөгдөл дээр үндэслэн үр дүнг таамагладаг. | Хяналтгүй суралцах үед загвар нь хэв маягийг бие даан тодорхойлох замаар шошготой өгөгдөлгүйгээр үр дүнг таамагладаг. |
Үр дүнгийн нарийвчлал | |
Хяналттай сургалтын аргуудаас гарсан үр дүн нь илүү үнэн зөв бөгөөд найдвартай. | Хяналтгүй сургалтын аргуудаас гарсан үр дүн тийм ч үнэн зөв, найдвартай биш байна. |
Үндсэн алгоритмууд | |
Хяналттай сургалтанд регресс болон ангиллын алгоритмууд байдаг. | Хяналтгүй сургалтанд кластер хийх алгоритмууд байдаг. |
Хураангуй – Хяналттай ба Хяналтгүй машин сургалт
Хяналттай сургалт ба хяналтгүй сургалт нь машин сургалтын хоёр төрөл юм. Хяналттай сургалт нь жишээ оролт гаралтын хос дээр тулгуурлан оролтыг гаралт руу буулгах функцийг сурах машин сургалтын даалгавар юм. Хяналтгүй сургалт гэдэг нь шошгогүй өгөгдлөөс далд бүтцийг дүрслэх функцийг гаргах машин сургалтын даалгавар юм. Хяналттай болон хяналтгүй машин сургалтын хоорондох ялгаа нь хяналттай сургалт нь шошготой өгөгдлийг ашигладаг бол хяналтгүй налуу нь шошгогүй өгөгдлийг ашигладагт оршино.