Үндсэн ялгаа – Ангилал ба таамаглал
Ангилал ба таамаглал нь өгөгдөл олборлолттой холбоотой хоёр нэр томъёо юм. Өгөгдөл бараг бүх байгууллагад ашиг орлогоо нэмэгдүүлэх, зах зээлийг ойлгоход чухал ач холбогдолтой. Энгийн өгөгдөл нь тийм ч их үнэ цэнэгүй байдаг. Тиймээс хэрэгтэй мэдээлэл авахын тулд өгөгдлийг боловсруулах хэрэгтэй. Дата олборлолт нь их хэмжээний өгөгдлөөс мэдээлэл гаргаж авдаг технологи юм. Энэ нь мэдээллийн талаар өргөн ойлголттой болоход тусална. Мэдээллийн олборлолтын зарим хэрэглээ нь зах зээлийн шинжилгээ, үйлдвэрлэлийн хяналт, залилан илрүүлэх явдал юм. Ангилал ба таамаглал нь өгөгдөл олборлолттой холбоотой хоёр нэр томъёо юм. Энэ нийтлэлд ангилал ба таамаглалын ялгааг авч үзэх болно. Ангилал гэдэг нь шинэ ажиглалтын харьяалагдах ангилал эсвэл ангийн шошгыг тодорхойлох үйл явц юм. Урьдчилан таамаглах гэдэг нь шинэ ажиглалтад дутуу эсвэл байхгүй тоон өгөгдлийг тодорхойлох үйл явц юм. Энэ бол ангилал ба таамаглалын хоорондох гол ялгаа юм. Урьдчилан таамаглал нь ангилал дахь шиг ангийн шошгонд хамаарахгүй.
Ангилал гэж юу вэ?
Ангилал нь шинэ ажиглалтын ангилал эсвэл ангийн шошгыг тодорхойлох явдал юм. Нэгдүгээрт, багц өгөгдлийг сургалтын өгөгдөл болгон ашигладаг. Оролтын өгөгдлийн багц болон холбогдох гаралтыг алгоритмд өгсөн болно. Тиймээс сургалтын өгөгдлийн багц нь оролтын өгөгдөл болон тэдгээртэй холбоотой ангийн шошгыг агуулдаг. Сургалтын өгөгдлийн багцыг ашиглан алгоритм нь загвар эсвэл ангилагчийг гаргаж авдаг. Гарсан загвар нь шийдвэрийн мод, математикийн томъёо эсвэл мэдрэлийн сүлжээ байж болно. Ангилахдаа загварт шошгогүй өгөгдлийг өгөхөд тухайн загвар нь хамаарах ангиа олох ёстой. Загварт өгсөн шинэ өгөгдөл нь туршилтын өгөгдлийн багц юм.
Ангилал гэдэг нь бичлэгийг ангилах үйл явц юм. Ангилалын нэг энгийн жишээ бол бороо орж байгаа эсэхийг шалгах явдал юм. Хариулт нь тийм эсвэл үгүй байж болно. Тиймээс тодорхой тооны сонголтууд байдаг. Заримдаа ангилахын тулд хоёроос илүү анги байж болно. Үүнийг олон ангиллын ангилал гэж нэрлэдэг. Бодит амьдрал дээр банк тодорхой харилцагчид зээл олгох нь эрсдэлтэй эсэхэд дүн шинжилгээ хийх шаардлагатай байдаг. Энэ жишээнд ангиллын шошгыг олохын тулд загварыг бүтээв. Шошго нь эрсдэлтэй эсвэл аюулгүй байна.
Таамаглал гэж юу вэ?
Өгөгдлийн шинжилгээний өөр нэг үйл явц бол таамаглал юм. Энэ нь тоон гаралтыг олоход хэрэглэгддэг. Ангилалтай адил сургалтын өгөгдлийн багц нь оролт болон холбогдох тоон гаралтын утгыг агуулна. Сургалтын мэдээллийн багцын дагуу алгоритм нь загвар эсвэл таамаглагчийг гаргаж авдаг. Шинэ өгөгдөл өгөх үед загвар нь тоон гаралтыг олох ёстой. Ангилалаас ялгаатай нь энэ арга нь ангийн шошгогүй. Загвар нь тасралтгүй утгатай функц эсвэл эрэмбэлэгдсэн утгыг таамагладаг.
Регрессийг ерөнхийд нь таамаглахад ашигладаг. Өрөөний тоо, нийт талбай гэх мэт баримтуудаас хамааран байшингийн үнэ цэнийг урьдчилан таамаглах нь урьдчилан таамаглах жишээ юм. Компани нь борлуулалтын үеэр үйлчлүүлэгчийн зарцуулсан мөнгөний хэмжээг олж мэдэх боломжтой. Энэ нь бас таамаглах жишээ юм.
Ангилал ба таамаглалын хооронд ямар төстэй зүйл байдаг вэ?
Ангилал болон таамаглал нь өгөгдөл олборлолтод ашигладаг өгөгдөлд дүн шинжилгээ хийх хэлбэр юм
Ангилал ба таамаглал хоёрын ялгаа юу вэ?
Ангилал ба таамаглал |
|
Ангилал гэдэг нь ангиллын гишүүнчлэл нь мэдэгдэж байгаа ажиглалтуудыг агуулсан сургалтын мэдээллийн багцад үндэслэн шинэ ажиглалт аль ангилалд хамаарахыг тодорхойлох үйл явц юм. | Таамаглал гэдэг нь шинэ ажиглалтад дутуу эсвэл байхгүй тоон өгөгдлийг тодорхойлох үйл явц юм. |
Нарийвчлал | |
Ангиллын хувьд нарийвчлал нь ангийн шошгыг зөв олохоос хамаарна. | Урьдчилан таамаглахдаа нарийвчлал нь тухайн таамаглагч шинэ өгөгдлийн урьдчилан тодорхойлсон шинж чанарын утгыг хэр сайн тааж чадахаас хамаарна. |
Загвар | |
Загвар эсвэл ангилагчийг категорийн шошгыг олохын тулд бүтээсэн. | Тасралтгүй утгатай функц эсвэл эрэмбэлэгдсэн утгыг таамаглах загвар эсвэл таамаглагчийг бүтээнэ. |
Загвартай ижил утгатай үгс | |
Ангилалд загварыг ангилагч гэж нэрлэж болно. | Таамаглалд загварыг урьдчилан таамаглагч гэж нэрлэж болно. |
Хураангуй – Ангилал ба таамаглал
Асар их өгөгдлийн багцаас утга учиртай мэдээлэл гаргаж авахыг өгөгдөл олборлох гэж нэрлэдэг. Энэ нийтлэлд ангилал, таамаглал гэх мэт өгөгдөл олборлолтод дүн шинжилгээ хийх хоёр аргыг авч үзэх болно. Хурд, өргөтгөх чадвар, бат бөх байдал нь ангилал, таамаглалын аргын чухал хүчин зүйл юм. Ангилал гэдэг нь шинэ ажиглалтын харьяалагдах ангилал эсвэл ангийн шошгыг тодорхойлох үйл явц юм. Урьдчилан таамаглах гэдэг нь шинэ ажиглалтад дутуу эсвэл байхгүй тоон өгөгдлийг тодорхойлох үйл явц юм. Энэ бол ангилал ба таамаглалын ялгаа юм.