Шугаман ба Логистик регресс
Статистикийн шинжилгээнд судалгаанд хамаарах хувьсагчдын хоорондын хамаарлыг тодорхойлох нь чухал юм. Заримдаа энэ нь шинжилгээний цорын ганц зорилго байж болно. Харилцаа байгаа эсэхийг тогтоох, харилцааг тодорхойлоход ашигладаг хүчирхэг хэрэгсэл бол регрессийн шинжилгээ юм.
Регрессийн шинжилгээний хамгийн энгийн хэлбэр нь шугаман регресс бөгөөд хувьсагчдын хоорондын хамаарал нь шугаман хамаарал юм. Статистикийн хувьд тайлбарлагч хувьсагч ба хариултын хувьсагчийн хоорондын хамаарлыг гаргаж ирдэг. Жишээлбэл, регрессийг ашиглан бид санамсаргүй түүврээс цуглуулсан өгөгдөл дээр үндэслэн барааны үнэ ба хэрэглээний хоорондын хамаарлыг тогтоож чадна. Регрессийн шинжилгээ нь өгөгдлийн багцын регрессийн функцийг бий болгох бөгөөд энэ нь боломжтой өгөгдөлд хамгийн сайн тохирох математик загвар юм. Үүнийг тараах графикаар хялбархан илэрхийлж болно. Графикийн хувьд регресс нь өгөгдсөн өгөгдлийн багцад хамгийн сайн тохирох муруйг олохтой тэнцүү юм. Муруйн функц нь регрессийн функц юм. Математик загварыг ашигласнаар тухайн барааны хэрэглээг өгөгдсөн үнээр урьдчилан таамаглах боломжтой.
Тиймээс регрессийн шинжилгээг урьдчилан таамаглах, таамаглахад өргөн хэрэглэгддэг. Үүнийг туршилтын өгөгдөл, физик, хими, байгалийн шинжлэх ухаан, инженерийн олон салбар дахь харилцаа холбоог тогтооход ашигладаг. Хэрэв хамаарал эсвэл регрессийн функц нь шугаман функц бол процессыг шугаман регресс гэж нэрлэдэг. Тархалтын график дээр үүнийг шулуун шугамаар дүрсэлж болно. Хэрэв функц нь параметрүүдийн шугаман хослол биш бол регресс нь шугаман бус байна.
Логистик регрессийг олон хувьсагчтай регресстэй харьцуулах боломжтой бөгөөд хариултын хувьсагчид олон таамаглагчийн нөлөөллийг тайлбарлах загварыг бий болгодог. Гэсэн хэдий ч логистикийн регрессийн хувьд эцсийн үр дүнгийн хувьсагч нь ангилалтай байх ёстой (ихэвчлэн хуваагдсан; өөрөөр хэлбэл, үхэл эсвэл эсэн мэнд үлдэх гэх мэт хүрч болох хос үр дүн, гэхдээ тусгай техник нь илүү ангилсан мэдээллийг загварчлах боломжийг олгодог). Үр дүнгийн тасралтгүй хувьсагчийг логистикийн регрессэд ашиглахын тулд категориал хувьсагч болгон хувиргаж болно; Гэсэн хэдий ч үргэлжилсэн хувьсагчдыг ийм байдлаар задлах нь нарийвчлалыг бууруулдаг тул голдуу зөвлөдөггүй.
Шугаман регрессээс ялгаатай нь дундаж руу чиглэсэн логистикийн регрессийн таамаглагч хувьсагчдыг шугаман холболттой, түгээмэл тархсан эсвэл кластер болгонд тэнцүү хэлбэлзэлтэй байх албагүй. Үүний үр дүнд таамаглагч болон үр дүнгийн хувьсагчдын хоорондын хамаарал нь шугаман функц байх магадлал багатай.
Логистик болон шугаман регрессийн ялгаа нь юу вэ?
• Шугаман регрессийн хувьд тайлбарлагч хувьсагч болон хариултын хувьсагчийн хооронд шугаман хамаарал байна гэж таамаглаж, загварт нийцэх параметрүүдийг шинжилгээгээр олж, яг тодорхой хамаарлыг өгнө.
• Шугаман регрессийг тоон хувьсагчдад хийх бөгөөд үр дүнд нь тоон функц болно.
• Логистикийн регрессийн үед ашигласан өгөгдөл нь категори эсвэл тоон байж болох ч үр дүн нь үргэлж ангилалтай байдаг.