Variance vs Covariance
Варианс ба ковариац нь статистикт хэрэглэгддэг хоёр хэмжүүр юм. Варианс нь өгөгдлийн тархалтын хэмжүүр бөгөөд ковариац нь хоёр санамсаргүй хэмжигдэхүүний хамтдаа өөрчлөгдөх зэргийг илэрхийлдэг. Вариац нь зөн совингийн ойлголт боловч ковариац нь анхандаа тийм ч ойлгомжтой биш байхаар математикийн хувьд тодорхойлогддог.
Variance-н талаар дэлгэрэнгүй
Variance нь тархалтын дундаж утгаас өгөгдлийн тархалтыг хэмжих хэмжүүр юм. Энэ нь өгөгдлийн цэгүүд нь тархалтын дунджаас хэр хол оршдогийг хэлдэг. Энэ нь магадлалын тархалтын үндсэн тодорхойлогчдын нэг бөгөөд тархалтын мөчүүдийн нэг юм. Мөн дисперс нь олонлогийн параметр бөгөөд олонлогоос авсан түүврийн дисперс нь олонлогийн дисперсийн үнэлгээний үүрэг гүйцэтгэдэг. Нэг өнцгөөс харахад энэ нь стандарт хазайлтын квадрат гэж тодорхойлогддог.
Энгийн хэлээр үүнийг өгөгдлийн цэг бүрийн хоорондох зайны квадратуудын дундаж ба тархалтын дундаж гэж тодорхойлж болно. Дараах томьёог зөрүүг тооцоолоход ашиглана.
Var(X)=E[(X-µ)2] хүн амд болон
Var(X)=E[(X-‾x)2] түүвэрт
Var(X)=E[X2]-(E[X])2 гэж өгөхийн тулд үүнийг илүү хялбарчилж болно.
Variance нь гарын үсэг зурах шинж чанартай бөгөөд хэрэглээг хялбар болгох үүднээс статистикт ихэвчлэн ашиглагддаг. Вариац нь сөрөг биш, учир нь энэ нь зайны квадрат юм. Гэсэн хэдий ч хэлбэлзлийн хүрээ хязгаарлагдмал биш бөгөөд тодорхой тархалтаас хамаарна. Тогтмол санамсаргүй хэмжигдэхүүний дисперс нь тэг байх ба байршлын параметрийн хувьд дисперс өөрчлөгддөггүй.
Ковариацын талаар дэлгэрэнгүй
Статистикийн онолд ковариац нь хоёр санамсаргүй хэмжигдэхүүн хамтдаа хэр их өөрчлөгдөж байгааг илэрхийлдэг хэмжүүр юм. Өөрөөр хэлбэл, ковариац нь хоёр санамсаргүй хэмжигдэхүүний хоорондын хамаарлын бат бөх байдлын хэмжүүр юм. Мөн үүнийг хоёр санамсаргүй хэмжигдэхүүний дисперсийн ойлголтын ерөнхий ойлголт гэж үзэж болно.
Хязгаарлагдмал секундын импульстэй хамт тархсан X ба Y санамсаргүй хэмжигдэхүүнүүдийн ковариацыг σXY=E[(X-E[X])(Y-E[) гэж нэрлэдэг. Y])]. Эндээс дисперсийг хоёр хувьсагч ижил байх ковариацын онцгой тохиолдол гэж харж болно. Cov(X, X)=Var(X)
Ковариацыг хэвийн болгосноор ρ=E[(X-E[X])(Y-E[Y])]/(σ гэж тодорхойлогдсон шугаман корреляцийн коэффициент буюу Пирсоны корреляцийн коэффициентийг гаргаж болно. X σY)=(Cov(X, Y))/(σX σY )
Графикийн хувьд хос өгөгдлийн цэгүүдийн хоорондын ковариацийг эсрэг талын орой дээрх өгөгдлийн цэгүүдтэй тэгш өнцөгтийн талбай гэж харж болно. Үүнийг хоёр өгөгдлийн цэгийн хоорондох зайны хэмжүүр гэж тайлбарлаж болно. Бүх хүн амын тэгш өнцөгтийг харгалзан үзвэл бүх өгөгдлийн цэгүүдэд тохирох тэгш өнцөгтүүдийн давхцлыг тусгаарлах хүч гэж үзэж болно; хоёр хувьсагчийн дисперс. Ковариац нь хоёр хэмжигдэхүүнтэй байдаг, учир нь хоёр хувьсагч байдаг, гэхдээ үүнийг нэг хувьсагч болгон хялбарчлах нь нэг хэмжигдэхүүн дэх тусгаарлалттай адил дангийн дисперсийг өгдөг.
Вариац ба Ковариацын ялгаа нь юу вэ?
• Варианс нь популяцийн тархалт/тархалтын хэмжүүр бөгөөд ковариацийг хоёр санамсаргүй хэмжигдэхүүний хэлбэлзэл буюу корреляцийн бат бэхийн хэмжүүр гэж үздэг.
• Вариацийг ковариацын онцгой тохиолдол гэж үзэж болно.
• Вариац болон ковариац нь өгөгдлийн утгын хэмжээнээс хамаардаг тул харьцуулах боломжгүй; тиймээс тэдгээрийг хэвийн болгосон. Ковариацийг корреляцийн коэффициент болгон (хоёр санамсаргүй хэмжигдэхүүний стандарт хазайлтын үржвэрт хуваах) болон дисперсийг стандарт хазайлтад (квадрат язгуурыг авч) нормчилно