Қандай қарапайым сызықтық регрессияның және қалай жұмыс істейтінін біліңіз

Сандық деректерді талдау үшін негізгі статистикалық тәсіл

Суретші Колин Бруг мырзаға. © 2010 жылғы 10 маусымда Stock.chchng

Сызықтық регрессиялық модельдер екі айнымалы немесе факторлардың арасындағы байланысты көрсету немесе болжау үшін пайдаланылады. Болжамаланатын фактор (теңдеудің шешілетін факторы) деп аталады тәуелді айнымалы. Тәуелді айнымалының мәнін болжау үшін пайдаланылатын факторлар тәуелсіз айнымалылар деп аталады.

Жақсы деректер әрқашан толық тарихты айтады. Регрессиялық талдау көбінесе зерттеуде пайдаланылады, себебі ол айнымалылар арасында корреляция бар екенін анықтайды.

Бірақ корреляция - бұл себепке байланысты емес . Деректер нүктелеріне сәйкес келетін қарапайым сызықтық регрессиядағы сызық тіпті себеп-салдарлық қатынас туралы нақты мәлімет бермейді.

Қарапайым сызықтық регрессияда әрбір бақылау екі мәннен тұрады. Бір мән тәуелді айнымалы үшін және бір мән тәуелсіз айнымалы үшін.

Қарапайым сызықтық регрессиялық модель

Қарапайым сызықтық регрессиялық модель келесідей: y = ( β 0 + β 1 + Е

Математикалық конвенция бойынша қарапайым сызықтық регрессия талдауына қатысатын екі фактор x және y белгіленеді.

X қалай байланысты екенін сипаттайтын теңдеу регрессия үлгісі ретінде белгілі. Сызықтық регрессиялық модельде сондай-ақ Е немесе эфилонның грек әріптерімен ұсынылған қате термині бар. Қате қатары y және y арасындағы сызықтық қатынастармен түсіндірілмейтін y өзгермелілігі үшін есеп беру үшін пайдаланылады.

Сондай-ақ, зерттелетін халықты білдіретін параметрлер бар. Бұл модельдің параметрлері (β0 + β 1 x ).

Қарапайым сызықтық регрессиялық модель

Қарапайым сызықтық регрессиялық теңдеу келесідей : Е ( y ) = ( β 0 + β 1 x ).

Қарапайым сызықтық регрессиялық теңдеу түзу сызық ретінде алынады.

( β 0 - регрессия сызығының жабылуы.

β1 - бұл көлбеу.

Е ( y ) - бұл x мәнінің орташа мәні немесе күтілетін мәні y .

Регрессия сызығы оң сызықтық қатынастарды, теріс сызықтық қатынастарды немесе қатынастарды көрсете алмайды. Егер қарапайым сызықтық регрессиядағы сызылған сызық тегіс (жалпақ емес) болса, онда екі айнымалы арасында ешқандай байланыс жоқ. Егер регрессия сызығы сызықтың төменгі шетімен графиктің жиегі (осі) бойымен жоғары көтерілсе және сызықтың жоғарғы жағына сызықтың жоғарғы жағына өтетін болса, онда x үзілісінен (осьтен) оң сызықтық байланыс бар . Егер регрессия сызығы графиктің жоғарғы бөлігіндегі сызықтың төменгі жағымен төмен түссе және сызықтың төменгі аяғында сызық өрісіне қарай төмендейтін болса, онда x үзілісіне (осіне) теріс сызықтық байланыс бар.

Есептелген сызықтық регрессиялық теңдеу

Егер халықтың параметрлері белгілі болса, белгілі бір x мәніне y мәнінің орташа мәнін есептеу үшін қарапайым сызықтық регрессиялық теңдеу (төменде көрсетілген) пайдаланылуы мүмкін.

Е ( y ) = ( β 0 + β 1 x ).

Дегенмен, іс жүзінде, параметр мәндері белгілі емес, сондықтан олар халықтың үлгісінің деректерін пайдалана отырып бағалануы керек. Халықтың параметрлері статистикалық статистиканы пайдалана отырып есептеледі . Үлгі статистикасы b 0 + b ұсынылған. 1. Үлгі статистикасы халық параметрлері үшін ауыстырылған кезде, есептелген регрессиялық теңдеу қалыптасады.

Бағаланған регрессиялық теңдеу төменде көрсетілген.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) деп аталады.

Қарапайым қарапайым регрессиялық теңдеудің кестесі бағаланған регрессия сызығы деп аталады.

B 0 - y үзілімі.

B 1 - көлбеу.

Ŷ ) - бұл x шамасының бағаланған мәні y .

Маңызды ескерту: Регрессиялық талдау айнымалылар арасындағы себеп-салдарлық қатынастарды түсіндіру үшін пайдаланылмайды. Регрессиялық талдау, алайда, айнымалылардың қалай байланысты екендігін немесе айнымалы мәндердің бір-бірімен қаншалықты байланысты екенін көрсетуі мүмкін.

Осылайша, регрессиялық талдау жақсы зерттеушіге жақынырақ қарауды талап ететін маңызды қатынастарды жасауға бейім.

Айырықша регрессия, регрессиялық талдау

Мысалдар: Ең аз квадраттар әдісі - есептелген регрессия теңдеуінің мәнін табу үшін үлгі деректерін пайдаланудың статистикалық процедурасы. Ең аз квадраттар әдісі 1777 жылы дүниеге келген және 1855 жылы қайтыс болған Карл Фридрих Гаусс ұсынды. Ең кіші квадраттар әдісі әлі күнге дейін кеңінен қолданылады.

Көздер:

Андерсон, Д.Р., Суини, DJ және Уильямс, Т.А. (2003). Бизнес және экономика статистикасының негіздері (3-ші шығарылым) Мейсон, Огайо: оңтүстік батыста, Томпсонда оқыту.

______. (2010 ж.). Түсіндірме: Регрессиялық талдау. MIT News.

McIntyre, L. (1994). Көптеген регрессияға кірісу үшін темекі деректерін пайдалану. Білім беру статистикасы журналы, 2 (1).

Менденхолл, В., Синчич, Т. (1992). Инжиниринг және ғылым статистикасы (3-ші басылым), Нью-Йорк, Нью-Йорк: Dellen Publishing Co.

Панченко, Д. 18.443 Өтініштерге арналған статистика, 2006 жылдың күзі, 14 бөлім, Қарапайым сызықтық регрессия. (Массачусетс технологиялық институты: MIT OpenCourseWare)