Základný prístup k analýze kvantitatívnych údajov
Modely lineárnej regresie sa používajú na zobrazenie alebo predpovedanie vzťahu medzi dvoma premennými alebo faktormi . Faktor, ktorý sa predpovedá (faktor, ktorý rieši rovnica) sa nazýva závislá premenná. Faktory, ktoré sa používajú na predpovedanie hodnoty závislej premennej, sa nazývajú nezávislé premenné.
Dobré údaje nie vždy ukazujú celý príbeh. Regresná analýza sa vo výskume bežne používa, pretože stanovuje, že medzi premennými existuje korelácia.
Korelácia však nie je rovnaká ako príčina . Dokonca aj riadok v jednoduchej lineárnej regresii, ktorá dobre zapadá do dátových bodov, nemôže povedať niečo definitívne o vzťahu príčin-účinok.
V jednoduchej lineárnej regresii sa každé pozorovanie skladá z dvoch hodnôt. Jedna hodnota je pre závislú premennú a jedna hodnota je pre nezávislú premennú.
- Jednoduchá analýza lineárnej regresie Najjednoduchšia forma regresnej analýzy používa závislú premennú a jednu nezávislú premennú. V tomto jednoduchom modeli sa priamka približuje vzťahu medzi závislou premennou a nezávislou premennou.
- Viacnásobná regresná analýza Keď sa v regresnej analýze používajú dve alebo viac nezávislých premenných, model už nie je jednoduchý lineárny.
Jednoduchý model lineárnej regresie
Jednoduchý model lineárnej regresie je reprezentovaný takto: y = ( β 0 + β 1 + Ε
Podľa matematickej konvencie sú dva faktory, ktoré sa podieľajú na jednoduchej lineárnej regresnej analýze, označené x a y .
Rovnica, ktorá popisuje, ako y súvisí s x, je známa ako regresný model . Lineárny regresný model tiež obsahuje chybový termín, ktorý reprezentuje E, alebo grécke písmeno epsilon. Chybový termín sa používa na zohľadnenie variability v y, ktorú nemožno vysvetliť lineárnym vzťahom medzi x a y .
Existujú aj parametre, ktoré reprezentujú študovanú populáciu. Tieto parametre modelu , ktoré reprezentujú ( β 0+ β 1 x ).
Jednoduchý model lineárnej regresie
Jednoduchá lineárna regresná rovnica je reprezentovaná takto: E ( y ) = ( β 0 + β 1 x ).
Jednoduchá lineárna regresná rovnica je grafovaná ako priama čiara.
( β 0 je zachytenie y regresnej čiary.
β 1 je sklon.
E ( y ) je stredná alebo predpokladaná hodnota y pre danú hodnotu x .
Regresná čiara môže vykazovať pozitívny lineárny vzťah, negatívny lineárny vzťah alebo žiadny vzťah. Ak je grafovaná čiara v jednoduchej lineárnej regresii rovná (nie šikmá), medzi týmito dvoma premennými nie je žiadny vzťah. Ak sa regresná línia skloní smerom hore s dolným koncom čiary na zachytení y (osi) grafu a horný koniec línie sa rozprestiera hore do políčka grafu, od zachytenia x (osi) existuje pozitívny lineárny vzťah , Ak sa regresná línia sklopí smerom nadol s horným koncom čiary v bode zachytenia y (osi) grafu a dolný koniec línie prechádza smerom dolu do grafu, smerom k zachyteniu x (osi) existuje záporný lineárny vzťah.
Odhadovaná rovnica lineárnej regresie
Ak by boli známe parametre populácie , jednoduchá lineárna regresná rovnica (uvedená nižšie) by sa mohla použiť na výpočet strednej hodnoty y pre známu hodnotu x .
E ( y ) = ( β 0 + β 1 x ).
V praxi však hodnoty parametrov nie sú známe, preto sa musia odhadnúť pomocou údajov zo vzorky populácie. Parametre populácie sa odhadujú pomocou štatistických štatistík . Štatistické údaje o vzorke sú reprezentované b 0 + b 1. Keď sú štatistické údaje štatistických vzoriek nahradené parametrami populácie, vytvorí sa odhadovaná regresná rovnica.
Odhadovaná regresná rovnica je uvedená nižšie.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) sa vyslovuje.
Graf odhadovanej jednoduchej regresnej rovnice sa nazýva odhadovaná regresná čiara.
B 0 je zachytenie y.
B 1 je sklon.
Ŷ ) je odhadovaná hodnota y pre danú hodnotu x .
Dôležitá poznámka: Regresná analýza sa nepoužíva na interpretáciu vzťahov príčin a účinkov medzi premennými. Regresná analýza však môže naznačovať, aké premenné súvisia alebo do akej miery sú navzájom prepojené premenné .
Pritom regresná analýza má tendenciu vytvárať výrazné vzťahy, ktoré odôvodňujú znalosť vedeckého bádateľa .
Taktiež známa ako: bivariátová regresia, regresná analýza
Príklady: Metóda Najmenšie štvorce je štatistický postup pre použitie vzorových údajov na nájdenie hodnoty odhadovanej regresnej rovnice. Metódu "Najmenšie štvorce" navrhol Carl Friedrich Gauss, ktorý sa narodil v roku 1777 a zomrel v roku 1855. Metóda najmenších štvorcov je stále široko používaná.
zdroj:
Anderson, DR, Sweeney, DJ a Williams, TA (2003). Základy štatistiky pre podnikanie a ekonomiku (3. vydanie) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Vysvetlené: Regresná analýza. MIT News.
McIntyre, L. (1994). Použitie údajov o cigarete pre úvod do viacnásobnej regresie. Journal of Statistics Education, 2 (1).
Mendenhall, W. a Sincich, T. (1992). Štatistika pre inžinierstvo a vedy (tretia edícia), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Štatistika aplikácií, jeseň 2006, oddiel 14, jednoduchá lineárna regresia. (Massachusetts Institute of Technology: MIT OpenCourseWare)