A statisztikában a regressziószámítás vagy regresszióanalízis során két vagy több véletlen változó között fennálló kapcsolatot modellezzük. A regressziós modell tulajdonságai alapján megkülönböztethetünk lineáris és nemlineáris regressziót, az adataink alapján pedig idősor, keresztmetszeti, és panel regresszióanalízist.
A feladat
A regresszió feladata két vagy több valószínűségi változó közötti függvénykapcsolat meghatározása.
A változókat reprezentáló (n+1) dimenziós vektor koordinátáira kapott m számú mérési adatból meg kell határozni egy, a vizsgált jelenséget leíró, jól kezelhető függvényt: , amelynek az helyeken felvett értékei
- vagy megegyeznek a megfelelő mért értékekkel: - (interpoláció),
- vagy az eltérések valamilyen minimum-feltételnek eleget tesznek (regresszió).
Az eltérések mértékét többféleképpen lehet megadni. Leggyakrabban a hibaértékek eltérések : négyzetösszegének minimumát követeljük meg. (l.: legkisebb négyzetek módszere).
A vizsgált jelenség természete szabja meg a közelítésre alkalmas függvény típusát. Eszerint megkülönböztetünk lineáris és nemlineáris regressziót. A kapcsolt változók száma szerint ugyancsak eltérnek a modellek. Ilyen értelemben beszélünk két-, három- stb. változós regresszióról.
Lineáris regresszió
Az általános lineáris modell az
függvény együtthatóinak meghatározását követeli meg. (Többváltozós lineáris regresszió.)
A leggyakoribb kétváltozós lineáris modell a síkon derékszögű koordináta-rendszerben pontokkal ábrázolható adathalmazra egyenletű egyenes illesztését írja elő. Ezt az egyenest szokás trend-vonalnak, az egyenlet együtthatóját trendnek (meredekség, tendencia), konstansát tengelymetszetnek nevezni.
Az együtthatók becslésére alkalmazott eljárások:
Nemlineáris regresszió
Nemlineáris regressziószámítást akkor alkalmaznak, ha a modell nemlineáris. Az ilyenkor alkalmazható linearizáló módszer abból áll, hogy az eredeti változók helyett, velük összefüggő, de egymással lineáris kapcsolatban lévő változókat vezetünk be.
- Például az formulából az helyettesítésekkel az lineáris kapcsolat adódik. Ennek(a,b) együtthatóiból az eredeti formula konstansai adódnak: .
Regresszió. Gyakorlati alkalmazások