TriloByte Statistical Software - Lineární regrese

Rozsáhlý modul Lineární regrese nabízí bohaté komentované textové i grafické výstupy a diagnostiku pro obyčejných i obecných lineárních modelů. Nabízené metody zahrnují nejmenší čtverce, robustní metody jako M-odhady, L1-regrese, nejmenší medián, metodu kvantilové regrese, rezistentní metodu BIR. Uživatel může zadat váhy, definovat libovolný lineární nebo linearizovaný model s možností automatické korekční transformace (kvazilinearizace). Automatická tvorba polynomických modelů. Automatická tvorba Taylorových polynomů 2.stupně pro vícerozměrná data, výpočet optima responsní plochy. Při výpočtu se používá stabilní metoda pseudoinverze. Bohatá diagnostika zajistí odhalení všech problémů v datech. Metoda Stepwise-All, hodnocení všech možných (až 8000) regresních modelů, možnost výběru nejlepších modelů podle tří kritérií. Analýza regresního tripletu, analýza reziduí, výpočet predikce pro zadaná data a mnoho dalších možností.

Lineární regrese - manuál ve formátu Pdf

Výpočet parametrů lineárních modelů.
Proložení dat přímkou nebo křivkou.
Predikce proměnné podle modelu.
Automatické nalezení optimálního modelu metodou Stepwise-All.
Kalibrace, verifikace, validace.
Optimalizace responsních povrchů, optimalizace ekonomiky a technologií.
Robustní metody pro "nekvalitní" data.
Výkonné diagnostické metody pro odhalení zvláštností v datech.

Modely:

Prosté lineární modely
Polynomické modely
Taylorovy kvadratické modely
Uživatelsky definované lineární modely
Vážená regrese
Kvazilinearizace závisle proměnné
Implicitní modely
Stepwise - všechny podmnožiny

Metody:

Nejmenší čtverce
Korekce hodnosti
Kvantilová regrese
Lp-regrese
Nejmenší medián
IRWLS
M-odhady
Rezistentní metoda BIR
Stepwise All

Protokol:

Základní analýza
Korelace X
Multikolinearita
Vlastní čísla, VIF
Analýza rozptylu
Parametry
Intervaly spolehlivosti
Statistické charakteristiky
R, RSČ, AIC, MEP, atd.
Klasická rezidua
Závislost reziduí
Regresní triplet
Testy dat a reziduí
Testy modelu
Predikované statistiky
Vlivná data
Jackknife rezidua
Projekční matice
Cookova vzdálenost
Atkinsonova vzdálenost
Andrews-Pregibon
Věrohodnostní vzdálenosti
Predikce

Grafické výstupy:

Regresní křivka
Y-predikce
Rezidua vs. Predikce
Abs. rezidua
Čtverec reziduí
QQ-graf reziduí
Autokorelace
Heteroskedasticita
Jackknife rezidua
Predikovaná rezidua
Parciální regresní grafy
Parciální reziduální grafy
Projekční matice
Predikovaná rezidua
Pregibon
Williams
McCulloh
L-R Graf
Cookova vzdálenost
Atkinsonova vzdálenost
Normalizovaná rezidua
Andrewsův graf
Predikovaná rezidua
Jackknife rezidua

Základní panel lineární regrese:

Panel pro specifikaci textových a grafických výstupů:

Panel pro definici uživatelského modelu:

Ukázky použití:

Příklad regresní přímky s vyznačeným pásem spolehlivosti, identifikací odlehlých měření a souřadnicovou mřížkou:

Příklad porovnání dvou modelů:

První model má 5 členů a velmi dobře vystihuje data.
Model: [Rate] ~ Abs + [pH-value] + [pH-value]^2 + Ln([pH-value]) + Exp([pH-value])
Má však špatnou schopnost predikce mimo interval dat. Navíc jsou tři regresní koeficienty statisticky nevýznamné. Tento model je prakticky nepoužitelný.

Proměnná	Odhad	Směr.Odch.	Závěr	Pravděpodobnost	Spodní mez	Horní mez
Abs	2.178920359	0.4781566966	Významný	2.0071724E-005	1.226172343	3.131668374
[pH-value]	-0.2512150455	0.6432896894	Nevýznamný	0.6972768229	-1.532997732	1.030567641
[pH-value]^2	0.0064187489	0.0397346354	Nevýznamný	0.8721080375	-0.072754247	0.08559173928
Ln([pH-value])	1.502365814	1.109297323	Nevýznamný	0.1797490765	-0.707957352	3.71268898
Exp([pH-value])	0.0002611483	3.1980627E-005	Významný	6.2911891E-012	0.0001974255	0.0003248710

Reziduální variabilita	12.21360278
Hodnota kritéria F	359.6264707
Vícenásobný korelační koeficient R	0.9752305217
Koeficient determinace R^2	0.9510745705
Predikovaný korelační koeficient Rp	0.9418693616
Střední kvdratická chyba predikce MEP	0.1836906899
Akaikeho informační kritérium	-137.4849057

Druhý model má pouze 4 členy ale rovněž velmi dobře vystihuje data. Z původního modelu jsme vyloučili logaritmický člen.
Model: [Rate] ~ Abs + [pH-value] + [pH-value]^2 + Exp([pH-value])

Jeho schopnost predikce mimo interval dat je daleko lepší. Navíc jsme dosáhli statistické významnosti všech čtyř parametrů. Všimněte si výrazného zvýšení F-kritéria u druhého modelu.

Proměnná	Odhad	Směr.Odch.	Závěr	Pravděpodobnost	Spodní mez	Horní mez
Abs	1.619105504	0.2417007386	Významný	3.3881958E-009	1.137612942	2.100598066
[pH-value]	0.6052303125	0.1186739087	Významný	2.4763148E-006	0.3688197633	0.8416408618
[pH-value]^2	-0.044536446	0.01284989911	Významný	0.000877772615	-0.07013475788	-0.018938134
Exp([pH-value])	0.0002906152	2.3568737E-005	Významný	0	0.00024366393	0.0003375666

Reziduální variabilita	12.51634119
Hodnota kritéria F	473.622371
Vícenásobný korelační koeficient R	0.9746085658
Koeficient determinace R^2	0.9498618565
Predikovaný korelační koeficient Rp	0.9417364687
Střední kvdratická chyba predikce MEP	0.1841106266
Akaikeho informační kritérium	-137.5506086

Metoda porovnání všech podmodelů

Výběr vhodných členů lineárního regresního modelu je úloha pro techniku prohledávání všech možných podmnožin modelu Stepwise-All. Grafické a numerické metody umožní výběr nejlepších modelů

Kvantilová regrese

Proložení dat křivkou s daným rizikem (pravděpodobností) výskytu dat nad a pod křivkou.

Hladina 15%: Y=1.950+1.961X-0.121X^2	Hladina 50%: Y=1.074+2.106X-0.136X^2
Hladina 90%: Y=-0.382+2.079X-0.126X^2

Robustní metody

Robustní metody nejsou citlivé na "znečištěná" data obsahující mnoho chyb, či vybočujících hodnot.

Metoda nejmenších čtverců

Robustní metoda (M-odhad)

Bohatá diagnostika

Numerická i grafická diagnostika zajistí odhalení jakéhokoliv problému v datech nebo modelu, který by mohl vést k nesprávné interpretaci. Tím je zajištěna věrohodnost výsledků. Jednotlivá data lze identifikovat interaktivně myší. Označená podezřelá data lze promítnout do všech ostatních grafů nebo do tabulky.