At vurdere anfald af Regression Modeller

en velsiddende regression modelresultater i forudsagte værdier tæt på de observerede dataværdier. Den gennemsnitlige model, der anvender gennemsnittet for hver forudsagte værdi, vil generelt blive anvendt, hvis der ikke var nogen informative prediktorvariabler. Pasformen af en planlagt regressionsmodel bør derfor være bedre end pasform af den gennemsnitlige modellen

Tre statistik bruges i almindelige Least Squares (OLS) regression til at evaluere model fit:. R-kvadreret, den overordnede F- test, og Root Mean Square Error (RMSE). Alle tre er baseret på to summer af kvadrater: Summen af Squares alt (SST) og sum af kvadrater Fejl (SSE). SST måler, hvor langt de data er fra middelværdien og SSE måler, hvor langt de data er fra modellens forudsagte værdier. Forskellige kombinationer af disse to værdier giver forskellige oplysninger om, hvordan regressionsmodellen sammenlignes med den gennemsnitlige modellen.

R-kvadreret og justeret R-squared

Forskellen mellem SST og SSE er forbedringen i forudsigelse fra regressionsmodellen, sammenlignet med den gennemsnitlige model. Dividere denne forskel ved SST giver R-squared. Det er proportional forbedring forudsigelse fra regressionsmodellen, sammenlignet med den gennemsnitlige model. Det angiver godhed fit af modellen

R-squared har den nyttige egenskab, at dens omfang er intuitiv:. Det spænder fra nul til en, med nul indikerer, at den foreslåede model ikke forbedrer forudsigelse over gennemsnittet model og visnings- perfekt forudsigelse. Forbedring regressionsmodellen resulterer i proportionale stigninger i R-kvadreret.

En faldgrube af R-kvadreret, er, at den kun kan stige som prædiktorer føjes til regressionsmodellen. Denne stigning er kunstig, når prædiktorer er faktisk ikke forbedre modellens pasform. For at afhjælpe dette, en relateret statistik, Justeret R-kvadreret, inkorporerer modellens frihedsgrader. Justeret R-squared vil falde som prædiktorer tilføjes, hvis stigningen i modellen passer ikke gør op for tabet af frihedsgrader. Ligeledes vil det øge som prædiktorer tilføjes, hvis stigningen i model fit er umagen værd. Justeret R-kvadreret bør altid anvendes med modeller med mere end én prædiktor variabel. Det tolkes som andelen af den samlede varians, der kan forklares ved modellen.

Der er situationer, hvor en høj R-squared ikke er nødvendig eller relevant. Når interessen er i forholdet mellem variable, ikke i forudsigelse, R-kvadrat er mindre vigtig. Et eksempel er en undersøgelse af, hvordan religiøsitet påvirker sundhedsresultater. Et godt resultat er en pålidelig sammenhæng mellem religiøsitet og sundhed. Ingen ville forvente, at religion forklarer en høj procentdel af variationen i sundhed, da sundhed påvirkes af mange andre faktorer. Selvom modellen udgør andre variabler, som påvirker sundheden, såsom indkomst og alder, en R-squared i intervallet 0,10-0,15 er rimeligt.

F-test

F-testen vurderer nulhypotesen, at alle regressionskoefficienterne er lig med nul versus alternativet, at mindst én ikke. En tilsvarende nulhypotesen er, at R-squared lig med nul. En væsentlig F-test viser, at den observerede R-squared er pålidelig og ikke en falsk resultat af mærkværdigheder i datasættet. Således F-test bestemmer, om den foreslåede forhold mellem responsvariabel og sættet af prædiktorer er statistisk pålidelige, og kan være nyttige, når formålet forskning er enten forudsigelse eller forklaring.

RMSE

Det RMSE er kvadratroden af variansen af residualerne. Det angiver den absolutte pasform af modellen til de data - hvor tæt de observerede datapunkter skal modellens forudsagte værdier. Hvorimod R-kvadreret er et relativt mål for pasform, RMSE er en absolut mål for pasform. Som kvadratroden af en varians, kan RMSE tolkes som standardafvigelsen af uforklarlige varians, og har den nyttige egenskab af at være i de samme enheder som responsvariabel. Lavere værdier af RMSE indikerer bedre pasform. RMSE er et godt mål for hvor præcist modellen forudsiger svaret, og er det vigtigste kriterium for pasform, hvis det primære formål med modellen er forudsigelse.

Den bedste målestok for model fit afhænger af forskerens mål, og mere end én ofte nyttige. De ovenfor omtalte statistik gælder for regressionsmodeller, der bruger OLS estimering. Mange typer af regressionsmodeller dog såsom blandede modeller, generaliserede lineære modeller og event historie modeller, brug maksimal sandsynlighed skøn. Disse statistikker er ikke tilgængelige for sådanne modeller. En fremtidig nyhedsbrev vil beskrive, hvordan man vurderer modeller anslået ved hjælp af maksimal sandsynlighed

Ophavsret &kopi; 2008 Karen Grace-Martin
.

At vurdere anfald af Regression Modeller

business consulting

At vurdere anfald af Regression Modeller

business consulting