Begrænsninger af fælles løsninger af manglende data

En tidligere artikel diskuterede nogle af årsagerne til manglende data og nogle af konsekvenserne af at analysere kun komplette tilfælde. Dette nyhedsbrev vil diskutere nogle andre almindelige måder at behandle manglende data, med en diskussion af fordele og ulemper.

Fås case analyse (parvise tekst udgår) beregner hvert trin i analysen separat ved hjælp af de sager, der har tilgængelige data for det pågældende trin. Derfor vil en sag med data mangler på en variabel kun anvendes i trin, der ikke involverer at variabel. Fordelen er, at stikprøvestørrelsen for hver enkelt analyse er generelt højere end med komplet case analyse, men resultaterne er uvildig, hvis dataene er MCAR. Det kan også føre til matematiske problemer i computing estimater af nogle parametre, og kan ikke anbefales.

De fleste andre metoder indebærer imputering-erstatte manglende værdier med et skøn, og derefter analysere de fulde datasæt, som om de imputerede værdier var faktiske observerede værdier. Der er mange måder at vælge et skøn. Følgende er almindelige metoder:

* Mean: gennemsnittet af de observerede værdier for denne variabel
* Udskiftning: værdien fra en ny person, der ikke blev udvalgt til at indgå i stikprøven
* Hot dæk: en tilfældigt valgt værdi fra en person, der har lignende værdier på andre variabler
* Kolde dæk: en systematisk valgte værdi fra en person, der har lignende værdier andre variabler
* Regression: den forudsagte værdi fås ved regression af mangler variabel på andre variabler
* Stokastisk regression: den forudsagte værdi fra en regression plus en tilfældig restværdi
* Interpolation og ekstrapolation:.. en anslået værdi fra andre observationer fra den samme person

Imputation er populært, fordi det er begrebsmæssigt enkel og fordi resulterende prøve har samme antal observationer som det fulde datasæt. Det kan være meget fristende, når færdig-case analyse eliminerer en stor del af datasættet. Men det har begrænsninger. Nogle imputering metoder resulterer i tendentiøse parameterestimater, såsom midler og sammenhænge, ​​medmindre data er MCAR. Den skævhed er ofte værre end med komplet-case analyse, især for gennemsnitlig imputering. Omfanget af bias afhænger af mange faktorer, herunder manglende data mekanisme, den andel af de data, der mangler, og den tilgængelige i datasættet oplysninger.

Desuden er alle disse godtgørelsesordninger metoder undervurderer standardafvigelser . Da de imputerede observationer er selv skøn, har deres værdier svarende tilfældige fejl. På trods af dette, er imputerede værdier behandles som faktiske observationer i analyserne. Den ekstra fejlkilde ignoreres, hvilket resulterer i for-små standardfejl og alt for små p-værdier. Selv imputering begrebsmæssigt enkel, er det normalt vanskeligt at klare sig godt i praksis. Derfor er disse godtgørelsesordninger metoder ikke er tilfredsstillende i de fleste tilfælde

To alternative metoder bevare den fulde stikprøve størrelse og kan resultere i upartiske vurderinger af parametre og standardfejl for ignorable manglende data:. Multipel imputering og maksimal sandsynlighed skøn. Disse teknikker er nu tilgængelige i fælles statistisk software. Efterfølgende nyhedsbreve vil beskrive disse metoder og diskutere deres tilgængelighed i softwarepakker
.

business consulting

  1. Anbefalede løsninger på manglende data
  2. Konkurrencen er at vellykket markedsføring som gødning er til Frugtbart Landbrug
  3. Innovation i erhvervslivet: Ændring som spillet ændringer
  4. Fantastiske Sorter af Adhesive tape
  5. Hvordan du kan gemme et bundt hver måned Energi Citater
  6. Hvad gør Granit bordplader Populære Køkkenmonteringer?
  7. Consulting Nonprofits vil rejse Donation potentiale
  8. Online leadgenerering metoder du skal holde sig til
  9. Beskæftigelse Advokater Forklare alternativ konfliktløsning
  10. 5 måder at få School Fundraising
  11. Professionel udlejning agenter i Windsor for lejere & Udlejere
  12. Komme over din investering frygt ved at finde troværdige Portefølje management services
  13. Kundetilfredshedsundersøgelser
  14. Hvordan til at oversætte en Project Management Procedure.
  15. Rød, hvid & mousserende vine fremstillet i hele verden
  16. Fritlægning Services
  17. Facebook Company Side:! En simpel Sti til Disaster Recovery
  18. Rådgivning om hvordan man dyrker en HR Software, HRIS eller HRMS Business Partner Channel
  19. Kan du bruge en Wood Chipper To Make Barkflis?
  20. 10 måder at belønne Medarbejdere