Data Mining bruges til at analysere de Samlinger af observationer

Data mining er processen med at anvende disse metoder til data med henblik på at opdage skjulte mønstre. Det har været brugt i mange år af virksomheder, regeringer og forskere til at finkæmme gennem mængder af data, herunder data om flypassagerer, der rejser til data fra tællinger og supermarked scanner data til at producere markedets forskningsrapporter.

En vigtig grund til at bruge data mining er at bistå med at analysere de samlinger af observationer af adfærd. Disse data er sårbare på grund af kollinearitet relationer ukendte. En kendsgerning data mining er, at alle de data, der analyseres kan ikke være repræsentativ for hele området, og kan derfor ikke give eksempler på kritiske adfærd og relationer, der eksisterer i andre dele af området.

For at overvinde dette problem, kan analysen øges ved hjælp af metoder baseret på eksperimenter og andre, såsom valgmodeller for menneskelige genererede data. I disse situationer, enten iboende sammenhænge verificeres eller fjernes under opførelsen af ​​forsøgsopstillingen

Data mining omfatter normalt fire kategorier af opgaver:.

Layout - Organiserer data i foruddefinerede grupper. For eksempel en e-mail-program kan prøve at e-mail som legitim eller spam klassificering. Fælles læring algoritmer er beslutningstræer, nærmeste nabo, naiv Bayes klassifikation og neurale netværk

Clustering -. Såsom format, men grupperne er ikke foruddefineret, så algoritmen vil forsøge at gruppere lignende
<. p> Regression - Forsøg på at finde en funktion, modeller data med mindste fejl

Association regel læring -. Søger efter sammenhænge mellem variable. Eksempel kan et supermarked indsamle data om kundernes købsadfærd. Brug af indlæring af foreningens regler, supermarkedet afgøre, hvilke produkter er ofte købes sammen og bruge disse oplysninger til markedsføringsformål. Dette kaldes markedet kurv analyse. Nu. Se på nogle eksempler, hvor det kan bruges i den virkelige verden.

Inden for forskning i human genetik, målet er vigtigt at forstå forholdet korrespondance mellem de inter-individuelle variationer i humane DNA-sekvenser og variation i modtagelighed for sygdomme. Kort sagt, det er, hvordan ændringer i DNA-sekvensen af ​​en individuel påvirker risikoen for at udvikle sygdomme, såsom cancer. Dette er meget vigtigt for diagnosticering, forebyggelse og behandling af sygdomme. De data mining teknik, der anvendes til denne opgave er kendt som multifaktor dimensionalitet reduktion.

I inden for elektromekanik, er data mining teknikker vid udstrækning anvendes til at overvåge tilstanden af ​​høj spænding elektrisk udstyr. Formålet med betingelsen overvågning er at give værdifulde oplysninger om sundhed af isolering af udstyret. Data, såsom kombinationen af ​​selvorganiserende kort (SOM) blev anvendt til vibrationer overvågning og analyse af transformator på load trinkoblere (OLTC).

Brug vibrationer overvågning, kan det bemærkes, at hver tap skift drift af et signal om status for kontakterne og generere trimmer diske. Selvfølgelig tap positioner generere forskellige signaler. Men der var en betydelig variation mellem signalerne normalt gør præcis den samme funktion. SOM blev anvendt til at detektere unormale forhold og arten af ​​afvigelserne at estimere
.

forretningsmuligheder

  1. Den faktiske Fakta om Plastic Injection Molding
  2. Alt du bør vide om statstilskud til virksomheder
  3. Forskellige opfattelser af Beton Resurfacing
  4. Rolle indiske Producenter
  5. Freelancer er en saga blot; Virtuelle Medarbejdere Er den fremtidige udvikling af outsourcing
  6. Fantastiske Tips om Small Business Advice gennem Twitter
  7. Webinars til hurtigt at forme uddannelsen i fremtiden
  8. Betydningen af ​​brugte Press Bremser
  9. Finest Ombygget bilmotorer til dine køretøjer
  10. Professionel hjælp Anbefales i skat Levy
  11. Tilpasning af din cykel med Harley Hjul og Ape Bøjler
  12. Shed Blueprints - Konstruktion din personlige Shed
  13. Holde din båd i Fort Lauderdale: Båd Reparation og dekorering
  14. Smart innovative og omkostningseffektiv Building Solutions- Presserende behov for time
  15. Tips til at vælge Best Virksomheder fra Hjem
  16. Find Pålidelige Packers Fremadstormende i Delhi NCR
  17. Qnet Svig og de falske fakta bag det
  18. Information om Online Opfyldelse og Internet Opfyldelse Services
  19. Tjen penge fra hjem-Bliv mere selvsikker og selvforsynende
  20. Look at udskrive for din virksomhed til virksomhed franchisen