Data Mining bruges til at analysere de Samlinger af observationer
Data mining er processen med at anvende disse metoder til data med henblik på at opdage skjulte mønstre. Det har været brugt i mange år af virksomheder, regeringer og forskere til at finkæmme gennem mængder af data, herunder data om flypassagerer, der rejser til data fra tællinger og supermarked scanner data til at producere markedets forskningsrapporter.
En vigtig grund til at bruge data mining er at bistå med at analysere de samlinger af observationer af adfærd. Disse data er sårbare på grund af kollinearitet relationer ukendte. En kendsgerning data mining er, at alle de data, der analyseres kan ikke være repræsentativ for hele området, og kan derfor ikke give eksempler på kritiske adfærd og relationer, der eksisterer i andre dele af området.
For at overvinde dette problem, kan analysen øges ved hjælp af metoder baseret på eksperimenter og andre, såsom valgmodeller for menneskelige genererede data. I disse situationer, enten iboende sammenhænge verificeres eller fjernes under opførelsen af forsøgsopstillingen
Data mining omfatter normalt fire kategorier af opgaver:.
Layout - Organiserer data i foruddefinerede grupper. For eksempel en e-mail-program kan prøve at e-mail som legitim eller spam klassificering. Fælles læring algoritmer er beslutningstræer, nærmeste nabo, naiv Bayes klassifikation og neurale netværk
Clustering -. Såsom format, men grupperne er ikke foruddefineret, så algoritmen vil forsøge at gruppere lignende
<. p> Regression - Forsøg på at finde en funktion, modeller data med mindste fejl
Association regel læring -. Søger efter sammenhænge mellem variable. Eksempel kan et supermarked indsamle data om kundernes købsadfærd. Brug af indlæring af foreningens regler, supermarkedet afgøre, hvilke produkter er ofte købes sammen og bruge disse oplysninger til markedsføringsformål. Dette kaldes markedet kurv analyse. Nu. Se på nogle eksempler, hvor det kan bruges i den virkelige verden.
Inden for forskning i human genetik, målet er vigtigt at forstå forholdet korrespondance mellem de inter-individuelle variationer i humane DNA-sekvenser og variation i modtagelighed for sygdomme. Kort sagt, det er, hvordan ændringer i DNA-sekvensen af en individuel påvirker risikoen for at udvikle sygdomme, såsom cancer. Dette er meget vigtigt for diagnosticering, forebyggelse og behandling af sygdomme. De data mining teknik, der anvendes til denne opgave er kendt som multifaktor dimensionalitet reduktion.
I inden for elektromekanik, er data mining teknikker vid udstrækning anvendes til at overvåge tilstanden af høj spænding elektrisk udstyr. Formålet med betingelsen overvågning er at give værdifulde oplysninger om sundhed af isolering af udstyret. Data, såsom kombinationen af selvorganiserende kort (SOM) blev anvendt til vibrationer overvågning og analyse af transformator på load trinkoblere (OLTC).
Brug vibrationer overvågning, kan det bemærkes, at hver tap skift drift af et signal om status for kontakterne og generere trimmer diske. Selvfølgelig tap positioner generere forskellige signaler. Men der var en betydelig variation mellem signalerne normalt gør præcis den samme funktion. SOM blev anvendt til at detektere unormale forhold og arten af afvigelserne at estimere
.
forretningsmuligheder
- Den faktiske Fakta om Plastic Injection Molding
- Alt du bør vide om statstilskud til virksomheder
- Forskellige opfattelser af Beton Resurfacing
- Rolle indiske Producenter
- Freelancer er en saga blot; Virtuelle Medarbejdere Er den fremtidige udvikling af outsourcing
- Fantastiske Tips om Small Business Advice gennem Twitter
- Webinars til hurtigt at forme uddannelsen i fremtiden
- Betydningen af brugte Press Bremser
- Finest Ombygget bilmotorer til dine køretøjer
- Professionel hjælp Anbefales i skat Levy
- Tilpasning af din cykel med Harley Hjul og Ape Bøjler
- Shed Blueprints - Konstruktion din personlige Shed
- Holde din båd i Fort Lauderdale: Båd Reparation og dekorering
- Smart innovative og omkostningseffektiv Building Solutions- Presserende behov for time
- Tips til at vælge Best Virksomheder fra Hjem
- Find Pålidelige Packers Fremadstormende i Delhi NCR
- Qnet Svig og de falske fakta bag det
- Information om Online Opfyldelse og Internet Opfyldelse Services
- Tjen penge fra hjem-Bliv mere selvsikker og selvforsynende
- Look at udskrive for din virksomhed til virksomhed franchisen