Skillnaden mellan Data Mining och OLAP

Skillnaden mellan Data Mining och OLAP
Skillnaden mellan Data Mining och OLAP

Video: Skillnaden mellan Data Mining och OLAP

Video: Skillnaden mellan Data Mining och OLAP
Video: Skillnaden Mellan Kvinnor och Män, David Eberhard 2024, November
Anonim

Data Mining vs OLAP

Både datautvinning och OLAP är två av de vanligaste Business Intelligence-teknikerna (BI). Business intelligence avser datorbaserade metoder för att identifiera och extrahera användbar information från affärsdata. Data mining är datavetenskapens område som handlar om att extrahera intressanta mönster från stora uppsättningar data. Den kombinerar många metoder från artificiell intelligens, statistik och databashantering. OLAP (online analytical processing) är som namnet antyder en sammanställning av sätt att söka efter flerdimensionella databaser.

Datautvinning är också känt som Knowledge Discovery in data (KDD). Som nämnts ovan är det ett område inom datavetenskap, som handlar om utvinning av tidigare okänd och intressant information från rådata. På grund av den exponentiella tillväxten av data, särskilt inom områden som företag, har datautvinning blivit ett mycket viktigt verktyg för att omvandla denna stora mängd data till business intelligence, eftersom manuell extrahering av mönster har blivit till synes omöjlig under de senaste decennierna. Till exempel används den för närvarande för olika applikationer som analys av sociala nätverk, upptäckt av bedrägerier och marknadsföring. Data mining handlar vanligtvis om följande fyra uppgifter: klustring, klassificering, regression och association. Klustring är att identifiera liknande grupper från ostrukturerad data. Klassificering är inlärningsregler som kan tillämpas på ny data och kommer vanligtvis att innefatta följande steg: förbearbetning av data, design av modellering, inlärning/funktionsval och utvärdering/validering. Regression är att hitta funktioner med minim alt fel för att modellera data. Och association letar efter samband mellan variabler. Datautvinning används vanligtvis för att besvara frågor som vilka är de viktigaste produkterna som kan hjälpa till att få hög vinst nästa år i Wal-Mart.

OLAP är en klass av system som ger svar på flerdimensionella frågor. Vanligtvis används OLAP för marknadsföring, budgetering, prognoser och liknande applikationer. Det säger sig självt att databaserna som används för OLAP är konfigurerade för komplexa och ad hoc-frågor med snabb prestanda i åtanke. Vanligtvis används en matris för att visa utdata från en OLAP. Raderna och kolumnerna bildas av frågans dimensioner. De använder ofta metoder för aggregering på flera tabeller för att få sammanfattningar. Till exempel kan den användas för att ta reda på årets försäljning i Wal-Mart jämfört med förra året? Vad är prognosen om försäljningen under nästa kvartal? Vad kan man säga om trenden genom att titta på den procentuella förändringen?

Även om det är uppenbart att Data mining och OLAP liknar varandra eftersom de arbetar på data för att få intelligens, kommer den största skillnaden från hur de arbetar med data. OLAP-verktyg tillhandahåller multidimensionell dataanalys och de ger sammanfattningar av data, men däremot fokuserar datautvinning på förhållanden, mönster och influenser i datauppsättningen. Det är en OLAP-affär med aggregering, som kokar ner till driften av data via "addition", men datautvinning motsvarar "division". En annan anmärkningsvärd skillnad är att medan datautvinningsverktyg modellerar data och returnerar handlingsbara regler, kommer OLAP att utföra jämförelse- och kontrasttekniker längs affärsdimensionen i re altid.

Rekommenderad: