Skillnaden mellan RDBMS och Hadoop

Innehållsförteckning:

Skillnaden mellan RDBMS och Hadoop
Skillnaden mellan RDBMS och Hadoop

Video: Skillnaden mellan RDBMS och Hadoop

Video: Skillnaden mellan RDBMS och Hadoop
Video: Hadoop против РСУБД 2024, November
Anonim

Den viktigaste skillnaden mellan RDBMS och Hadoop är att RDBMS lagrar strukturerad data medan Hadoop lagrar strukturerad, semi-strukturerad och ostrukturerad data.

RDBMS är ett databashanteringssystem baserat på relationsmodellen. Hadoop är en programvara för att lagra data och köra applikationer på kluster av råvaruhårdvara.

Bild
Bild

Vad är RDBMS?

RDBMS står för Relational Database Management System baserat på den relationella modellen. I RDBMS används tabeller för att lagra data, och nycklar och index hjälper till att koppla ihop tabellerna. En tabell är en samling dataelement och de är enheterna. Den innehåller rader och kolumner. Raderna representerar en enda post i tabellen. Kolumnerna representerar attributen.

Till exempel kan försäljningsdatabasen ha kund- och produktenheter. Kunden kan ha attribut som kund_id, namn, adress, telefonnummer. Artikeln kan ha attribut som produkt-id, namn etc. Den primära nyckeln för kundtabellen är kund_id medan den primära nyckeln för produkttabellen är produkt_id. Att placera product_id i kundtabellen som en främmande nyckel kopplar samman dessa två enheter. Likaså är tabellerna också relaterade till varandra. De tillhandahåller dataintegritet, normalisering och många fler. Få av de vanliga RDBMS är MySQL, MSSQL och Oracle. De använder SQL för att fråga.

Vad är Hadoop?

The Hadoop är ett Apache-ramverk med öppen källkod skrivet i Java. Det hjälper till att lagra och bearbeta en stor mängd data över kluster av datorer med hjälp av enkla programmeringsmodeller. Huvudsyftet med Hadoop är att lagra och bearbeta Big Data, vilket hänvisar till en stor mängd komplex data. Genomströmningen av Hadoop, som är kapaciteten att bearbeta en mängd data inom en viss tidsperiod, är hög.

Skillnaden mellan RDBMS och Hadoop
Skillnaden mellan RDBMS och Hadoop

Det finns fyra moduler i Hadoop-arkitekturen. De är Hadoop common, YARN, Hadoop Distributed File System (HDFS) och Hadoop MapReduce. Den gemensamma modulen innehåller Java-biblioteken och verktygen. Den har också filerna för att starta Hadoop. Hadoop YARN utför jobbschemaläggning och klusterresurshantering.

Dessutom är Hadoop Distributed File System (HDFS) Hadoop-lagringssystemet. Den använder master-slav-arkitekturen. Masternoden är NameNode, och den hanterar filsystemets metadata. Andra datorer är slavnoder eller DataNodes. De lagrar de faktiska uppgifterna. Å andra sidan gör Hadoop MapReduce den distribuerade beräkningen. Den har algoritmerna för att bearbeta data. I HDFS har masternoden en jobbspårare. Den kör kartminskningsjobb på slavnoderna. Det finns en uppgiftsspårare för varje slavnod för att slutföra databearbetning och för att skicka tillbaka resultatet till masternoden. Sammantaget ger Hadoop massiv lagring av data med hög processorkraft.

Vad är skillnaden mellan RDBMS och Hadoop?

RDBMS vs Hadoop

RDBMS är en systemmjukvara för att skapa och hantera databaser som bygger på relationsmodellen. Hadoop är en samling programvara med öppen källkod som kopplar ihop många datorer för att lösa problem som involverar en stor mängd data och beräkningar.
Datavariant
RDBMS lagrar strukturerad data. Hadoop lagrar strukturerad, semistrukturerad och ostrukturerad data.
Datalagring
RDBMS lagrar den genomsnittliga mängden data. Hadoop lagrar en stor mängd data än RDBMS.
Hastighet
I RDBMS är läsningarna snabba. I Hadoop går det snabbt att läsa och skriva.
Skalbarhet
RDBMS har vertikal skalbarhet. Hadoop har horisontell skalbarhet.
Hårdvara
RDBMS använder avancerade servrar. Hadoop använder råvaruhårdvara.
Genomströmning
RDBMS-genomströmningen är högre. Hadoop-genomströmningen är lägre.

Sammanfattning – RDBMS vs Hadoop

Den här artikeln diskuterade skillnaden mellan RDBMS och Hadoop. Den viktigaste skillnaden mellan RDBMS och Hadoop är att RDBMS lagrar strukturerad data medan Hadoop lagrar strukturerad, semi-strukturerad och ostrukturerad data.

Rekommenderad: