Kategorisk data vs numerisk data
Data är fakta eller information som samlas in för referens- eller analysändamål. Ofta samlas dessa uppgifter in som ett attribut för den berörda personen. Detta attribut kan variera från ett till ett annat, varför detta varierande attribut kan betraktas som en variabel. Variablerna kan anta olika former av värden och dessa är inneboende i den insamlade datan.
Variabler kan vara antingen kvalitativa eller kvantitativa; d.v.s. om variabeln är kvantitativ är svaren siffror och storleken på det uppmätta attributet kan anges med en viss noggrannhet. Den andra typen, de kvalitativa variablerna mäter de kvalitativa attributen och de värden som antas av variablerna kan inte ges i termer av storlek eller magnitud. Variablerna i sig är kända som kategoriska variabler och data som samlas in med hjälp av en kategorisk variabel är kategoriska data.
Mer om numeriska data
Numeriska data är i princip den kvantitativa data som erhålls från en variabel, och värdet har en känsla av storlek/magnitud. De numeriska data som erhålls är ytterligare indelade i ytterligare tre kategorier baserat på teorin utvecklad av Stanley Smith Stevens. Numeriska data kan vara antingen ordinal, intervall eller förhållande. Typen av data bestäms av mätmetoden för värdena, och typerna är kända som mätnivåer.
Vikten på en person, avståndet mellan två punkter, temperatur och priset på en aktie är exempel på numeriska data.
I statistik är majoriteten av metoderna härledda för analys av numeriska data. Grundläggande beskrivande statistik och regression och andra inferentiella metoder används huvudsakligen för analys av numeriska data.
Mer om kategoridata
Kategoriska data är värden för en kvalitativ variabel, ofta ett tal, ett ord eller en symbol. De lyfter fram det faktum att variabeln i det aktuella fallet hör till ett av de många tillgängliga alternativen. Därför tillhör de en av kategorierna; därav namnet kategoriskt.
En persons politiska tillhörighet, en persons nationalitet, en persons favoritfärg och en patients blodgrupp är kvalitativa egenskaper. Ibland kan ett tal erhållas som ett kategoriskt värde, men talet i sig representerar inte storleken på det uppmätta attributet. Postnummer är ett exempel.
Dessutom tillhör alla kategoriska värden den nominella datatypen, vilket är en annan typ baserad på mätnivåerna. Metoder som används för att analysera kategoriska data skiljer sig från numeriska data, men den bakomliggande principen kan vara densamma.
Vad är skillnaden mellan kategorisk och numerisk data?
• Numeriska data är värden som erhålls för kvantitativ variabel och har en känsla av storlek som är relaterad till variabelns sammanhang (därav är de alltid siffror eller symboler som bär ett numeriskt värde). Kategoriska data är värden som erhållits för en kvalitativ variabel; kategoriska datanummer ger ingen känsla av storlek.
• Numeriska data tillhör alltid antingen ordinal-, ratio- eller intervalltyp, medan kategoriska data tillhör nominella typer.
• Metoder som används för att analysera kvantitativa data skiljer sig från metoderna som används för kategorisk data, även om principerna är desamma har åtminstone tillämpningen betydande skillnader.
• Numeriska data analyseras med statistiska metoder i beskrivande statistik, regression, tidsserier och många fler.
• För kategorisk data används vanligtvis beskrivande metoder och grafiska metoder. Vissa icke-parametriska tester används också.