Categorische variabele kenmerken en voorbeelden

Categorische variabele kenmerken en voorbeelden

De categorische variabele Het is degene die in statistieken wordt gebruikt om een ​​niet-numerieke of kwalitatief kenmerk of eigenschap toe te wijzen aan een object, individu, entiteit, voorwaarde of procedure. Het is mogelijk om allerlei categorische variabelen te definiëren volgens elke behoefte. 

Voorbeelden van categorische variabelen zijn: kleur, geslacht, bloedgroep, burgerlijke staat, type materiaal, betalingsvorm of type bankrekening en worden dagelijks veel gebruikt.

Figuur 1: Kleur is een categorische variabele. Bron: Pixabay

Het bovenstaande zijn de variabelen, maar hun mogelijke waarden zijn kwalitatief, dat wil zeggen van kwaliteit of karakteristiek en niet van een numerieke meting. Bijvoorbeeld de mogelijke waarden voor de variabele seks Zijn: mannelijk , HOvertuigen.

Wanneer deze variabele in een computerprogramma wordt opgeslagen, kan deze worden aangegeven als een tekstvariabele en worden de enige geaccepteerde waarden benoemd: Mannelijk , Vrouwelijk.

Maar dezelfde variabele seks kan worden verklaard en opgeslagen als een geheel getal als Mannelijk is toegewezen 1 al Vrouwelijk De waarde is toegewezen 2. Het is om deze reden dat categorische variabelen soms het vermelde type worden genoemd.

Het belangrijkste kenmerk van categorische variabelen is dat in tegenstelling tot andere variabelen, zoals continu en discreet, het niet mogelijk is om rekenkundige met hen te maken. Statistieken kunnen echter met hen worden gedaan, zoals later zal worden gezien.

[TOC]

Voorbeelden

Let op de volgende voorbeelden van categorische variabelen en hun mogelijke waarden:

-Bloedtype, Waardenbereik: A, B, AB, of

-Burgerlijke staat, Categorische waarden: Enkel (NAAR), Getrouwd (B), Weduwnaar (C) , Gescheiden (D).

-Type materiaal, Categorieën of waarden: 1 = hout, 2 = metaal, 3 = plastic

-Manier om te betalen, Waarden of categorieën: (1) contant geld, (2) debet, (3) overdracht, (4) krediet

Kan u van dienst zijn: Tesla Coil: Geschiedenis, hoe het werkt, waar is het voor

In de vorige voorbeelden is een getal op een volledig willekeurige manier aan elke categorie gekoppeld. 

Men dan kan worden gedacht dat deze willekeurige numerieke associatie het gelijk maakt aan een Discrete kwantitatieve variabele, Maar het is niet omdat rekenkundige bewerkingen niet met deze cijfers kunnen worden gedaan.

Om het idee te illustreren in de variabele Manier om te betalen, De sombewerking heeft geen zin:

 (1) effectief + (2) Debet zal nooit gelijkwaardig zijn aan (3) overdracht

Classificatie van categorische variabelen

De classificatie is gebaseerd op de vraag of ze een impliciete hiërarchie hebben of dat het aantal mogelijke resultaten meer dan twee of twee is.

Een categorische variabele met een enkel mogelijk resultaat is geen variabele, het is een categorische constante.

Nominaal categorisch 

Wanneer ze niet kunnen worden vertegenwoordigd door een nummer of een bestelling hebben. Bijvoorbeeld de variabele: Type_de_materiaal, tnominale waarden (Hout, metaal, plastic), ze hebben geen hiërarchie of volgorde, zelfs wanneer een willekeurig nummer wordt toegewezen aan elke reactie of categorie.

Ordinaal categorisch

Variabele: Academische prestatie

Nominale waarden: Hoog gemiddeld laag

Hoewel de waarden van deze variabele niet numeriek zijn, hebben ze een bestelling of hiërarchie impliciet.

Binair categorisch

Dit zijn bijvoorbeeld nominale variabelen met twee mogelijke antwoorden, bijvoorbeeld:

-Variabele: Antwoord

-Nominale waarden: WAAR, Nep

Merk op dat de variabele Antwoord Het impliceert geen hiërarchie en heeft slechts twee mogelijke resultaten, dus het is een binaire categorische variabele.

Sommige auteurs noemen dit type binaire variabele, En ze beschouwen het niet als behorend tot de categorische variabelen die beperkt zijn tot mensen met meer dan drie mogelijke categorieën.

Statistieken met categorische variabelen

Statistieken kunnen worden gemaakt met categorische variabelen, ondanks dat ze geen numerieke of kwantitatieve variabelen zijn. Om bijvoorbeeld de meest waarschijnlijke trend of waarde van een categorische variabele te kennen die deze is genomen Mode.

Het kan u dienen: Astroclypics: geschiedenis, welke studies, takken

Mode Het is in dit geval het meest herhaalde resultaat of de waarde van een categorische variabele. In categorische variabelen is het niet mogelijk om noch het gemiddelde, noch de mediaan te berekenen.

Het gemiddelde kan niet worden berekend omdat het niet rekenkunde kan worden gemaakt met categorische variabelen. Noch de mediaan, omdat de kwantitatieve of categorische variabelen geen volgorde of hiërarchie hebben, dus het is niet mogelijk om een ​​centrale waarde te bepalen.

Grafische weergave van categorische variabelen

Gegeven een bepaalde categorische variabele, kunt u de frequentie of het aantal keren vinden waarmee een resultaat van die variabele wordt herhaald. Als dit voor elk resultaat wordt gedaan, kan een frequentiegrafiek worden gemaakt, afhankelijk van elke categorie of resultaat.

Hier zijn enkele voorbeelden van hoe categorische variabelen grafisch kunnen worden weergegeven.

Opgeloste oefeningen

Oefening 1

Een bedrijf heeft gegevens van 170 werknemers. Een van de variabelen die in deze records zit, is: Burgerlijke staat. Deze variabele heeft vier mogelijke categorieën of waarden:

Enkel (NAAR), Getrouwd (B), Weduwnaar (C) , Gescheiden (D).

Hoewel het een niet-nummere variabele is, is het mogelijk om te weten hoeveel van de totale records zich in een bepaalde categorie bevinden en worden weergegeven in de vorm van een staafdiagram, zoals weergegeven in de volgende figuur:

Figuur 2. Weergave van de resultaten van een categorische variabele. Bron: zelf gemaakt

Voorbeeld 2

Een schoenenwinkel draagt ​​een record van zijn verkoop. Onder de variabelen die met hun records omgaan, is de schoenkleur voor elk model. De variabele: 

Color_zapato_modelo_aw3

Het is categorisch en heeft vijf mogelijke categorieën of waarden. Voor elke categorie van die variabele wordt het aantal omzet opgeteld en het percentage van hetzelfde is vastgesteld. De resultaten worden gepresenteerd in de grafiek van de volgende figuur:

Kan u van dienst zijn: elektrische eigenschappen van materialen figuur 3. Categorische variabele kleur _ Zapato. Op deze variabele manier is wit. Bron: zelf gemaakt.

Het kan dan worden gezegd dat van het AW3 -schoenmodel dat is mode, Het meest verkochte is de Wit, op de voet gevolgd door de Zwart

Er kan ook worden gezegd dat 70% waarschijnlijkheid de volgende schoen die van dit model wordt verkocht, zal zijn Wit of Zwart.

Deze informatie kan handig zijn voor de winkel bij het maken van nieuwe bestellingen, of kan zelfs kortingen toepassen op de minst verkochte kleuren voor overtollige inventaris.

Voorbeeld 3

Voor een bepaalde populatie bloeddonoren willen we het aantal mensen vertegenwoordigen dat tot een bepaalde bloedgroep behoort. Een grafische manier om de resultaten te visualiseren is via een pictogram, dat op de achtergrond een tabel is.

In de eerste kolom wordt de variabele weergegeven Bloedtype en de mogelijke resultaten of categorieën. De tweede kolom heeft de weergave op een iconische of picturale manier van het aantal mensen in elke categorie. In ons voorbeeld wordt een rode druppel gebruikt als een pictogram, die elk 10 mensen vertegenwoordigen.

Figuur 4. Pictogram. Bron: zelf gemaakt

Referenties

  1. Khan Academy. Categorische gegevens analyseren. Hersteld van: Khanacademy.borg
  2. Universe -formules. Kwalitatieve variabele. Opgehaald uit: Univesformulas.com
  3. Minitab. Die categorische, discrete en continue variabelen zijn. Hersteld van: ondersteuning.Minitab.com
  4. Excel -tutorial. Karakterisering van variabelen. Hersteld van: hulp.Xlslat.com.
  5. Wikipedia. Statistische variabele. Hersteld van Wikipedia.com
  6. Wikipedia. Categorische variabele. Hersteld van Wikipedia.com
  7. Wikipedia. Variabel categorisch. Hersteld van Wikipedia.com