U -Test van Mann - Whitney Wat is en wanneer van toepassing, uitvoering, voorbeeld

U -Test van Mann - Whitney Wat is en wanneer van toepassing, uitvoering, voorbeeld

De U -Test van Mann - Whitney Het wordt toegepast om twee onafhankelijke monsters te vergelijken wanneer ze weinig gegevens hebben of geen normale verdeling volgen. Op deze manier wordt het als een test beschouwd niet parametrisch, In tegenstelling tot uw tegenhanger Student T -test, dat wordt gebruikt wanneer het monster groot genoeg is en de normale verdeling volgt.

Frank Wilcoxon stelt het voor het eerst in 1945 voor, voor monsters van identieke maten, maar twee jaar later werd het uitgebreid in het geval van monsters van verschillende grootte door Henry Mann en D. R. Whitney.

Figuur 1. De u -test van Mann - Whitney wordt toegepast voor de vergelijking van onafhankelijke monsters. Bron: Pixabay.

Vaak wordt de test toegepast om te controleren of er een verband is tussen een kwalitatieve variabele en een andere kwantitatieve.

Een illustratief voorbeeld is om een ​​reeks hypertensieve mensen te nemen en twee groepen te extraheren, aan wie de dagelijkse bloeddrukgegevens worden geregistreerd voor een maand.

Op de ene groep wordt de behandeling A en een andere toegepast de behandeling B. Hier is de bloeddruk de kwantitatieve variabele en het type behandeling is de kwalitatieve.

U wilt weten of de mediaan, en niet het gemiddelde, van de gemeten waarden statistisch gelijk of anders is, om vast te stellen of er een verschil is tussen beide behandelingen. Om het antwoord te verkrijgen, wordt de Wilcoxon of U -test van Mann - Whitney toegepast.

[TOC]

Probleembenadering in de u -test van Mann - Whitney

Een ander voorbeeld waarin de test kan worden toegepast, is als volgt:

Stel dat u wilt weten of de consumptie van frisdranken aanzienlijk verschilt in twee regio's van het land.

Een van hen wordt regio A genoemd en de andere regio B. Een record van de liters die wekelijks in twee monsters worden geconsumeerd, wordt uitgevoerd: een van de 10 mensen voor regio A en een van de 5 mensen voor regio B.

De gegevens zijn als volgt:

-Regio A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

-Regio B: 12,14, 11, 30, 10

De volgende vraag is gesteld:

Hangt de consumptie van frisdranken (y) af van de regio (x)?

Kwalitatieve variabelen versus kwantitatieve variabelen

-Kwalitatieve variabele x: Regio

-Kwantitatieve variabele en: Gaseous Consumptie

Als de hoeveelheid liters in beide regio's hetzelfde is, zal de conclusie zijn dat er geen afhankelijkheid is tussen de twee variabelen. De manier om te weten is door de gemiddelde of mediane trend voor de twee regio's te vergelijken.

Normaal geval

Als de gegevens op een normale verdeling volgden, worden twee hypothesen verhoogd: de nul H0 en het H1 -alternatief door de vergelijking tussen de gemiddelden:

Kan u van dienst zijn: opmerkelijke producten

-H0: Er is geen verschil tussen het gemiddelde van de twee regio's.

-H1: De middelen van beide regio's zijn anders.

Geval zonder - normale neiging

Integendeel, als de gegevens geen normale verdeling volgen of eenvoudigweg het monster erg klein is om te weten, in plaats van het gemiddelde te vergelijken, zou het worden vergeleken De mediaan van de twee regio's.

-H0: Er is geen verschil tussen de mediaan van de twee regio's.

-H1: De mediaan van beide regio's zijn anders.

Als de mediaan samenvallen, wordt de nulhypothese vervuld: er is geen relatie tussen frisdrankconsumptie en de regio.

En als het tegenovergestelde gebeurt, is de alternatieve hypothese waar: er is een relatie tussen consumptie en regio.

Het is voor deze gevallen waarin de U -test van Mann - Whitney wordt aangegeven.

Monster- of niet -gepareerde monsters

De volgende belangrijke kwestie om te beslissen of de U -test van Mann Whitney wordt toegepast, is of het aantal gegevens in beide monsters identiek is, wat gelijk is aan te zeggen dat ze tegelijkertijd zijn.

Als de twee monsters zijn gekoppeld, zou de originele Wilcoxon -versie van toepassing zijn. Maar zo niet, zoals het geval is van het voorbeeld, wordt de gemodificeerde Wilcoxon -test toegepast, die precies is van de U -test van Mann Whitney.

Mann Whitney U -testkenmerken

De u -test van Mann -Whitney een niet -parametrische test, van toepassing op monsters die niet de normale verdeling volgen of met weinig gegevens. Het heeft de volgende kenmerken:

1.- Vergelijk de mediaan

2.- Werkt op geordende reeksen

3.- Het is minder krachtig, door kracht te begrijpen de kans om de nulhypothese af te wijzen, terwijl het in werkelijkheid vals is.

Als rekening wordt gehouden met deze kenmerken, wordt de u -test van Mann - Whitney toegepast wanneer:

-De gegevens zijn onafhankelijk

-Ze volgen niet de normale verdeling

-De null H0 -hypothese wordt geaccepteerd als het medium van de twee monsters samenvalt: Ma = MB

-De H1 -alternatieve hypothese wordt geaccepteerd als het medium van de twee monsters verschilt: Ma ≠ MB

Mann -formule - Whitney

De U -variabele is de contraststatus die wordt gebruikt in de Mann - Whitney -test en deze is gedefinieerd:

U = min (ua, ub)

Dit betekent dat u het minste is van de waarden tussen UA en UB, toegepast op elke groep. In ons voorbeeld zou het voor elke regio zijn: a o b.

UA- en UB -variabelen worden gedefinieerd en berekend volgens de volgende formule:

Ua = nb + na (na +1)/2 - ra

Ub = nb + nb (nb +1)/2 - rb

Kan u van dienst zijn: vermindering van vergelijkbare termen

Hier zijn de NA- en NB -waarden de afmetingen van de monsters die respectievelijk overeenkomen met regio's A en B en aan de andere kant zijn RA en RB de bereik sommen die we hieronder zullen definiëren.

Stappen om de test toe te passen

1.- Bestel de waarden van de twee monsters.

2.- Wijs een bestelbereik toe aan elke waarde.

3.- Corrigeer bestaande ligaturen in de gegevens (herhaalde waarden).

4.- Bereken de ra = som van de bereiken van het monster a.

5.- Zoek RB = som van de bereiken van steekproef B.

6.- Bepaal de UA- en UB -waarde, volgens de formules die in de vorige sectie worden gegeven.

7.- Vergelijk UA en UB, en de minderjarige van de twee wordt toegewezen aan de OK -experimentele statistiek (dat wil zeggen de gegevens) vergeleken met de theoretische of normale statistiek.

Praktische toepassing van toepassing

Nu passen we het bovengenoemde toepassen van het eerder opgeheven probleem van frisdrank toe:

Regio A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

Regio B: 12,14, 11, 30, 10

Afhankelijk dat de middelen van beide monsters statistisch hetzelfde of anders zijn, gaan we verder met het accepteren of verwerpen van de nulhypothese: er is geen verband tussen de variabele en en x, dat wil zeggen dat de consumptie van frisdrank niet afhankelijk is van de regio:

H0: Ma = MB

H1: Ma ≠ MB

Figuur 2. Gaseeuze consumptiegegevens in regio's A en B. Bron: f. Zapata.

- Stap 1

We gaan door met het bestellen van de gegevens gezamenlijk voor de twee monsters en bestellen de waarden van minst naar de grootste:

Merk op dat waarde 11 2 keer verschijnt (eenmaal in elk monster). Oorspronkelijk heeft het posities of bereiken 3 en 4, maar om het ene niet te overschatten of te onderschatten, wordt de gemiddelde waarde gekozen als een bereik, dat wil zeggen 3,5.

Evenzo wordt de 12 -waarde voortgezet, die driemaal wordt herhaald met Ranges 5, 6 en 7.

Welnu, de waarde 12 is toegewezen het gemiddelde bereik van 6 = (5+6+7)/3. En hetzelfde voor waarde 14, die ligatie heeft (verschijnt in beide monsters) in posities 8 en 9, het gemiddelde bereik 8 wordt toegewezen.5 = (8+9)/2.

- Stap 2

De gegevens voor regio A en B worden vervolgens opnieuw gescheiden, maar nu worden hun overeenkomstige bereiken in een andere rij toegewezen:

Regio A

Regio B

RB -bereiken worden verkregen uit de bedragen van de elementen van de tweede rij voor elk geval of gebied.

Stap 3

De respectieve UA- en UB -waarden worden berekend:

UA = 10 × 5 + 10 (10 + 1)/2 - 86 = 19

UB = 10 × 5 + 5 (5 + 1)/2 -34 = 31

Experimentele waarde u = min (19, 31) = 19

Stap 4

De theoreticus wordt verondersteld een normale verdeling N te volgen met parameters die exclusief worden gegeven door de grootte van de monsters:

Kan u van dienst zijn: irrationele getallen: geschiedenis, eigenschappen, classificatie, voorbeelden

N ((na⋅nb) /2, √ [nb (na + nb +1) /12])

Om de variabele te vergelijken of experimenteel verkregen, is het met de theoretische. Het gaat van de variabele of experimenteel naar zijn waarde getypeerd, die zal worden genoemd Z, Om te kunnen vergelijken met die van een normale distributie getypeerd.

De variabele verandering is als volgt:

Z = (u - na.Nb / 2) / √ [na. NB (Na + NB + 1) / 12] 

Opgemerkt moet worden dat voor de variabele wijziging de parameters van de theoretische verdeling voor u zijn gebruikt. Dan de nieuwe z -variabele, die een hybride is tussen de theoretische en de experimentele of een normale verdeling getypeerde n (0,1).

Vergelijkingscriteria

Als z ≤ Zα ⇒ De nul H0 -hypothese wordt geaccepteerd

JA Z> Zα ⇒ De null H0 -hypothese wordt afgewezen

De kritieke waarden Zα Typified zijn afhankelijk van het vereiste vertrouwensniveau, bijvoorbeeld voor een niveau van vertrouwen α = 0,95 = 95% dat de meest gebruikelijke is, heeft de kritische waarde Zα = 1,96.

Voor de hier getoonde gegevens:

Z = (u - nb / 2) / √ [nb (na + nb + 1) / 12] = -0.73

Die lager is dan de kritieke waarde 1.96.

Dan is de uiteindelijke conclusie dat de nulhypothese wordt geaccepteerd:

Er is geen verschil in de consumptie van frisdrank tussen regio's A en B.

Online rekenmachines voor de u -test van Mann - Whitney

Er zijn specifieke programma's voor statistische berekeningen, waaronder SPSS en Minitab, maar deze programma's worden betaald en het gebruik ervan is niet altijd eenvoudig. Dit komt omdat ze zoveel opties geven, dat het gebruik ervan praktisch gereserveerd is voor statistische experts.

Gelukkig zijn er verschillende zeer precieze, gratis en eenvoudige online programma's die onder andere toestaan ​​aan de U -Whitney U -tests.

Deze programma's zijn:

-Social Science Statistics (Socscistatistiek.com), die zowel de U-Whitney U-test als Wilcoxon heeft in het geval van evenwichtige of gepaarde monsters.

-AI Therapy Statistics (AI-Therapy.com), die verschillende van de gebruikelijke beschrijvende statistische tests heeft.

-Statistisch te gebruiken (natuurkunde.CSBSJU.Edu/statistieken), een van de oudste, dus uw interface kan er verouderd uitzien, hoewel het een zeer efficiënt gratis programma is.

Referenties

  1. Dietrichson. Kwantitatieve methoden: Ranges -test. Hersteld van: bookdown.borg
  2. Marín J P. SPSS -gids: analyse en procedures in niet -parametrische tests. Hersteld van: halweb.UC3M.is
  3. Gebruik MOOC. Niet -parametrische test: U van Mann - Whitney. Hersteld van: YouTube.com
  4. Wikipedia. U -Test van Mann - Whitney. Hersteld van: is.Wikipedia.com
  5. Xlstat. Helpcentrum. Mann Test Tutorial - Whitney in Excel. Hersteld van: hulp.XLSAT.com