Maatregelen van centrale neiging voor gegroepeerde gegevensformules, oefeningen

Maatregelen van centrale neiging voor gegroepeerde gegevensformules, oefeningen

De trendmaatregelen centraal Ze geven de waarde aan waarvoor de gegevens van een verdeling zijn. De bekendste is het gemiddelde of rekenkundig gemiddelde, dat bestaat uit het toevoegen van alle waarden en het delen van het resultaat door het totale aantal gegevens.

Als de verdeling echter uit een groot aantal waarden bestaat en niet op een ordelijke manier wordt gepresenteerd, is het niet eenvoudig om de benodigde berekeningen uit te voeren om de waardevolle informatie die ze bevatten te extraheren.

Figuur 1. Centrale neigingsmaatregelen voor gegroepeerde gegevens zijn een goede indicatie voor het algemene gegevensgedrag

Daarom zijn ze gegroepeerd in klassen of categorieën om een distributie van Frequenties. Het uitvoeren van deze vorige volgorde van de gegevens, dan is het gemakkelijker om de centrale neigingsmaatregelen te berekenen, waaronder:

-Half

-Mediaan

-Mode

-Geometrisch gemiddelde

-Harmonisch gemiddelde

Formules

Hieronder hebben we de formules van de centrale tendensmaatregelen voor de gegroepeerde gegevens:

Rekenkundig gemiddelde

Het gemiddelde is het meest gebruikt om kwantitatieve gegevens (numerieke waarden) te karakteriseren, hoewel het vrij gevoelig is voor de extreme verdelingswaarden. Het wordt berekend door:

Met:

-X: Gemiddeld of gemiddeld rekenkunde

-FJe: klassenfrequentie

-MJe: Het klassenmerk

-G: klassennummer

-N: Totale gegevens

Mediaan

Om het te berekenen, is het noodzakelijk om het interval te vinden dat de observatie N/2 en interpolar bevat om de numerieke waarde van genoemde observatie te bepalen, door middel van de volgende formule:

Waar:

-C: Intervalbreedte waartoe de mediaan behoort

-BM: Lagere grens van genoemde interval

-FM: Aantal observaties in het interval

-N/2: Totale gegevens gedeeld door 2.

-FBM: Aantal observaties vóór het interval dat de mediaan bevat.

Daarom is de mediaan een positiemaatregel, die wil zeggen dat de gegevensset in twee delen wordt verdeeld. Ze kunnen ook worden gedefinieerd kwartiel, Deciles En percentiel, die de verdeling verdelen in respectievelijk vier, tien en honderd delen.

Kan u van dienst zijn: Fourier -transformatie: eigenschappen, toepassingen, voorbeelden

Mode

In de gegroepeerde gegevens wordt de klasse of categorie die de meeste waarnemingen bevat gevraagd. Dit is de Modale klasse. Een verdeling kan twee of meer mode hebben, in welk geval deze wordt genoemd bimodaal En Multimodaal, respectievelijk.

U kunt ook mode berekenen in gegroepeerde gegevens na de vergelijking:

Met:

-L1: Ondergrens van de klas waar mode is

1: Het blijft tussen de frequentie van de modale klasse en de frequentie van de klasse die eraan voorafgaat.

2: Trek af tussen de frequentie van de modale klasse en de frequentie van de klasse die het volgt.

-C: Intervalbreedte met mode

Harmonisch gemiddelde

Het harmonische gemiddelde wordt aangeduid door h. Als je een set hebt N Waarden x1, X2, X3..., het harmonieuze gemiddelde is het omgekeerde of wederzijdse van het rekenkundig gemiddelde van de omgekeerde van de waarden.

Het is gemakkelijker om het door de formule te zien:

En wanneer de gegroepeerde gegevens worden gehad, wordt de uitdrukking omgezet in:

Waar:

-H: Harmonisch gemiddelde

-FJe: klassenfrequentie

-MJe: Klasmerk

-G: klassennummer

-N = f1 + F2 + F3 +..

Geometrisch gemiddelde

Als je hebt N Positieve getallen x1, X2, X3..., het geometrische gemiddelde wordt berekend door het n -em van het product van alle getallen:

In het geval van de gegroepeerde gegevens kan worden aangetoond dat het decimale logaritme van de geometrische gemiddelde log G wordt gegeven door:

Waar:

-G: Geometrisch gemiddelde

-FJe: klassenfrequentie

-MJe: Het klassenmerk

-G: klassennummer

-N = f1 + F2 + F3 +..

Relatie tussen H, G en X

Het is altijd waar dat:

H ≤ g ≤ x

De meeste gebruikte definities

De volgende definities zijn nodig om de waarden te vinden die in de vorige formules worden beschreven:

Frequentie

De frequentie wordt gedefinieerd als het aantal keren dat een feit wordt herhaald.

Bereik

Het is het verschil tussen de major en de kleine waarde, aanwezig in de verdeling.

Aantal klassen

Om te weten hoeveel klassen we de gegevens groeperen, gebruiken we enkele criteria, bijvoorbeeld het volgende:

Kan u van dienst zijn: 17 redeneerde problemen

Grenzen

De extreme waarden van elke klasse of interval worden aangeroepen grenzen en elke klasse kan beide goed gedefinieerde limieten hebben, in welk geval hij een ondergrens heeft en een groter. Of het kan open grenzen hebben, wanneer een bereik wordt gegeven, bijvoorbeeld van waarden die groter of lager zijn dan een bepaald aantal.

Klassenmerk

Het bestaat eenvoudig uit het middelpunt van het interval en wordt berekend met het gemiddelde van de bovengrens en de ondergrens.

Intervalbreedte

De gegevens kunnen worden gegroepeerd in klassen van gelijke of verschillende grootte, dit is de breedte of amplitude. De eerste optie is het meest gebruikt, omdat het de berekeningen vergemakkelijkt, hoewel het in sommige gevallen noodzakelijk is dat klassen verschillende breedte hebben.

De breedte C Uit het interval kan het worden bepaald door de volgende formule:

C = bereik / nC

WaarC Het is het aantal klassen.

Oefening opgelost

Hieronder hebben we een reeks snelheidsmetingen in km/u, genomen met radar, die overeenkomen met 50 auto's die door een straat zijn gegaan in een bepaalde stad:

Figuur 2. Tabel voor de oefening opgelost. Bron: f. Zapata.

Oplossing

De gepresenteerde gegevens zijn niet georganiseerd, dus de eerste stap is om ze in klassen te groeperen.

Stappen om de gegevens te groeperen en de tabel te bouwen

Stap 1

Vind het bereik R:

R = (52 - 16) km/h = 36 km/h

Stap 2

Selecteer het aantal klassen nC, Volgens de gegeven criteria. Omdat er 50 gegevens zijn, kunnen we n kiezenC = 6.

Stap 3

Bereken de breedte C van het interval:

C = bereik /nC = 36/6 = 6

Stap 4

Vormklassen en groepsgegevens als volgt: voor de eerste klasse wordt een ondergrens gekozen zodra de lagere waarde aanwezig in de tabel wordt toegevoegd aan deze waarde van C = 6, eerder berekend, en het wordt dus de bovengrens van de eerste klas.

Het verloopt op dezelfde manier om de rest van de klassen te bouwen, zoals weergegeven in de volgende tabel:

Kan u van dienst zijn: wat is een capicúa -nummer? Eigenschappen en voorbeelden

Elke frequentie komt overeen met een kleur in figuur 2, op deze manier wordt ervoor gezorgd dat er geen waarde ontsnapt.

Gemiddelde berekening

X = (5 x 18.5 +25 x 25.0 + 10 x 31.5 + 6 x 38.0 + 2 x 44.5 + 2 x 51.0) ÷ 50 = 29.03 km/h

Mediane berekening

De mediaan staat in klasse 2 van de tabel, omdat er de eerste 30 distributiegegevens zijn.

-Intervalbreedte waartoe de mediaan behoort: C = 6

-Lagere grens van het interval waar de mediaan is: BM = 22.0 km/h

-Aantal observaties in het interval FM = 25

-Totale gegevens gedeeld door 2: 50/2 = 25

-Aantal observaties vóór het interval dat de mediaan bevat: FBM = 5

En de bewerking is:

Mediaan = 22.0 + [(25-5) ÷ 25] × 6 = 26.80 km/h

Mode

Mode is ook te vinden in klasse 2:

-Intervalbreedte: C = 6

-Ondergrens van de klas waar mode wordt gevonden: l1 = 22.0

-Trek af tussen de frequentie van de modale klasse en de frequentie van de klasse die eraan voorafgaat: δ1 = 25-5 = 20

-Trek af tussen de frequentie van de modale klasse en de frequentie van de klasse die volgt: δ2 = 25 - 10 = 15

Met deze gegevens is de bewerking:

Mode = 22.0 + [20 ÷ (20 + 15)] x6 = 25.4 km/h

Berekening van het geometrische gemiddelde

N = f1 + F2 + F3 +... = 50

log g = (5 x log 18.5 + 25 x log 25 + 10 x log 31.5 + 6 x log 38 + 2 × log 44.5 + 2 x log 51) /50 =

Log g = 1.44916053

G = 28.13 km/h

Harmonische gemiddelde berekening

1/h = (1/50) x [(5/18.5) + (25/25) + (10/31.5) + (6/38) + (2/44.5) + (2/51)] = 0.0366

H = 27.32 km/h

Samenvatting van de maatregelen van de centrale neiging

De variabelenseenheden zijn km/h:

-Media: 29.03

-Mediaan: 26.80

-Mode: 25.40

-Geometrische media: 28.13

-Harmonische gemiddelde: 27.32

Referenties

  1. Berenson, m. 1985. Statistieken voor administratie en economie. Inter -American S.NAAR.
  2. Canavos, G. 1988. Waarschijnlijkheid en statistieken: toepassingen en methoden. McGraw Hill.
  3. Devore, J. 2012. Waarschijnlijkheid en statistieken voor engineering en wetenschap. 8e. Editie. Hekelen.
  4. Levin, r. 1988. Statistieken voor beheerders. 2e. Editie. Prentice Hall.
  5. Spiegel, m. 2009. Statistieken. Schaum -serie. 4 TA. Editie. McGraw Hill.
  6. Behandeling van gegroepeerde gegevens. Hersteld van: Itchihuahua.Edu.mx.
  7. Walpole, r. 2007. Waarschijnlijkheid en statistieken voor engineering en wetenschap. Pearson.