Punctuele schatting

Punctuele schatting

We leggen uit wat het puntschatting is, de eigenschappen ervan, methoden. Bovendien hebben we een voorbeeld en opgeloste oefeningen geplaatst

Wat is de punctuele schatting?

De Punctuele schatting Van de statistische parameters van een of andere populatiekarakteristiek is het er een die wordt uitgevoerd uit een of meer monsters van genoemde kenmerken, weergegeven als willekeurige variabele.

De populaties kunnen divers zijn: de vrouwen van een stad, de patiënten van een ziekenhuis, de schroeven vervaardigd door een bepaalde industrie in een maand en vele anderen.

In de populatie van vrouwen in een stad kan een statistische studie zich richten op verschillende kenmerken van deze populatie: bijvoorbeeld de grootte van schoenen, lengte, taille maatregel, haarkleur, aantal kinderen, leeftijd en talloze andere kenmerken.

Zodra de populatie en het kenmerk dat een statistische studie wil ondergaan, worden gekozen, wordt een size steekproef gekozen N, die meestal vrij kleiner is dan maat N van de totale bevolking.

Eigenschappen van punctuele schatting

Bekend de gegevens van een monster, die worden weergegeven door een willekeurige variabele X, Deze worden weergegeven door een set van N Reële getallen: (x1, X2,.. ., XN)).

Met deze gegevens kunnen sommige statistieken van het monster worden berekend:

  • Voorbeeldgemiddelde: = (x1+X2,.. ., +XN)/N.
  • Steekproefvariantie: S2 = [x1 ~ ))2 +.. . +(XN ))2]/N.
  • Quasi-variza monster: SC2 = [x1 ~ ))2 +.. . +(XN ))2]/(N 1).
Normale verdeling van een populatie met centrale waarde μ en sigma -afwijking σ

Aan de andere kant, de Populatie gemiddelde μ en de Populatievariantie σ2 Ze zouden kennis vereisen van alle gegevens van de totale bevolking, die een grootte heeft N >> n. Bijgevolg is het vaak onhaalbaar om precies de populatieparameters te kennen.

Gezien dit, benaderen de populatiewaarden meestal door steekproefwaarden, benadering bekend als Punctuele schatting. SHet zal goed of slecht zijn, voornamelijk afhankelijk van de hoeveelheid gegevens en de kwaliteit van de steekproef. Het monster staat bekend als de schatter.

Kan u van dienst zijn: Cotangent afgeleid: berekening, demonstratie, oefeningen

Een goede schatter moet een aantal gewenste kenmerken of eigenschappen hebben:

  • Samenhang
  • Minimale variatie 
  • Efficiëntie.

1.- Samenhang

Een monster moet voldoende gegevens hebben, zodat de schatting van de parameters consistent is. Als bijvoorbeeld drie of meer monsters worden genomen en de steekproefstatistieken zeer ongelijk aan elkaar zijn, zou het niet passend zijn om een ​​van deze resultaten als een specifieke schatting te maken. 

In de meeste gevallen is het voldoende om monsters van een groter aantal gegevens te nemen, zodat de van hen verkregen statistische parameters beginnen convergentie of toeval te tonen, altijd met enige tolerantie. In het geval er geen convergentie is, ondanks de toename van gegevens, moet hun kwaliteit worden herzien, omdat ze vooringenomenheid kunnen hebben, of ze gewoon slecht werden genomen.

2.- Minimale variabiliteit

Als er meerdere schatters beschikbaar zijn waarvan de gemiddelde waarden samenvallen met enige tolerantie, worden degenen die de minste steekproefvariantie hebben gekozen.

3.- Efficiëntie

A N -schatter is efficiënt vanaf het moment dat de steekproefvarianties van de kousen naar nul neigen, omdat N de neiging heeft om oneindig te zijn. Is wat wordt genoemd Asymptotische efficiëntie van de schatter.

Methoden

Hieronder staan ​​enkele praktijken of methoden die het mogelijk maken om een ​​succesvolle punctuele schatting van de populatieparameters te maken, beginnend bij een steekproef.

1.-Willekeurige partitie

De willekeurige partitie van een monster om de consistentie te controleren wordt gebruikt. Deze methode bestaat uit het nemen van een monster van N -grootte en het wil willekeurig in twee monsters delen, van elk n/2 -grootte.

Als het monstergemiddelde en de monstervariantie samenvallen met een bepaald aantal significante figuren, meestal 2 of 3 figuren, dan kan worden gezegd dat er samenhang tussen hen is.

Kan u van dienst zijn: multiplicatief principe: teltechnieken en voorbeelden

Aan de andere kant, als er toeval is op het niveau van significante cijfers tussen de statistische parameters berekend met het oorspronkelijke N -groottemonster en de twee subsams, is er ook convergentie, en het kan worden bevestigd dat de steekproefgrootte voldoende is. Anders zou het nodig zijn om aanvullende gegevens te nemen, om de hoeveelheid voorbeeldgegevens te verhogen.

2.- Modus methode

Deze methode is om de momenten van een willekeurige steekproef van N -grootte te matchen, met die verkregen uit de monsterverdelingskandidaat. Als de kandidaat -distributie M -parameters heeft, is het nodig om M -momenten te matchen.

3.- Maximale geloofwaardigheidsmethode

Hij werd voorgesteld door Fisher, een van de ouders van de statistische wetenschap, ongeveer honderd jaar geleden. Het bestaat uit het optimaliseren of maximaliseren van de waarschijnlijkheid van het optreden van een bepaalde set monsterwaarden.

Voorbeeld

Stel dat het gedrag van een bepaalde populatievariabele een exponentiële verdeling volgt, waarvan de kansdichtheid wordt gegeven door:

 f (x; λ) = λ ⋅ exp (−λ⋅x)

Het is duidelijk een enkele parameterverdeling λ.

Om een ​​schatting te maken van de genoemde populatieparameter, kan een willekeurige steekproef van N -grootte worden gebruikt, waarvan de resultaten als volgt zijn: (x1, X2,.. ., XN))

Het eerste moment van het monster wordt verkregen, wat de gemiddelde waarde is, via:

= (x1 + X2 +… + XN) / N

Het kan worden aangetoond dat het eerste moment van exponentiële verdeling de integraal is van 0 tot oneindig van de x⋅f -functie (x; λ), en het resultaat is 1/λ.

Gelijk aan het monstermoment met dat van de bevolkingsverdeling, wordt geconcludeerd dat de specifieke schatting van λ 1/ is.

Opgeloste oefeningen

Oefening 1

In een studie uitgevoerd met 100 gegevens, werd vastgesteld dat de gemiddelde tijd die een persoon neemt om een ​​YouTube -video te visualiseren, zodra de melding is ontvangen, 3 minuten is. Zoek de tijdkansverdeling die wordt gebruikt om de video te zien, zodra de melding is ontvangen.

Het kan u van dienst zijn: y = 3Sen (4x) functieperiode

Oplossing

Er zal worden aangenomen dat de maximale waarschijnlijkheid dat een persoon een video beoordeelt, net na de melding plaatsvindt, maar als het lang daarna voorbijgaat, is de kans dat de persoon de video ziet erg laag is.

Dit is het typische gedrag van een exponentiële verdeling, daarom kan populatiegedrag worden gemodelleerd door de volgende waarschijnlijkheidsverdeling, voor tijd t (in minuten), gemeten uit de melding:

 f (t; λ) = λ ⋅ exp (−λ⋅T)

In dit type verdeling is de hoop of het gemiddelde = 1/λ, zoals uitgelegd in de vorige sectie. Vervolgens kunt u uit de voorbeeldinformatie λ benaderen:

λ ≈ ⅓.

Oefening 2

Een enquête wordt gedaan met een enkele vraag, waarvan mogelijke antwoorden zijn: ja (1) of niet (0). De resultaten van de enquête waarin iedereen reageerde waren: 26 Ja en 14 nee.

In de veronderstelling dat het antwoord willekeurig is, is de verdeling van deze resultaten een binomiale verdeling wiens kans is:

P = P26 · (1 - -P)14

Het kan worden aangetoond dat het maximum van deze functie optreedt wanneer P de waarde 26/40 neemt, en dit is de waarde die de monsterwaarden verkregen maakt.