Poisson -distributieformules, vergelijkingen, model, eigenschappen

Poisson -distributieformules, vergelijkingen, model, eigenschappen

De Poisson -verdeling Het is een discrete kansenverdeling, waardoor u de kans kunt weten dat, binnen een groot monster en tijdens een bepaald interval, een gebeurtenis waarvan de kans klein is, zich voordoet.

Vaak kan de verdeling van Poisson worden gebruikt in plaats van binomiale verdeling, zolang aan de volgende beschreven omstandigheden wordt voldaan: groot monster en kleine waarschijnlijkheid.

Figuur 1. Poisson -distributiegrafiek voor verschillende parameters. Bron: Wikimedia Commons.

Siméon-Denis Poisson (1781-1840) creëerde deze distributie die zijn naam draagt, erg handig als het gaat om onvoorspelbare gebeurtenissen. Poisson publiceerde zijn resultaten in 1837, een onderzoekswerk naar de kans op het optreden van onjuiste criminele straffen.

Vervolgens hebben andere onderzoekers de verdeling in andere gebieden aangepast, bijvoorbeeld het aantal sterren dat in een bepaalde hoeveelheid ruimte zou kunnen zijn, of de kans dat een soldaat zou sterven vanwege de coz van een paard.

[TOC]

Formule en vergelijkingen

De wiskundige vorm van de verdeling van Poisson is als volgt:

 - De willekeurige variabele is En

- μ (ook soms aangeduid als λ) Het is de gemiddelde of distributieparameter

- Euler -nummer: E = 2.71828

- De kans op het verkrijgen van y = k is p

- k Het is het aantal successen 0, 1,2,3 ..

- N Het is het aantal tests of gebeurtenissen (steekproefgrootte)

De discrete willekeurige variabelen, zoals de naam al aangeeft, zijn afhankelijk van toeval en nemen alleen discrete waarden aan: 0, 1, 2, 3, 4 ..., k.

Het gemiddelde van de verdeling wordt gegeven door:

De σ -variantie, die de dispersie van de gegevens meet, is een andere belangrijke parameter. Voor de verdeling van Poisson is het:

σ = μ

Poisson bepaalde dat wanneer n → ∞ en p → 0, de gemiddelde μ -ook wordt genoemd verwachte waarde- Het neigt naar een constante:

μ → constant

Belangrijk: P Het is de kans op het optreden van de gebeurtenis rekening houdend met de totale bevolking, terwijl P (Y) Het is de voorspelling van Poisson over de steekproef.

Model en eigenschappen

De verdeling van Poisson heeft de volgende eigenschappen:

-De steekproefgrootte is groot: N → ∞.

-De beschouwde gebeurtenissen of gebeurtenissen zijn onafhankelijk van elkaar en komen willekeurig voor.

-Waarschijnlijkheid P Wat een bepaalde gebeurtenis En Het gebeurt voor een specifieke periode is erg klein: P → 0.

-De kans op meer dan één gebeurtenis in het tijdsinterval is 0.

-De gemiddelde waarde is dicht bij een constante gegeven door: μ = n.P (n is de steekproefgrootte))

-Omdat dispersie σ gelijk is aan μ, omdat het grotere waarden aanneemt, is variabiliteit ook groter.

-De gebeurtenissen moeten gelijkmatig worden verdeeld in het gebruikte tijdsinterval.

-De set mogelijke gebeurteniswaarden En Het is: 0,1,2,3,4 .. .

Kan u van dienst zijn: willekeurig experiment: concept, voorbeeldruimte, voorbeelden

-De som van Je Variabelen die een Poisson -verdeling volgen, is ook een andere Poisson -variabele. De gemiddelde waarde is de som van de gemiddelde waarden van deze variabelen.

Verschillen met binomiale verdeling

De verdeling van Poisson verschilt van de binomiale verdeling in de volgende belangrijke aspecten:

-De binomiale verdeling wordt zowel beïnvloed door de grootte van het S -monster als door de waarschijnlijkheid P, Maar de verdeling van Poisson wordt alleen beïnvloed door gemiddeld μ.

-In een binomiale verdeling, de mogelijke waarden van de willekeurige variabele En Ze zijn 0,1,2, ... in plaats daarvan is er in de verdeling van Poisson geen bovengrens voor deze waarden.

Voorbeelden

Poisson paste aanvankelijk zijn beroemde distributie toe op juridische zaken, maar op industrieel niveau was een van zijn eerste toepassingen in de productie van bier. In dit proces worden gistgewassen gebruikt voor fermentatie.

De gist bestaat uit levende cellen, waarvan de populatie in de tijd variabel is. Bij de vervaardiging van bier is het noodzakelijk om de nodige hoeveelheid toe te voegen, dus het is noodzakelijk om de hoeveelheid cellen per volume -eenheid te kennen.

Tijdens de Tweede Wereldoorlog werd de verdeling van Poisson gebruikt om te weten of de Duitsers echt vanuit Calais naar Londen wijzen, of gewoon willekeurig schieten. Dit was belangrijk voor de geallieerden om te bepalen hoe goed het de technologie was die beschikbaar was voor de nazi's.

Praktische toepassingen

De distributietoepassingen van Poisson verwijzen altijd naar tijdtellingen of ruimtetellingen. En omdat de kans op voorkomen klein is, staat het ook bekend als "Law of Rare Events".

Hier is een lijst met gebeurtenissen die in een van deze categorieën vallen:

-Registratie van deeltjes in een radioactief verval, die net als de groei van gistcellen een exponentiële functie is.

-Aantal bezoeken aan een bepaalde website.

-Aankomst van mensen tot een rij om te betalen of aanwezig te worden (theorie van de staarten).

-Aantal auto's dat door een bepaald punt op een weg gaat, voor een bepaald tijdsinterval.

Figuur 2. De hoeveelheid auto's die een punt passeren, volgt ongeveer een Poisson -verdeling. Bron: Pixabay.

-Mutaties leden in een bepaalde DNA -keten na het ontvangen van blootstelling aan straling.

-Diameter meteoornummer groter dan 1 m gevallen in een jaar.

-Defecten per vierkante meter van een stof.

-Hoeveelheid bloedcellen in 1 kubieke centimeter.

-Oproepen per minuut naar een telefoonuitwisseling.

-Chocolade vonken aanwezig in 1 kg cakedegel.

-Aantal bomen geïnfecteerd door de weg in 1 hectare bos.

Merk op dat deze willekeurige variabelen het aantal keren vertegenwoordigen dat een gebeurtenis plaatsvindt gedurende een vaste periode (Oproepen per minuut naar de telefoonuitwisseling), of een gegeven regio van ruimte (Defecten van een stof per vierkante meter)).

Kan u van dienst zijn: proportionele variatie

Deze gebeurtenissen, zoals reeds vastgesteld, zijn onafhankelijk van de tijd die is verstreken sinds het laatste optreden.

De binomiale verdeling naderen met de verdeling van Poisson

De verdeling van Poisson is een goede benadering van binomiale verdeling zolang:

-De steekproefgrootte is groot: n ≥ 100

-Waarschijnlijkheid P is klein: P ≤ 0,1

- μ in de volgorde van: NP ≤ 10

In dergelijke gevallen is de verdeling van Poisson een uitstekend hulpmiddel, omdat binomiale distributie ingewikkeld kan worden om in deze gevallen toe te passen.

Opgeloste oefeningen

Oefening 1

Een seismologisch onderzoek stelde vast dat er de afgelopen 100 jaar wereldwijd 93 grote aardbevingen waren, minstens 6.0 op de richter -logaritmische schaal-. Stel dat de verdeling van Poisson in dit geval een adequaat model is. Vinden:

a) Het gemiddelde voorkomen van grote aardbevingen per jaar.

b) Ja P (Y) Het is de kans om te gebeuren En Aardbevingen voor een willekeurig geselecteerd jaar, zoek de volgende waarschijnlijkheden:

P(0), P(1), P (2), P (3), P (4), P (5), P (6) en P (7).

c) De werkelijke resultaten van de studie zijn als volgt:

- 47 jaar (0 aardbevingen)

- 31 jaar (1 aardbevingen)

- 13 jaar (2 aardbevingen)

- 5 jaar (3 aardbevingen)

- 2 jaar (4 aardbevingen)

-  0 jaar (5 aardbevingen)

- 1 jaar (6 aardbevingen)

- 1 jaar (7 aardbevingen)

Hoe zijn deze resultaten met die verkregen in subsectie B? Is Poisson's distributie een goede keuze om deze gebeurtenissen te modelleren?

Oplossing voor)

a) aardbevingen zijn gebeurtenissen waarvan de kans P Hij is klein en we overwegen een beperkte periode van een jaar. De gemiddelde aardbevingen zijn:

μ = 93/00 aardbevingen / jaar = 0.93 aardbevingen per jaar.

Oplossing B)

b) Om de gevraagde kansen te berekenen, worden waarden vervangen in de in het begin gegeven formule:

Bijvoorbeeld om te vinden P (2), wat de kans zou zijn dat er 2 grote aardbevingen per jaar zullen zijn:

y = 2

μ = 0.93

E = 2.71828

En dit is de kans dat er een jaar lang 7 grote aardbevingen zijn:

Het is veel minder dan p (2).

De resultaten worden hieronder vermeld:

P (0) = 0.395, P (1) = 0.367, P (2) = 0.171, P (3) = 0.0529, P (4) = 0.0123, P (5) = 0.00229, P (6) = 0.000355, P (7) = 0.0000471.

We zouden bijvoorbeeld kunnen zeggen dat er een kans is op 39.5 % dat er geen grote aardbeving voorkomt in een bepaald jaar. Of dat er 5,29 % zijn dat er in dat jaar 3 grote aardbevingen plaatsvinden.

Oplossing c)

c) De frequenties worden geanalyseerd, met n = 100 jaar vermenigvuldigen:

39.5; 36.7; 17.1; 5.29; 1.23; 0.229; 0.0355 en 0.00471.

Kan u van dienst zijn: algebraïsche derivaten

Bijvoorbeeld:

- Een frequentie van 39.5 geeft aan dat, in 39.5 van de 100 jaar oud of grote aardbevingen komen voor, we zouden kunnen zeggen dat het vrij dicht bij het echte 47 -jarige resultaat is zonder een grote aardbeving.

Laten we een ander Poisson -resultaat vergelijken met echte resultaten:

- De waarde verkregen van 36.7 betekent dat er in een periode van 37 jaar 1 geweldige aardbeving is. Het echte resultaat is dat er in 31 jaar 1 geweldige aardbeving was, een goed toeval met het model.

- 17 worden verwacht.1 jaar met 2 grote aardbevingen en het is bekend dat er in 13 jaar een nauwe waarde is, er in feite 2 grote aardbevingen waren.

Daarom is het Poisson -model acceptabel voor deze zaak.

Oefening 2

Een bedrijf schat dat het aantal componenten dat mislukt is voordat 100 uur werking wordt voltooid, volgt op een Poisson -distributie. Als het gemiddelde aantal storingen op dat moment 8 is, zoek dan de volgende waarschijnlijkheden:

a) dat een component in 25 uur faalt.

b) Falen minder dan twee componenten, in 50 uur.

c) dat ten minste drie componenten in 125 uur falen.

Oplossing voor)

a) Het is bekend dat de gemiddelde fout in 100 uur 8 is, daarom wordt het vierde deel van de mislukkingen in 25 uur verwacht, dat wil zeggen 2 mislukkingen. Dit is de parameter μ.

De waarschijnlijkheid van het falen van 1 component wordt gevraagd, de willekeurige variabele is "componenten die vóór 25 uur falen" en de waarde ervan is y = 1. Door de waarschijnlijkheidsfunctie te vervangen:

 b) Nu is de willekeurige variabele "componenten die vóór 50 uur falen". De parameter is μ = 4, Omdat de verwachte waarde van storingen in 50 uur 4 is.

De vraag is echter de kans dat minder dan twee componenten in 50 uur falen, niet dat precies 2 componenten in 50 uur falen, daarom moeten we de waarschijnlijkheden toevoegen die:

-Geen faalt

-Faal alleen 1

P (minder dan 2 componenten) = P (0) + P (1)

P (minder dan 2 componenten) = 0.0183+0.0732 = 0.0915

c) dat ten minste 3 componenten falen in 125, dit betekent dat 3, 4, 5 of meer op dat moment kan mislukken.

De waarschijnlijkheid die ten minste een van de verschillende gebeurtenissen optreedt, is gelijk aan 1, behalve de kans dat geen van de gebeurtenissen zal gebeuren.

-Het gevraagde evenement is om in 125 uur 3 of meer componenten te mislukken

-Dat het evenement niet gebeurt, betekent dat minder dan 3 componenten falen, wiens kans is: P (0)+P (1)+P (2)

De μ -parameter van de verdeling in dit geval is:

 μ = 8 + 2 = 10 storingen in 125 uur.

P (gevallen 3 of meer componenten) = 1- P (0)- P (1)- P (2) =

= 1-0.0026786 = 0.9972

Referenties

  1. MathWorks. Poisson -verdeling. Hersteld van: is.MathWorks.com
  2. Mendenhall, W. 1981. Statistieken voor administratie en economie. 3e. editie. Iberoamerica redactionele groep.
  3. Stat Trek. Leer jezelf statistieken. Poisson -verdeling. Hersteld van: stattrek.com,
  4. Triola, m. 2012. Elementaire statistieken. 11e. ED. Pearson Education.
  5. Wikipedia. Poisson -verdeling. Opgehaald uit: in.Wikipedia.borg