Diskrétne rozdelenia pravdepodobnosti

Pre prácu s preddefinovanými rozdeleniami pravdepodobností je potrebné najskôr načítať knižnicu "distrib",čo realizujeme pomocou funkcie

`load()`

kde ako argument uvedieme názov požadovanej knižnice. V našom prípade teda:

--> load(distrib);

Knižnica distrib obsahuje pre každé implementované rozdelenie množiny funkcií, potrebné pre pravdepodobnostné výpočty. Volanie týchto funkcií sa skladá z dvoch častí. Prvú tvorí prefix, ktorý určuje druh požadovanej funkcie. K dispozícii sú tieto prefixy:

pdf_ funkcia hustoty
cdf_ distribučná funkcia
quantile_ kvantilová funkcia
mean_ stredná hodnota
var_ rozptyl
std_ smerodajná odchýlka
skeweness_ koeficient šikmosti
kurtosis_ koeficient špicatosti
random_ náhodná hodnota premennej

Druhú časť názvu funkcie, ktorá nasleduje bezprostredne za prefixom, tvorí meno (identifikátor) rozdelenia. Vyberať môžeme z týchto diskrétnych rozdeleni:


binomial binomické rozdelenie
poisson Poissonovo rozdelenie
bernoulli alternatívne (Bernoulliho) rozdelenie
geometric geometrické rozdelenie
discrete_uniform diskrétne rovnomerné rozdelenie
hypergeometric hypergeometrické rozdelenie
negative_binomial negatívne binomické rozdelenie

1 Binomické rozdelenie

Binomické rozdelenie $\mathrm{Bi}(n,p)$ je rozdelenie s dvomi parametrami. Ich význam je možné interpretovať ako počet nezávislých opakovaní náhodného pokusu  a pravdepodobnosť úspechu (výskytu sledovanej udalosti) v každom jednotlivom pokuse.


Ak je pravdepodobnosť výskytu sledovanej udalosti rovná $p$, pokus opakujeme $n$-krát, tak pravdepodobnosť, že sa sledovaná udalosť v tejto sérii vyskytne $x$-krát je hodnotou pravdepodobnostnej funkcie

pdf_binomial(x,n,p).

Príklad
Aká je pravdepodobnosť, že pri 10 nezávislých hodoch kockou padne:
a) číslo 6 práve 2-krát
b) párne číslo 5-krát
c) číslo väčšie ako 4 nanajvýš 4-krát

Riešenie
V úlohe a) je $p=\frac{1}{6}$ a počet opakovaní je $n=10$, takže:

--> pdf_binomial(2,10,1/6);

Ak chceme výsledok vyjadriť v podobe desatinného čísla, použijeme funkciu float(). Ak bola hodnota funkcie pdf_binomial(2,10,1/6) naším posledným výpočtom,
môžeme funkciu float() aplikovať v podobe float(%), nakoľko symbol % reprezentuje posledný výsledok.

--> float(pdf_binomial(2,10,1/6));

V úlohe b) dochádza len ku zmene honoty p z 1/6 na 1/2. Výsledok teda dostaneme ako

--> float(pdf_binomial(5,10,1/2));

V úlohe c) taktiež dochádza ku zmene parametra p, ktorý bude mať hodnotu 1/3. Požadovaný výsledok však môžeme získať dvomi spôsobmi.
Jednak ako súčet viacerých hodnôt pravdepodobnostnej funkcie:

--> float(sum(pdf_binomial(i,10,1/3),i,0,4));

Inou možnosťou je využiť distribučnú funkciu a jej pravdepodobnostný význam.

--> float(cdf_binomial(4,10,1/3));

Pre grafické zobrazenie pravdepodobnostnej funkcie si najskôr príkazom makelist vytvoríme zoznam jej funkčných hodnôt
a potom tieto diskrétne honoty zobrazíme pomocou plot2d() (v samostatnom okne gnuplotu) alebo pomocou wxplot2d()

--> y:makelist(pdf_binomial(k,20,1/2),k,0,20);

--> wxplot2d([discrete,y],[style,points]);

--> z:makelist(cdf_binomial(k,20,1/2),k,0,20)$

--> wxplot2d([discrete,z],[style,points]);

2 Geometrické rozdelenie

Geometrické rozdelenie $\mathrm{Ge}(p)$ je jednoparametrickým rozdelením, kde význam jeho parametra je pravdepodobnosť úspechu (výskytu sledovanej udalosti) v náhodnom pokuse. Geometrické rozdelenie potom udáva pravdepodobnosť, že prvý úspech sa dostaví v $x$-tom pokuse.

Príklad
Určte pravdepodobnosť, že pri opakovaných hodoch kockou sa prvá šeťka vyskytne v desiatom pokuse.

--> float(pdf_geometric(10,1/6));

Zostrojte graf pravdepodobnostnej a distribučnej funkcie geometrického rozdelenia.

--> y:makelist(pdf_geometric(k,1/2),k,0,20)$

--> wxplot2d([discrete,y],[style,points]);

--> z:makelist(cdf_geometric(k,1/2),k,0,20)$

--> wxplot2d([discrete,z],[style,points]);

3 Negatívne binomické rozdelenie

Negatívne binomické rozdelenie $\mathrm{NegBin}(m,p)$ je zovšeobecnenín geometrického rozdelenia. Opäť sledujeme výskyt náhodnej udalosti $A$, ktorá nastáva s pravdepodobnosťou $p$.
Na rozdiel od geometrického rozdelenia nás však nezaujíma prvý, ale $m$-tý výskyt sledovanej udalosti. Je teda $\mathrm{Ge}(p)=\mathrm{NegBin}(1,p)$.

Príklad
Je potrebné vyrobiť 5 dobrých výrobkov, pričom pravdepodobnosť vyrobenia nepodarku je 0,005.
a) Aká je pravdepodobnosť, že bude potrebné vyrobiť 8 výrobkov.
b) Určte strednú hodnotu a rozptyl počtu nepodarkov, vyrobených pri výrobe 5 dobrých výrobkov.

Riešenie
a) V tomto prípade je potrebné celkovo vyrobiť 8 výrobkov. Z toho 3 musia byť chybné, aby sa v ôsmom pokuse podarilo vyrobiť piaty dobrý výrobok. Preto použijeme pravdepodobnostnú funkciu negatívneho binomického rozdelenia s parametrami $p=0.995$ (pravdepodobnosť vyrobenia dobrého ýrobku), $m=5$ (nastane po piaty krát) a funkčnú hodnotu pre $x=3$ (počet neúspešných pokusov, ktoré predchádzajú výsledku).

--> float(pdf_negative_binomial(3,5,0.995));

b) na základe predchádzajúceho určíme strednú hodnotu a rozptyl rozdelenia $\mathrm{NegBin}(5,0.995)$

--> float(mean_negative_binomial(5,0.995));

--> float(var_negative_binomial(5,0.995));

4 Hypergeometrické rozdelenie

Hypergeometrické rozdelenie $\mathrm{Hg}(N,k,n)$, je rozdelenie, ktoré je závislé na troch parametroch. Svojou povahou zodpovedá závislým opakovaniam náhodného pokusu, ktoré môžeme reprezentovať výberom prvkov zo súboru bez vrátenia (na rozdiel od binomického rozdelenia, kedy ide o výber zo súboru s vrátením). Význam parametrov je teda nasledovný:

$N$ je celkový počet prvkov súboru, z ktorého vyberáme
$k$ je počet prvkov v základnom súbore, ktoré majú určitý znak,
$n$ počet vybratých prvkov z daného súboru (počet opakovaní pokusu)

Náhodná premenná $X$, ktorá sa riadi rozdelením $\mathrm{Hg}(N,k,n)$ nadobúda hodnoty $x$, ktoré určujú počet prvkov z danou vlastnosťou vo výbere s rozsahom $n$.
Zrejme je $0 \leq x \leq \min(k,n)$. Dolnú hranicu je možné spresniť na $\max(0,n+k-N)$, nakoľko výber môže mať tak veľký rozsah, že nutne obsiahne aj niektoré prvky s danou vlastnosťou.

Príklad
Pri stávkach jednej lotérie sa tipuje 6 čísiel zo 49, pri druhej lotérii 5 čísiel z 35. Pri žrebovaní sa náhodne vyberie 6 čísiel zo 49 resp. 5 čísiel z 35. Prvá cena sa vyhráva, ak je natipovaných všetkých 6 resp. všetkých 5 vyžrebovaných čísel. V prvej lotérii sú ďalšie výhry pri zhode 5, 4 alebo 3 čísiel. V druhej lotérii sú ďalšie poradia výhier pri zhode 4 alebo 3 čísiel. Určte:
a) pravdepodobnosť výhry prvej ceny u obidvoch lotérií,
b) pravdepodobnosť nejakej výhry u oboch lotérií,
c) strednú hodnotu a rozptyl počtu uhádnutých čísiel u obidvoch lotérií.

Riešenie
Výbery čísiel sú vykonávané bez vrátenia, ide teda o závislé opakovania.Počet výherných čísiel na jednom tikete sa teda riadi hypergeometrickým rozdelením. V prvom prípade je $N=49$, $k=6$, v druhom prípade je $N=35$ a $k=5$.
a) Ak chceme vyhrať prvú cenu, musí byť aj $n=6$ resp. $n=5$.
Pozor, pravdepodobnostná funkcia je v maxime implementovaná takto:pdf_hypergeometric(x,n1,n2,n), kde n1 je počet prvkov, ktoré majú danú vlastnosť, n2 je počet prvkov, ktoré túto vlastnosť nemajú a n je rozsah výberu.

--> float(pdf_hypergeometric(6,6,43,6));

--> float(pdf_hypergeometric(5,5,30,5));

V prípade b) musíme sčítať viacero hodnôt pravdepodobnostnej funkcie pre možné výhry.

--> float(sum(pdf_hypergeometric(i,6,43,6),i,3,6));

--> float(sum(pdf_hypergeometric(i,5,30,5),i,3,5));

Pre určenie strednej hodnoty a rozptylu použijeme prefixy mean_ a var_

--> float(mean_hypergeometric(6,43,6));

--> float(mean_hypergeometric(5,30,5));

--> float(var_hypergeometric(6,43,6));

--> float(var_hypergeometric(5,30,5));

5 Poissonovo rozdelenie

Poissonovo rozdelenie sa využíva na modelovanie náhodných pokusov, pri ktorých sledujeme počet výskytov danej udalosti v danom časovom intervale alebo v danej oblasti. Ide o jednoparametrické rozdelenie $\mathrm{Po}(\lambda)$, kde význam parametra $\lambda$ možno interpretovať ako strednú hodnotu výskytov sledovanej udalosti počas časovej jednotky.
Poissonovo rozdelenie je súčasne limitným rozdelením pre binomické rozdelenie, ak $n \to \infty$ a $p \to 0$, pričom $n \cdot p= \lambda$.

Náhodná premenná $X$, nadobúdajúca nezáporné celočíselné hodnoty $x=0,1,2,\dots$ sa riadi Poissonovým rozdelením $\mathrm{Po}(\lambda)$, pre konečné $\lambda \gt 0$ ak jej pravdepodobnostná funkcia má tvar $$ p(x) = \frac{\lambda^x}{x!} \mathrm{e}^x. $$

Príklad
Predpokladajme, že v každých 500 metroch vyrobenej látky je priemerne 10 kazov. Látku striháme v dvojmetrových kusoch. Koľko percent dvojmetrových kusov bude bez kazu?

Riešenie
Na 500 metrov látky pripadá 10 kazov, takže stredná hodnota výskytu kazu v dvojmetrovom kuse látky je $\lambda=\frac{2}{500}\cdot 10= 0,04$. Hľadáme teda hodnotu pravdepodobnostnej funkcie Poissonovho rozdelenia $\mathrm{Po}(0,04)$ v bode 0.

--> float(pdf_poisson(0,0.04));


Created with wxMaxima.