Diskrétne rozdelenia pravdepodobnosti
Pre prácu s preddefinovanými rozdeleniami pravdepodobností je potrebné najskôr načítať knižnicu "distrib",čo realizujeme pomocou funkcie
`load()`kde ako argument uvedieme názov požadovanej knižnice. V našom prípade teda:
--> | load(distrib); |
Knižnica distrib obsahuje pre každé implementované rozdelenie množiny funkcií, potrebné pre pravdepodobnostné výpočty.
Volanie týchto funkcií sa skladá z dvoch častí. Prvú tvorí prefix, ktorý určuje druh požadovanej funkcie.
K dispozícii sú tieto prefixy:
pdf_ | funkcia hustoty |
cdf_ | distribučná funkcia |
quantile_ | kvantilová funkcia |
mean_ | stredná hodnota |
var_ | rozptyl |
std_ | smerodajná odchýlka |
skeweness_ | koeficient šikmosti |
kurtosis_ | koeficient špicatosti |
random_ | náhodná hodnota premennej |
Druhú časť názvu funkcie, ktorá nasleduje bezprostredne za prefixom, tvorí meno (identifikátor) rozdelenia. Vyberať môžeme z týchto diskrétnych rozdeleni:
binomial | binomické rozdelenie |
poisson | Poissonovo rozdelenie |
bernoulli | alternatívne (Bernoulliho) rozdelenie |
geometric | geometrické rozdelenie |
discrete_uniform | diskrétne rovnomerné rozdelenie |
hypergeometric | hypergeometrické rozdelenie |
negative_binomial | negatívne binomické rozdelenie |
1 Binomické rozdelenie
Binomické rozdelenie $\mathrm{Bi}(n,p)$ je rozdelenie s dvomi parametrami. Ich význam je možné interpretovať ako počet nezávislých opakovaní náhodného pokusu a pravdepodobnosť úspechu (výskytu sledovanej udalosti) v každom jednotlivom pokuse.
Ak je pravdepodobnosť výskytu sledovanej udalosti rovná $p$, pokus opakujeme $n$-krát, tak pravdepodobnosť, že sa sledovaná udalosť v tejto sérii vyskytne $x$-krát je hodnotou pravdepodobnostnej funkcie
pdf_binomial(x,n,p).
Príklad
Aká je pravdepodobnosť, že pri 10 nezávislých hodoch kockou padne:
a) číslo 6 práve 2-krát
b) párne číslo 5-krát
c) číslo väčšie ako 4 nanajvýš 4-krát
Riešenie
V úlohe a) je $p=\frac{1}{6}$ a počet opakovaní je $n=10$, takže:
--> | pdf_binomial(2,10,1/6); |
Ak chceme výsledok vyjadriť v podobe desatinného čísla, použijeme funkciu float(). Ak bola hodnota funkcie pdf_binomial(2,10,1/6) naším posledným výpočtom,
môžeme funkciu float() aplikovať v podobe float(%), nakoľko symbol % reprezentuje posledný výsledok.
--> | float(pdf_binomial(2,10,1/6)); |
V úlohe b) dochádza len ku zmene honoty p z 1/6 na 1/2. Výsledok teda dostaneme ako
--> | float(pdf_binomial(5,10,1/2)); |
V úlohe c) taktiež dochádza ku zmene parametra p, ktorý bude mať hodnotu 1/3. Požadovaný výsledok však môžeme získať dvomi spôsobmi.
Jednak ako súčet viacerých hodnôt pravdepodobnostnej funkcie:
--> | float(sum(pdf_binomial(i,10,1/3),i,0,4)); |
Inou možnosťou je využiť distribučnú funkciu a jej pravdepodobnostný význam.
--> | float(cdf_binomial(4,10,1/3)); |
Pre grafické zobrazenie pravdepodobnostnej funkcie si najskôr príkazom makelist vytvoríme zoznam jej funkčných hodnôt
a potom tieto diskrétne honoty zobrazíme pomocou plot2d() (v samostatnom okne gnuplotu) alebo pomocou wxplot2d()
--> | y:makelist(pdf_binomial(k,20,1/2),k,0,20); |
--> | wxplot2d([discrete,y],[style,points]); |
--> | z:makelist(cdf_binomial(k,20,1/2),k,0,20)$ |
--> | wxplot2d([discrete,z],[style,points]); |
2 Geometrické rozdelenie
Geometrické rozdelenie $\mathrm{Ge}(p)$ je jednoparametrickým rozdelením, kde význam jeho parametra je pravdepodobnosť úspechu (výskytu sledovanej udalosti)
v náhodnom pokuse. Geometrické rozdelenie potom udáva pravdepodobnosť, že prvý úspech sa dostaví v $x$-tom pokuse.
Príklad
Určte pravdepodobnosť, že pri opakovaných hodoch kockou sa prvá šeťka vyskytne v desiatom pokuse.
--> | float(pdf_geometric(10,1/6)); |
Zostrojte graf pravdepodobnostnej a distribučnej funkcie geometrického rozdelenia.
--> | y:makelist(pdf_geometric(k,1/2),k,0,20)$ |
--> | wxplot2d([discrete,y],[style,points]); |
--> | z:makelist(cdf_geometric(k,1/2),k,0,20)$ |
--> | wxplot2d([discrete,z],[style,points]); |
3 Negatívne binomické rozdelenie
Negatívne binomické rozdelenie $\mathrm{NegBin}(m,p)$ je zovšeobecnenín geometrického rozdelenia. Opäť sledujeme výskyt náhodnej udalosti $A$, ktorá nastáva s pravdepodobnosťou $p$.
Na rozdiel od geometrického rozdelenia nás však nezaujíma prvý, ale $m$-tý výskyt sledovanej udalosti. Je teda $\mathrm{Ge}(p)=\mathrm{NegBin}(1,p)$.
Príklad
Je potrebné vyrobiť 5 dobrých výrobkov, pričom pravdepodobnosť vyrobenia nepodarku je 0,005.
a) Aká je pravdepodobnosť, že bude potrebné vyrobiť 8 výrobkov.
b) Určte strednú hodnotu a rozptyl počtu nepodarkov, vyrobených pri výrobe 5 dobrých výrobkov.
Riešenie
a) V tomto prípade je potrebné celkovo vyrobiť 8 výrobkov. Z toho 3 musia byť chybné, aby sa v ôsmom pokuse podarilo vyrobiť piaty dobrý výrobok.
Preto použijeme pravdepodobnostnú funkciu negatívneho binomického rozdelenia s parametrami $p=0.995$ (pravdepodobnosť vyrobenia dobrého ýrobku),
$m=5$ (nastane po piaty krát) a funkčnú hodnotu pre $x=3$ (počet neúspešných pokusov, ktoré predchádzajú výsledku).
--> | float(pdf_negative_binomial(3,5,0.995)); |
b) na základe predchádzajúceho určíme strednú hodnotu a rozptyl rozdelenia $\mathrm{NegBin}(5,0.995)$
--> | float(mean_negative_binomial(5,0.995)); |
--> | float(var_negative_binomial(5,0.995)); |
4 Hypergeometrické rozdelenie
Hypergeometrické rozdelenie $\mathrm{Hg}(N,k,n)$, je rozdelenie, ktoré je závislé na troch parametroch. Svojou povahou zodpovedá závislým opakovaniam
náhodného pokusu, ktoré môžeme reprezentovať výberom prvkov zo súboru bez vrátenia (na rozdiel od binomického rozdelenia,
kedy ide o výber zo súboru s vrátením). Význam parametrov je teda nasledovný:
$N$ je celkový počet prvkov súboru, z ktorého vyberáme
$k$ je počet prvkov v základnom súbore, ktoré majú určitý znak,
$n$ počet vybratých prvkov z daného súboru (počet opakovaní pokusu)
Náhodná premenná $X$, ktorá sa riadi rozdelením $\mathrm{Hg}(N,k,n)$ nadobúda hodnoty $x$, ktoré určujú počet prvkov z danou vlastnosťou vo výbere s rozsahom $n$.
Zrejme je $0 \leq x \leq \min(k,n)$. Dolnú hranicu je možné spresniť na $\max(0,n+k-N)$, nakoľko výber môže mať tak veľký rozsah, že nutne obsiahne
aj niektoré prvky s danou vlastnosťou.
Príklad
Pri stávkach jednej lotérie sa tipuje 6 čísiel zo 49, pri druhej lotérii 5 čísiel z 35. Pri žrebovaní sa náhodne vyberie 6 čísiel zo 49 resp. 5 čísiel z 35.
Prvá cena sa vyhráva, ak je natipovaných všetkých 6 resp. všetkých 5 vyžrebovaných čísel. V prvej lotérii sú ďalšie výhry pri zhode 5, 4 alebo 3 čísiel.
V druhej lotérii sú ďalšie poradia výhier pri zhode 4 alebo 3 čísiel. Určte:
a) pravdepodobnosť výhry prvej ceny u obidvoch lotérií,
b) pravdepodobnosť nejakej výhry u oboch lotérií,
c) strednú hodnotu a rozptyl počtu uhádnutých čísiel u obidvoch lotérií.
Riešenie
Výbery čísiel sú vykonávané bez vrátenia, ide teda o závislé opakovania.Počet výherných čísiel na jednom tikete sa teda riadi
hypergeometrickým rozdelením. V prvom prípade je $N=49$, $k=6$, v druhom prípade je $N=35$ a $k=5$.
a) Ak chceme vyhrať prvú cenu, musí byť aj $n=6$ resp. $n=5$.
Pozor, pravdepodobnostná funkcia je v maxime implementovaná takto:pdf_hypergeometric(x,n1,n2,n), kde n1 je počet prvkov, ktoré majú danú vlastnosť,
n2 je počet prvkov, ktoré túto vlastnosť nemajú a n je rozsah výberu.
--> | float(pdf_hypergeometric(6,6,43,6)); |
--> | float(pdf_hypergeometric(5,5,30,5)); |
V prípade b) musíme sčítať viacero hodnôt pravdepodobnostnej funkcie pre možné výhry.
--> | float(sum(pdf_hypergeometric(i,6,43,6),i,3,6)); |
--> | float(sum(pdf_hypergeometric(i,5,30,5),i,3,5)); |
Pre určenie strednej hodnoty a rozptylu použijeme prefixy mean_ a var_
--> | float(mean_hypergeometric(6,43,6)); |
--> | float(mean_hypergeometric(5,30,5)); |
--> | float(var_hypergeometric(6,43,6)); |
--> | float(var_hypergeometric(5,30,5)); |
5 Poissonovo rozdelenie
Poissonovo rozdelenie sa využíva na modelovanie náhodných pokusov, pri ktorých sledujeme počet výskytov danej udalosti v danom časovom
intervale alebo v danej oblasti. Ide o jednoparametrické rozdelenie $\mathrm{Po}(\lambda)$, kde význam parametra $\lambda$ možno interpretovať ako strednú hodnotu
výskytov sledovanej udalosti počas časovej jednotky.
Poissonovo rozdelenie je súčasne limitným rozdelením pre binomické rozdelenie, ak $n \to \infty$ a $p \to 0$, pričom $n \cdot p= \lambda$.
Náhodná premenná $X$, nadobúdajúca nezáporné celočíselné hodnoty $x=0,1,2,\dots$ sa riadi Poissonovým rozdelením $\mathrm{Po}(\lambda)$, pre konečné $\lambda \gt 0$ ak jej pravdepodobnostná funkcia má tvar $$ p(x) = \frac{\lambda^x}{x!} \mathrm{e}^x. $$
Príklad
Predpokladajme, že v každých 500 metroch vyrobenej látky je priemerne 10 kazov. Látku striháme
v dvojmetrových kusoch. Koľko percent dvojmetrových kusov bude bez kazu?
Riešenie
Na 500 metrov látky pripadá 10 kazov, takže stredná hodnota výskytu kazu v dvojmetrovom kuse látky je $\lambda=\frac{2}{500}\cdot 10= 0,04$.
Hľadáme teda hodnotu pravdepodobnostnej funkcie Poissonovho rozdelenia $\mathrm{Po}(0,04)$ v bode 0.
--> | float(pdf_poisson(0,0.04)); |