Raspodjele podataka Raspodjele podataka za diskretna obilježja

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Napisala Borka Jadrijević
Advertisements

Pritisak vazduha Vazduh je smeša gasova koja sadrži 80% azota, 18% kiseonika i 2% ugljen dioksida, drugih gasova i vodene pare. vazdušni (atmosferski)
7 SILA TRENJA.
Laboratorijske vježbe iz Osnova Elektrotehnike 1 -Jednosmjerne struje-
7. TEORIJSKE DISTRIBUCIJE
MELITA MESARIĆ UČITELJICA MATEMATIKE Osnovna škola Svibovec
Ass. Alma Zildžić MAKROEKONOMIJA Poglavlje 9 „INFLACIJA, PRIVREDNA AKTIVNOST I NOMINALNI RAST NOVCA“ Ass. Alma Zildžić
PTP – Vježba za 2. kolokvij Odabir vrste i redoslijeda operacija
INDINŽ Z – Vježba 2 Odabir vrste i redoslijeda operacija
BROJ π Izradio: Tomislav Svalina, 7. razred, šk. god /2016.
NASLOV TEME: OPTICKE OSOBINE KRIVIH DRUGOG REDA
Čvrstih tela i tečnosti
Generator naizmenične struje
Toplotno sirenje cvrstih tela i tecnosti
RAD I SNAGA ELEKTRIČNE STRUJE
POLINOMI :-) III℠, X Силвија Мијатовић.
VREMENSKI ODZIVI SISTEMA
Unutarnja energija i toplina
Obrada empirijskih podataka
Osnove statistike Kombinatorika i vjerojatnost
Vijetove formule. Rastavljanje kvadratnog trinoma na linearne činioce
JEDNOSTAVNA LINEARNA REGRESIJA
Vijetove formule. Rastavljanje kvadratnog trinoma na linearne činioce
JEDNAČINA PRAVE Begzada Kišić.
TEORIJSKE OSNOVE POGREŠKE POLOŽAJA BRODA
Elektronika 6. Proboj PN spoja.
Poslovne simulacije 4. Diskretne simulacije M. Zekić-Sušac, EFO.
FORMULE SUMIRANJE.
Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa
Normalna raspodela.
MAKROEKONOMIJA Poglavlje 6 „TRŽIŠTE RADA”
Strujanje i zakon održanja energije
PRIJELAZ TOPLINE Šibenik, 2015./2016..
Mjerenje Topline (Zadaci)
Osnove statistike Kombinatorika i vjerojatnost
Analiza uticaja zazora između elemenata na funkcionalni zazor (Z)
Zašto neka tijela plutaju na vodi, a neka potonu?
Izradila: Ana-Felicia Barbarić
SPLAJN Kubični.
Polarizacija Procesi nastajanja polarizirane svjetlosti: a) refleksija
Potenciranje i korjenovanje komleksnih brojeva
Kvarkovske zvijezde.
Antonia Veseli Marija Varga Ivana Šovagović
Booleova (logička) algebra
Brodska elektrotehnika i elektronika // auditorne vježbe
Mongeova projekcija - teorijski zadaci
6. OSNOVNI POJMOVI VJEROJATNOSTI
ERATOSTENOV EKSPERIMENT
Prisjetimo se... Koje fizikalne veličine opisuju svako gibanje?
Dan broja pi Ena Kuliš 1.e.
Paralelna, okomita i kosa nebeska sfera
8 Opisujemo val.
SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET RIJEKA Odabrana poglavlja inženjerske matematike   Usporedba varijanci dvaju osnovnih skupova PREDAVAČ:
POUZDANOST TEHNIČKIH SUSTAVA
8 GIBANJE I BRZINA Za tijelo kažemo da se giba ako mijenja svoj položaj u odnosu na neko drugo tijelo za koje smo odredili da miruje.
Ponovimo... Kada kažemo da se tijelo giba? Što je put, a što putanja?
Shema Oba tranzistora su obogaćenog tipa. Shema Oba tranzistora su obogaćenog tipa.
Unutarnja energija Matej Vugrinec 7.d.
Elastična sila Međudjelovanje i sila.
8 OPTIČKE LEĆE Šibenik, 2015./2016..
Osnove statistike Kombinatorika i vjerojatnost
KRITERIJI STABILNOSTI
Ivana Tvrdenić OŠ 22. lipnja SISAK.
KINEMATIKA KRUTOG TIJELA
Pi (π).
Balanced scorecard slide 1
DAN BROJA π.
Sila trenja Međudjelovanje i sila.
Tehnička kultura 8, M.Cvijetinović i S. Ljubović
OŠ ”Jelenje – Dražice” Valentina Mohorić, 8.b
Μεταγράφημα παρουσίασης:

Raspodjele podataka Raspodjele podataka za diskretna obilježja Raspodjele podataka za kontinuirana obilježja Teorijske raspodjele podataka

Raspodjele (diskretna obilježja) Hipergeometrijska (složene kombinacije) Binomna (Bernoulli-jev događaj) Poisson-ova (zakon rijetkih događaja, potok događaja)

Hipergeometrijska raspodjela proizlazi iz dvoslojnog skupa - složene kombinacije – skup od N elemenata sadrži podskup elemenata sa svojstvom A i podskup elemenata sa svojstvom Ā N M (A) N-M (Ā) SKUP n x el A (n-x) el Ā UZORAK

funkcija vjerojatnosti hipergeometrijske raspodjele: parametri: M, N i n - n – veličina uzorka očekivana vrijednost: varijanca:

utjecaj parametara na oblik hipergeometrijske raspodjele:

Binomna raspodjela A Ā p (1-p)=q broj N (elementi skupa) teži u beskonačnost – podvrsta hipergeometrijske Bernoulli-jev događaj – samo dva ishoda - vjerojatnost događaja se ne mijenja i iznosi p - vjerojatnost q=1-p - nezavisni pokušaji (slučajno uzorkovanje) - broj pokušaja (veličina uzorka), n A Ā UZORAK n - elemenata p (1-p)=q

funkcija vjerojatnosti binomne raspodjele B (n, p): parametri: n, p očekivana vrijednost (aritmetička sredina): varijanca: koeficijent asimetrije: distribucija će biti uvijek asimetrična ako nije p=q=0,5 koeficijent zaobljenosti:

utjecaj parametara n i p na oblik binomne raspodjele:

‘Galtonova’ daska – binomni eksperiment kuglicu spuštamo na čavliće koji su složeni u pravilnu trokutastu rešetku padom na čavlić kuglica može skrenuti na lijevo ili desno (berouli-jev događaj) daska je pravilna te su ishodi jednako vjerojatni p=0.5 n – broj redova čavlića Link

primjer ‘Galtonove’ daske sa n=4 reda čavlića: - slučajna varijabla poprima vrijednost: 0 - za jedan ishod 1 - za 4 ishoda 2 – za 6 ishoda 3 – za 4 ishoda 4 – za 1 ishod - općenito:

primjer 1. binomne raspodjele: Primjer: Svaki izuzeti uzorak vode ima vjerojatnost da je kontaminiran otpadnom tvari u iznosu od 10% . Pretpostavimo da se uzroci uzimaju nezavisno s obzirom na prisustvo otpadnih tvari. Potrebno je pronaći: Vjerojatnost da će u 18 izuzetih uzoraka biti točno 2 uzorka kontaminirana? vjerojatnost da će biti točno 2 kontaminirana uzorka Vjerojatnost da će od 18 uzoraka biti barem 4 kontaminirana?

- grafički prikaz (binomna raspodjela):

primjer 2. primjene binomne raspodjele: Primjer: Rad jednog automata kontrolira se uzorcima od 15 proizvoda. U svakom uzorku se ustanovljuje broj defektnih proizvoda. Budući da je uzeto 200 uzoraka, dobiveni rezultati su dani kroz tablicu. Potrebno je pronaći adekvatnu raspodjelu po kojoj se ponašaju podaci te vjerojatnost pojave ne više od 2 defektna u uzorku. x 1 2 3 4 5 6 fi 77 81 31 7 radi se o Binomnoj raspodjeli (n konačan): prilagodba

x px q(n-x) P(x) tablica vjerojatnosti za primjer 2. 1 0,389031 15 1 0,389031 15 0,061 0,414303 0,379087 0,768118 2 105 0,003721 0,441217 0,172386 0,940504 3 455 0,000227 0,46988 0,048528 0,989032 4 1365 1,38E-05 0,500405 0,009457 0,998489 5 3003 8,45E-07 0,532913 0,001352 0,999841 6 5005 5,15E-08 0,567532 0,000146 0,999987 7 6435 3,14E-09 0,6044 1,22E-05 0,999999 8 1,92E-10 0,643664 7,94E-07 9 1,17E-11 0,685478 4,01E-08 10 7,13E-13 0,730009 1,56E-09 11 4,35E-14 0,777432 4,62E-11 12 2,65E-15 0,827936 1E-12 13 1,62E-16 0,881721 1,5E-14 14 9,88E-18 0,939 1,39E-16 6,02E-19

Poisson-ova raspodjela proizlazi iz binomne r. uz određene uvjete: opisuje rijetke događaje (oni koji se javljaju s malom vjerojatnošću) potok događaja – vjerojatnost promatranog događaja u vremenskom periodu (valovi, naleti...) – odabir vremenskog perioda je bitan funkcija vjerojatnosti Poisson-ove raspodjele P(x): parametar: m=E(x) (u literaturi se spominje i λ = parametar m)

očekivana vrijednost: varijanca: koeficijent asimetrije: koeficijent zaobljenosti: rekurzivna formula za Poisson-ovu raspodjelu:

utjecaj parametra m na Poisson-ovu raspodjelu : nakon pokazuje se mod – da su dvije susjedne vrijednosti istih vjerojatnosti kada gubi se asimetričnost i Poisson-ova raspodjela teži simetričnoj

primjer 1. primjene Poisson-ove raspodjele: Primjer: U slučaju tanke bakrene žice, pretpostavlja se da broj pukotina slijedi zakon Poisson-ove raspodjele sa očekivanjem od 2.3 mikropukotine po milimetru. Potrebno je odrediti: vjerojatnost da se dogodi baš 2 mikropukotine po jednom milimetru žice. - varijabla x – broj mikropukotina po mm žice

Vjerojatnost da se pojavi barem jedna mikropukotina u 2 mm žice. - varijabla x – broj mikropukotina na 2mm žice

primjer 2. primjene Poisson-ove raspodjele: Primjer: Tijekom drugog svjetskog rata London je gađan projektilima V1. Britance je zanimalo kako iz podataka o padanju projektila zaključiti da li je riječ o gađanju nasumce ili se cilja neka točka u Londonu. - London je podijeljen na 576 sektora - U vremenskom periodu promatranja palo je 537 projektila Poisson mean for x = 0,928819 Poisson Contribution x Observed Probability Expected Chi-Sq 0 229 0,395020 226,74 0,009479 1 211 0,366902 211,39 0,000533 2 93 0,170393 98,54 0,269846 3 35 0,052755 30,62 0,700380 4 7 0,014931 7,14 0,041860 5 (6,7..) 1 1,57 TEST: N N* DF Chi-Sq P-Value 576 0 3 1,02210 0,796 podaci se ponašaju po Poisson-ovoj razdiobi! zaključak - V1 nije imao navođenje

Raspodjele (kontinuirana obilježja) Normalna Jedinična normalna Lognormalna Weibullova

Normalna raspodjela prvi definirao Abraham de Moivre upotrijebio Gauss (Gauss-ova raspodjela) najčešće korištena raspodjela – čak 33% procesa u prirodi slijedi zakon normalne raspodjele funkcija gustoće vjerojatnosti f(x) – zbog kontinuiranog obilježja nastanak normalne r. - binomni poučak (razvijanje binoma u red , A. de Moivre) binomna r. funkcija gustoće vjerojatnosti normalne r.

funkcija gustoće vjerojatnosti normalne raspodjele f(x): parametri: μ i σ2(x) očekivana vrijednost: E(x)= μ varijanca: σ2(x) koeficijent asimetrije: α3= 0 - simetrična razdioba koeficijent zaobljenosti: α4= 3 (α’4= 0) – normalno zaobljena svojstva funkcije gustoće vjerojatnosti f(x):

veza funkcije gustoće vjerojatnosti f(x) i funkcija distribucije F(x) normalne raspodjele:

vjerojatnosti ispod normalne raspodjele N{μ, σ2}: utjecaj parametara μ i σ2 na oblik normalne raspodjele:

Jedinična normalna raspodjela N{0,1} standardizirana normalna raspodjela sa parametrima μ=0 i σ2=1 sve druge normalne raspodjele svodimo (z-transformacija) na jediničnu normalnu raspodjelu bilo koja vrijednost u x domeni se može prikazati kao μ ± k·σ transformacija:

funkcija gustoće vjerojatnosti jedinične normalne raspodjele f(z): upotrebom jedinične normalne razdiobe standardiziramo odstupanja preko parametra z: |z|=1 → P(z)=0,6827 |z|=1,96 → P(z)=0,9500 |z|=2,0 → P(z)=0,9545 |z|=3 → P(z)=0,9973 područje ±3σ koje se koristi u konstrukcijama naziva se tolerancija danas procesi u području ±3σ više nisu dovoljno dobri pa se prelazi na sustav od ±6σ područje od ±6σ ima vjerojatnost pojave od 99,9999998 %

ostale vjerojatnosti kod normalne razdiobe:

primjer 1. primjene normalne raspodjele: Primjer: Pretpostavimo da se izmjerena jakost struje u vodiču pokorava zakonu normalne raspodjele sa očekivanjem μ=10 mA i varijancom σ2=4 mA2. Kolika je vjerojatnost da će jakost struje premašiti 13 mA? transformacija

Lognormalna raspodjela raspodjela koja dobro opisuje slučajeve: duljina trajanja proizvodnje, plaće zaposlenika... slučaj kada je logaritam varijable x ( ln(x) ) normalno distribuiran vjerojatnosti pojave varijable x se dobivaju transformacijom varijable y sa naznakom da je ako y ima normalnu distribuciju sa očekivanjem α i varijancom β2 tada možemo napisati x=ey što je lognormalna varijabla sa funkcijom gustoće vjerojatnosti: parametri: α i β2

utjecaj parametara na oblik lognormalne raspodjele:

primjer primjene lognormalne raspodjele: Primjer: Životni vijek poluvodičkog lasera je lognormalno distribuiran sa očekivanjem od a=10 h i standardnom devijacijom b=1,5 h. Kolika je vjerojatnost da životni vijek premaši 10 000 sati?

Weibull-ova raspodjela definira vjekove trajanja tehničkih sustava – krivulja kade parametri ove raspodjele daju veliku fleksibilnost prilikom opisivanja različitih slučajeva kada broj otkaza raste sa vremenom (trošenje ležaja), ostaje konstantan ili pada s vremenom (neki poluvodiči) funkcija gustoće vjerojatnosti Weibull-ove raspodjele: parametri: α, β

utjecaj parametara na oblik Weibull-ove raspodjele:

krivulja kade (krivulja mortaliteta): I. period – ‘dječje bolesti’ – 1. raspodjela e-lt II. period – ‘normalne eksploatacije’, slučajni kvarovi – 2. raspodjela uniformna III. period – zbog ‘trošenja dijelova’, vremenski kvarovi – 3. raspodjela normalna

Teorijske raspodjele Studentova ‘t’ raspodjela c2 - raspodjela F - raspodjela

Studentova t-raspodjela definirao ju W. S. Gosset kao razdiobu varijable t proizašla iz raspodjele aritmetičkih sredina kada n raste približava se normalnoj razdiobi k=30

tablica Studentove ras tablica Studentove ras.- za određenu vrijednost površine (vjerojatnosti) i stupnja slobode daje vrijednosti parametra t Primjer: Za a=0,01 u uzorku veličine 10 elemenata (k=10-1=9 stupnjeva slobode) t=2,821 treba s oprezom primjenjivati tablice zbog različitog korištenja termina a – površina samo jednog ‘repa’ ili oba?!

c2 (hi-kvadrat) raspodjela varijance se ne pokoravaju normalnoj raspodjeli poseban slučaj G razdiobe definira raspodjelu varijable c2 varijabla c2 sa samo jednim parametrom k=n-1 → stupanj slobode - očekivana vrijednost

tablica c2 ras.- za određenu vrijednost površine (vjerojatnosti) i stupnja slobode daje vrijednosti parametra c2 kod čitanja vrijednosti c2P treba imati na umu da se to odnosi na ‘unutrašnju’ površinu. Primjer: Pronaći vrijednosti c2a/2 i c21-a/2 za vjerojatnost pogreške 5% i k=9. c2a/2= c20,025=2,70 c21-a/2= c20,975=19,02

F - raspodjela definirao G. Snedecor , R. Fisher to je raspodjela varijable F koja je definirana kao omjer procijenjenih varijanci raspodjela ima samo dva parametra: stupanj slobode brojnika kbrojnika stupanj slobode nazivnika knazivnika parametri: kbrojnika=n1-1; knazivnika=n2-1 - preduvjet: (s1>s2)

Primjer: Pronaći vrijednost varijable F za a=0.25, kb=9 i kn=11. Tablica F-raspodjele daje vrijednosti varijable F za vjerojatnost (površinu desnog repa), stupanj slobode brojnika i nazivnika. vrijednosti parametra F Primjer: Pronaći vrijednost varijable F za a=0.25, kb=9 i kn=11. F=1,53

Papir vjerojatnosti još jedna od grafičkih metoda analize podataka (iz uzorka) kontinuiranog obilježja utvrđuje se da li se podaci ponašaju po jednoj od promatranih raspodjela i koliko koji elementi odstupaju za svaku raspodjelu posebno konstruira se papir vjerojatnosti: papir vjerojatnosti normalne raspodjele (najčešće) papir vjerojatnosti Weibull-ove raspodjele papir vjerojatnosti lognormalne raspodjele ... uzima se funkcija distribucije određene raspodjele i promjenom mjerila dobiva se funkcija distribucije u obliku pravca (Henry-jev pravac)

konstruiranje papira vjerojatnosti normalne raspodjele m+s ~84% Henry-jev pravac se ucrtava tako da se odrede dvije čvrste točke: 1. točka : (x=m, y=50%) 2. točka : (x=m+s, y=84%)

primjena papira vjerojatnosti Primjer: Provjeriti da li se podaci iz uzorka rasipaju po normalnoj raspodjeli. promatranjem podataka može se utvrditi da li se podaci rasipaju po normalnoj raspodjeli. uzeta je raspodjela sa parametrima