JEDNOSTAVNA LINEARNA REGRESIJA
KAKO DOHODAK UTJEČE NA POTROŠNJU? X Y
KAKO CIJENE UTJEČE NA PRODANU KOLIČINU? X Y
KAKO BROJ NEZAPOSLENIH UTJEČE NA BROJ DJECE U VRTIĆIMA? X Y
𝑦 = 𝛽 0 + 𝛽 1 𝑥 Regresijska vrijednost zavisne varijable 𝑦 = 𝛽 0 + 𝛽 1 𝑥 Regresijska vrijednost zavisne varijable Vrijednost nezavisne varijable Konstantni član Regresijski koeficijent/ Koeficijent smjera
1. ZADATAK Analizira se odnos ukupnog broja Internet transakcija ZABA-e (X) i ostvarenog ukupnog prihoda (Y, u €). Podaci su mjesečni i to za prvih jedanaest mjeseci 1993. godine. U analizi se primjenjuje model jednostavne linearne regresije. Međurezultati: 𝑥 = 2122,73 𝑦𝑖 = 114110 𝑥𝑖 2 = 75076128 (𝑥𝑖 − 𝑥 )(𝑦𝑖− 𝑦 )=71745580, 91 (𝑦𝑖 − 𝑦 ) 2 = 217456054,55
Kako glasi jednadžba regresijskog modela s procijenjenim parametrima Kako glasi jednadžba regresijskog modela s procijenjenim parametrima. Parametre je potrebno procijeniti metodom najmanjih kvadrata. Protumačite značenje regresijskog koeficijenta. 𝑦 = 𝛽 0 + 𝛽 1 𝑥 𝛽 1 = 𝑥 𝑖 − 𝑥 𝑦 𝑖 − 𝑦 𝑥 𝑖 − 𝑥 2 = 𝑥 𝑖 𝑦 𝑖 −𝑛 𝑥 𝑦 𝑥𝑖 2 −𝑛 𝑥 2 𝛽 0 = 𝑦 − 𝛽 1 𝑥 𝑦 = 𝑦 𝑖 𝑛 = 114110 11 =10 373,6364 𝛽 1 = 71745580,91 75076128−11∗ 2122,73 2 =2,8124 𝛽 0 =10 373,6364−2,8124∗2122,73 =4403,6705 Ukoliko se broj Internet transakcija poveća za jednu transakciju, regresijeska vrijednost ukupno ostvarenog prihoda povećat će se u prosjeku za 2,8124€
Odredite sve elemente u tabeli analize varijance Odredite sve elemente u tabeli analize varijance. Izračunajte procjenu varijance, standardne devijacije i koeficijenta varijacije. Koliko iznose koeficijent determinacije i koeficijent linearne korelacije? Proporcija neprotumačenog dijela ukupne sume kvadrata iznosi 0,0721.
IZVOR VARIJACIJE STUPNJEVI SLOBODE ZBROJ KVADRATA SREDINA KVADRATA EMPIRIJSKI F-omjer Protumačen modelom Neprotumačen modelom 1 n-2 SP SR SP 1 SR n−2 SP 1 SR n−2 - UKUPNO n-1 ST 𝑥 = 2122,73 𝑦𝑖 = 114110 𝑥𝑖 2 = 75076128 (𝑥𝑖 − 𝑥 )(𝑦𝑖− 𝑦 )=71745580, 91 (𝑦𝑖 − 𝑦 ) 2 = 217456054,55 201777473 201777473 115,8266 1742064,614 9 15678581,53 10 217456054,55 ST= 𝑦 𝑖 − 𝑦 2 𝑆𝑇=217456054,55 𝑆𝑅 𝑆𝑇 SP= 𝑦 𝑖 − 𝑦 2 = 0,0721 SR= 𝑦 𝑖 − 𝑦 𝑖 2 𝑆𝑅=0,0721∗217456054,55=15678581,53 𝑆𝑃=𝑆𝑇−𝑆𝑅 =217456054,55−15678581,53=201777473
IZVOR VARIJACIJE STUPNJEVI SLOBODE ZBROJ KVADRATA SREDINA KVADRATA EMPIRIJSKI F-omjer Protumačen modelom Neprotumačen modelom 1 n-2 SP SR SP 1 SR n−2 SP 1 SR n−2 - UKUPNO n-1 ST 201843473 201843473 115,8645 1742064,614 9 15678581,53 10 217456054,55 𝜎 2 = 𝑆𝑅 𝑛−2 = 𝑦 𝑖 − 𝑦 𝑖 2 𝑛−2 =1742064,614 𝜎 = 𝑆𝑅 𝑛−2 = 𝑦 𝑖 − 𝑦 𝑖 2 𝑛−2 = 1742064,614 =1319,8730 𝑉 = 𝜎 𝑦 ∗100% = 1319,8730 10 373,6364 ∗100% =12,72%
𝑅 2 =1− 𝑆𝑅 𝑆𝑇 𝑟= 𝑅 2 KOEFICIJENT DETERMINACIJE KOEFICIJENT LINEARNE KORELACIJE 𝑅 2 =1− 𝑆𝑅 𝑆𝑇 𝑟= 𝑅 2 𝑅 2 =1−0,0721=0,9279 92,79% 𝑟= 0,9279 =0,9633 Modelom jednostavne linearne regresije protumačeno je 92,79% ukupnih odstupanja što ukazuje na reprezentativnost modela. Povezanost između broja Internet transakcija i ukupno ostvarenog prihoda je po jačini jaka, a po smjeru pozitivna.
Odredite granice 95% intervala pouzdanosti procjene parametra β1, ako je poznato da je koeficijent pouzdanosti 2,262, a standardna pogreška procjene jednaka je 0,2613. 𝑃 𝛽1 − 𝑡 𝛼 2 𝜎 𝛽 <𝛽< 𝛽1 + 𝑡 𝛼 2 𝜎 𝛽 =(1−𝛼) 𝑡 𝛼 2 =2,262 𝜎 𝛽 =0,2613 𝑃 2,8124 −2,262∗0,2613<𝛽<2,8124 +2,262∗0,2613 =0,95 𝑃 2,2213<𝛽<3,4035 =0,95
2. ZADATAK U statističkom ljetopisu RH za 93' na str 365. nalaze se podaci o broju noćenja i broju turista po godinama razdoblja (1982 – 1990). Odnos broja noćenja i turista predočen je modelom jednostavne linearne regresije. Na temelju empirijskih vrijednosti varijabli dobivena je ova tabela analize varijance: Koristite međurezultate: 𝑥𝑖 = 84,8 𝑦𝑖 = 554,2 𝑥𝑖 2 = 806,5 𝑥𝑖𝑦𝑖 = 5270,97 Izvor varijacije Stupnjevi slobode Zbroj kvadrata Sredina kvadrata Empirijski F - omjer Protumačen modelom 1 322,608 322.608 101,233 Neprotumačen modelom 7 22,308 3,187 Ukupno 8 344,916
Može li se prihvatiti pretpostavka da je varijabla „broj turista“ suvišna u modelu? Testirati na razini 5% signifikantnosti, ako je teorijski 𝐹 0,05 1,7 =5,591 𝑦 = 𝛽 0 + 𝛽 1 𝑥 Broj turista
𝐻 0 …𝛽=0 𝐻 1 …𝛽≠0 > 𝐹 𝐹 𝛼 =101,233 =5,591 𝐻 1 Uz razinu signifikantnosti od 5% ne može se prihvatiti pretpostavka da je varijabla broj turista suvišna u modelu.
Koliki je koeficijent determinacije i koeficijent linearne korelacije Koliki je koeficijent determinacije i koeficijent linearne korelacije? Protumačite njihovo značenje!
Kako glasi model linearne regresije s parametrima procijenjenim metodom najmanjih kvadrata? Interpretirajte dobivene procjene u konkretnom slučaju.
3. ZADATAK Analizira se potrošnja domaćinstava u regiji A ovisno o njihovom dohotku. Vrijednosti varijabli izražene su u USD. Na osnovi uzorka od 14 slučajno odabranih domaćinstava dobivena je sljedeća linearna regresijska jednadžba: 𝑦 = -284,9932 + 0,9551x 𝜎 2 = 7320,02273 (𝑥𝑖− 𝑥 ) 2 = 2153650,896 𝑥 = 4407,929
Protumačite konkretno značenje regresijskog koeficijenta. Ukoliko se dohodak poveća za jedan dolar, regresijska vrijednost potrošnje povećat će se linearno za 0,9551 dolar.
Ima li dohodak domaćinstva signifikantnog utjecaja na potrošnju Ima li dohodak domaćinstva signifikantnog utjecaja na potrošnju? Provedite odgovarajući jednosmjerni t-test uz razinu značajnosti 5%. 𝐻 0 … 𝛽 1 =0 𝐻 1 … 𝛽 1 >0 𝑡 1 > 𝑡 𝛼 =16,3825 =𝑡 0,05 (14−2) =1,782 𝐻 1 𝑡 1 = 𝛽 1 𝜎 𝛽 𝑡 𝛼 (𝑛−2) = 𝑡 0,05 (14−2) = 0,9551 0,0583 =1,7823 =16,3825 𝜎 𝛽 = 𝜎 2 𝑥 𝑖 − 𝑥 2 = 7320,02273 2153650,896 =0,0583
Nadopunite sve elemente koji nedostaju u tabeli ANOVA:
Kolika se potrošnja očekuje prema jednadžbi jednostavne linearne regresije, ako bi razina prihoda iznosila 4300 USD? Odredite i granice prognostičkog intervala uz pouzdanost procjene od 95%. 𝑦 0 = 𝛽 0 + 𝛽 1 𝑥 0 𝑥=4300 𝑦 0 =−284,9932 + 0,9551∗4300 𝑦 0 =3821,9368
𝑃 𝑦 𝑜 − 𝑡 𝛼 2 𝜎 𝑦 𝑜 < 𝑦 0 < 𝑦 𝑜 + 𝑡 𝛼 2 𝜎 𝑦 𝑜 =(1−𝛼) 𝑃 𝑦 𝑜 − 𝑡 𝛼 2 𝜎 𝑦 𝑜 < 𝑦 0 < 𝑦 𝑜 + 𝑡 𝛼 2 𝜎 𝑦 𝑜 =(1−𝛼) 𝑦 𝑜 =3821,9368 (𝑛−2) (14−2) (12) 𝑡 𝛼 2 = 𝑡 0,025 = 𝑡 0,025 =2,1788 𝜎 𝑦 𝑜 = 𝜎 1+ 1 𝑛 + (𝑥 0 − 𝑥 ) 2 ( 𝑥 𝑖 − 𝑥 ) 2 = 7320,02273 1+ 1 14 + (4300−4407,929) 2 2153650,896 =88,7863 𝑃 3821,9368−2,1788∗88,7863< 𝑦 0 <3821,9368+2,1788∗88,7863 =0,95 𝑃 3628,4892< 𝑦 0 <4015,3844 =0,95
4. ZADATAK Analizom noćenja domaćih turista (Y – u tisućama) i dolazaka domaćih turista (X – u tisućama) kroz dvanaest mjeseci 2013. godine ustanovljeno je postojanje linearne regresijske veze. Podaci o varijablama preuzeti su iz SLJRH 2013. na str 412. Linearnom vezom protumačeno je 3,04% ukupnih odstupanja. Regresijska vrijednost 𝑦 za x=1500 iznosi 5392,49. Regresijski pravac 𝑦 siječe os y u točki T (0;886,35). (𝑦𝑖− 𝑦 ) 2 = 1942455,6
Kako glasi linearna regresijska jednadžba? 𝑦 = 𝛽 0 + 𝛽 1 𝑥 𝑦 =5392,49 T (0;886,35). 886,35= 𝛽 0 + 𝛽 1 0 𝑥=1500 𝛽 0 =886,35 𝑦 =886,35+3,0041𝑥 5392,49= 𝛽 0 + 𝛽 1 1500 𝛽 1 = 5392,49− 𝛽 0 1500 =3,0041
Odredite vrijednost koeficijenta linearne korelacije!
Formirajte tabelu ANOVA!