Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεCleopatra McDowell Τροποποιήθηκε πριν 6 χρόνια
1
Suport de curs Stud. Management economic 28 martie 2009
Regresie si corelatie Suport de curs Stud. Management economic 28 martie 2009
2
Bibliografie + Orice manual/ tratat recomandat la secţiunea Bibliografie de pe site
4
Context Statistica dispune de o seamă de metode de studiere a dependenţelor dintre două sau mai multe variabile. Printre acestea sunt şi cele cuprinse în "analiza de regresie şi corelaţie". În cadrul acesteia se studiază dependenţa dintre o variabilă (caracteristică) rezultativă (y) şi una sau mai multe variabile (caracteristici) independente (x). Caracteristica rezultativă se mai numeşte caracteristica dependentă, endogenă sau efect, iar caracteristica independentă se mai numeşte caracteristica factorială, exogenă sau cauză. Regresia ne arată cum (ca formă analitică) o variabilă este dependentă de altă variabilă (sau de alte variabile), iar corelaţia ne arată gradul în care o variabilă este dependentă de o altă variabilă (sau alte variabile).
5
Clasificări a) după numărul caracteristicilor independente luate în studiu: - legături simple - legături multiple b) după direcţia legăturilor, acestea pot fi: - legături directe - legături inverse c) după expresia analitică a legăturilor, acestea pot fi: - legături liniare - legături neliniare (curbilinii) d) metode de abordare - metode simple (elementare) - metode analitice
6
METODE ELEMENTARE DE CARACTERIZARE A LEGĂTURILOR DINTRE VARIABILE
metoda seriilor paralele independente; metoda grupărilor; metoda tabelului de corelaţie; metoda grafică.
7
Clasificări a) după numărul caracteristicilor independente luate în studiu: - legături simple - legături multiple b) după direcţia legăturilor, acestea pot fi: - legături directe - legături inverse c) după expresia analitică a legăturilor, acestea pot fi: - legături liniare - legături neliniare (curbilinii) d) metode de abordare - metode simple (elementare) - metode analitice
8
Metoda seriilor paralele interdependente
Se ordonează observaţiile în funcţie de caracteristica independentă x (crescător sau descrescător) şi se urmează modul în care se aranjează valorile lui y. Concluzii: - caracteristica y se ordonează aproximativ crescător - rezultă că putem aprecia că între cele două variabile există o legătură directă; - caracteristica y se ordonează aproximativ descrescător rezultă că putem aprecia că între cele două variabile există o legătură inversă; - caracteristica y nu înregistrează o tendinţă de ordonare (crescător sau descrescător) - rezultă că putem aprecia că între cele două variabile nu există legătură.
9
Metoda grupărilor Se repartizează unităţilor în grupe omogene în funcţie de o caracteristică independentă. Pentru fiecare grupă astfel constituită se centralizează datele numerice referitoare la caracteristica rezultativă şi se calculează medii pe fiecare grupă şi mărimi relative. Prin comparaţia variaţiei caracteristicii independente cu indicatorii calculaţi pentru caracteristica rezultată se poate aprecia existenţa şi forma legăturilor dintre cele două variabile.
10
Metoda tabelului de contingenţă
Tabelul de contingenţă este un tabel cu dublă intrare şi prezintă o grupare a unităţilor unei colectivităţii în funcţie de două caracteristici: una dependentă şi alta independentă. Se foloseşte în special în cadrul unui număr mare de observaţii. Dacă considerăm două variabile naţionalitate şi religie, atunci tabelul poate fi de forma:
11
Exemplu - Tabel de contingenţă
12
Metoda grafică Graficul se construieşte pornind de le perechile de valori observate (x, y) care se reprezintă în sistemul de axe rectangulare. Pe axa OX se reprezintă variabila independentă x, iar pe axa OY variabila dependentă y.
13
Regresia liniară (1) Asumptii ale regresie liniare:
A1. Toate variabilele independente sunt cantitative sau dihotomice. Variabilele sunt masurate fara eroare. A2. Toate variabilele independente au varianta nenula. A3. Nu are loc multicoliniaritate. A4. Valoarea medie a variabilei ε (eroare) este zero pentru orice multime de valori ale variabilelor independente. A5. Fiecare variabila independenta este necorelata cu variabila ε. A6. Varianta lui ε este constanta-- homoscedasticity. A7. Pentru oricare doua observatii, erorile sunt necorelate. A8. Pentru orice valori ale variabilelor independente, ε este distribuita normal. A1 - A7. : asumptiile Gauss-Markov
14
Regresia liniară (2) Să presupunem, că un cercetător, în căutarea partenerei ideale, şi-a propus să studieze căsătoriile reuşite, în special în privinţa vârstei mirelui şi a miresei la căsătorie. Statistica a 15 căsnicii considerate reuşite, după vârsta la cununie, este prezentată în tabelul următor
15
Reprezentarea grafică
16
Punerea problemei Nr. crt. Vârsta mirelui Vârsta miresei f(x)=–15+2x f(x)=9+x/2 f(x)=a+bx i xi yi zi wi 1. 18 17 21 a+18b 2. 25 22 35 21,5 a+25b 3. 36 28 57 27 a+36b 4. 19 19,5 a+21b 5. 20 29 a+22b 6. 23 18,5 a+19b 7. 24 33 a+24b 8. 32 49 a+32b 9. 38 61 a+38b 10. 26 37 a+26b 11. 12. 13. 31 20,5 a+23b 14. 15. Fie f:R->R o funcţie liniară, având forma analitică: f(x)=a+bx, xÎR. Pentru diferitele valori ale lui a şi b funcţia va lua valori diferite. Două cazuri concrete şi unul general este redat în tabelul următor.
17
Concepte
18
Estimarea parametrilor (1)
19
Estimarea parametrilor (2)
20
Interpretări Coeficientul „a", care poate lua atât valori pozitive cât şi negative, reprezintă ordonata la origine, respectiv este valoarea lui „y" când “x” este egal cu zero. Coeficientul „b" - denumit coeficient de regresie - arată măsura în care variază caracteristica dependentă în cazul în care caracteristica independentă se modifică cu o unitate. În funcţie de semnul coeficientului de regresie, putem aprecia tipul de legătură: în cazul corelaţiei directe, coeficientul are o valoare pozitivă; în cazul corelaţiei inverse, valoarea lui este negativă; în cazul în care b = 0, se apreciază că variabilele (y şi x) sunt independente. În graficul de corelaţie coeficientul „b" indică panta liniei drepte.
21
Modele neliniare de regresie (1)
22
Modele neliniare de regresie (2)
23
Modele neliniare de regresie (3)
24
MODELE DE REGRESIE MULTIFACTORIALĂ
Y' = a + b1*X1 + b2*X2. Y = (10 - X12 - X22)1/2
25
Metoda corelaţiei Corelaţia parametrică (variabile măsurate pe scala de raport) Corelaţia neparametrică (variabile măsurate pe scala nominală, ordinală sau de interval)
26
Corelaţia parametrică
Metoda corelaţiei prezintă avantajul că oferă o măsură sintetică a legăturilor dintre variabilele statistice. Indicatorii care măsoară intensitatea legăturii sunt: covarianţa, coeficientul de corelaţie şi raportul de corelaţie.
27
Covarianţa (2)
28
COEFICIENTUL DE CORELAŢIE LINIARĂ SIMPLĂ (1)
29
COEFICIENTUL DE CORELAŢIE LINIARĂ SIMPLĂ (2)
30
COEFICIENTUL DE CORELAŢIE LINIARĂ SIMPLĂ (3)
Coeficientul de corelaţie poate lua valori cuprinse între -1 şi +1, adică satisface inegalităţile: - 1 ryx 1, iar semnul său, ca şi cel al coeficientului de regresie, semnifică tipul de legătură: semnul minus indică legătura inversă, semnul plus indică legătura directă. Cu cât coeficientul de corelaţie are valori mai apropiate de 1 sau –1, cu atât corelaţia rectilinie dintre variabilele x şi y este mai puternică. Pe măsură ce coeficientul de corelaţie se apropie de zero, scade şi intensitatea legăturii dintre cele două variabile. În cazul în care ryx = 0, variabilele sunt independente ori necorelate liniar, iar pentru egal cu unitatea, rezultă dependenţa funcţională între cele două variabile.
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.