Looduslike veekogude fosforisisalduse kovariatsioonanalüüs Marina Haldna, Tõnu Möls, Külli Kangur ja Olga Buhvestova Looduslike veekogude fosforisisalduse kovariatsioonanalüüs Konverents Statistika ja eluteadused Tartu 2010 1
Ettekande eesmärk Tutvustada kovariatsioonistruktuuride kasutamist lineaarses segamudelis vee kvaliteedinäitajate hajuvuse kirjeldamisel ja korrelatsioonide esitamisel 2
Üldfosfori andmete kogumine Statistiline modelleerimine via ANOVA Teemad Üldfosfori andmete kogumine Statistiline modelleerimine via ANOVA Tulemused 3
FOSFOR jt toitained Toitained veekogus ja nende seosed elustikuga Põhjaloomad ja zooplankton Kalad Kalad Fütoplankton 4
Peipsi järve iseloomustavad näitajad ja seirepunktide paiknemine Maksimaalne laius 47 km Kolm erinevat järveosa väljavool Narva jõgi Peipsi Suurjärv (s.s.) Pikkus 81 km Keskmine sügavus 8.3 m ESTONIA Emajõgi sissevool Lämmijärv Pikkus 30 km Keskmine sügavus 2.3 m kogupikkus 152 km Pihkva järv Pikkus 41 km Keskmine sügavus 3.8 m Velikaja jõgi Pindala 3555 km2 sissevool 5
Vaatluste arv Vaatluse arv varieerub nii järveosati kui aastati tugevalt. Vene poole andmed puuduvad täielikult aastatel 1993 - 2000. 6
Üldfosfori kontsentratsiooni varieeruvus aastate kaupa 7
Miks on mudeleid vaja? Ainult kogutud andmete kasutamine pikaajaliste trendide, sesoonse muutumise ja järveosade erinevuse kirjeldamiseks on lünklikkuse tõttu problemaatiline. Mudel võimaldab hinnata statistiliselt korrektselt prognooside ja erinevuste usalduspiire, p-väärtust jt. statistilisi atribuute. 8
Peipsi üldise lineaarse mudeli tekkimise skeem Proovipunktide asukoht: Kuupäev: aasta, päeva number aastas Üldfosfor kontsentratsioon MUDEL Proovipunktide asukoht: põhjalaiuse, idapikkuse koordinaadid 9
Peipsi järve üldise lineaarse mudeli põhikomponendid 10
Peipsi järve üldfosfori mudel (R2=0,58) TP=c0+c1·a1+c2·a2+c3·a3+c4·a4+c5·a5+c6·a6+ aasta mõju c7·pl+c8·pl2+c9·pl3 +c10·ip + c11·pl·ip + koordinaadid c12·t35+c13·t44+ c14·t53+ sesoonsus c15·a1·pl+c16·a2·pl+c17·a3·pl+c18·a4·pl+c19·a5·pl+c20·a6·pl+ c21·a1·pl2+c22·a2·pl2+c23·a3·pl2+c24·a4·pl2+c25·a5·pl2+c26·a6·pl2+ c27·a1·ip+c28·a2·ip+c29·a3·ip+c30·a4·ip+c31·a5·ip+c32·a6·ip+ c33·a1 t34+c34·a2·t35+c35 a3 t35+c36·a4·t35+c37·a5·t35+c38·a6·t35+ c39·a1·t44+c40·a2·t44+c41·a3·t44+c42·a4·t44+c43·a5·t44+c44·a6·t44+ c45·a1·t53+c46·a2·t53+c47·a3·t53+c48·a4·t53+c49·a5·t53+c50·a6·t53+ c51·pl·t35+c52·pl·t44+c53·pl·t53+ c54·pl2·t35+c55·pl2·t44+c56·pl2·t53+ c57·ip·t35+c58·ip·t44+c59·ip·t53 + ε, koosmõjud
Mõõtmised ja lineaarse mudeliga arvutatud pikaajalised trendid üldfosfori jaoks Jooniselt näeb nii järveosade erinevust kui ka pikaajalisi muutusi. Prognoosijooned on tehtud suvise seisundi jaoks, algandmed on esitatud kogu aasta kohta. 12
Kas nad on omavahel sõltumatud? Kuidas võivad mudeli prognoosijäägid korduvate mõõtmistega saadud andmete korral käituda? Kas nad on omavahel sõltumatud? Kõik jäägid korreleeruvad omavahel – meil piisab ühest mõõtmisest? Korrelatsioon ajaliselt ja ruumiliselt lähemal asuvate vaatluste jääkide vahel on suurem kui kaugemate vahel? 13
Eeltööd Kuna enamus vaatlustest on tehtud ühe laevareisi jooksul umbes iga kuu aja tagant piisab, kui jagada ruumiliste korrelatsioonide hindamiseks kõik vaatlused reidideks. Seega esitasime kovariatsioonimaatriksi blokkstruktuuri abil. Reide oli kokku 153, milles erinevate proovipunktide arv oli vahemikus 2 kuni 31 punkti (keskmiselt 11) Kauguse arvutamisel kasutasime eukleidilist kaugust 14
Mudeli prognoosijääkide empiiriline kovariatsioonifunktsioon* Funktsiooni kuju viitab eksponentsiaalsele sõltuvusele *Kasutatud SAS/STAT VARIOGRAM
Kordusmõõtmistega mudeli hinnatavad parameetrid (SAS MIXED protseduur) Jääkide dispersioon Kovariatsioon Korrelatsioonifunktsioon ρ näitab, kuivõrd kovariatsioonid kauguse suurenedes vähenevad Sõltumatu mudel ρ(θ,d) =0 Eksponentsiaalne mudel ρ(θ,d) =exp(-d/θ) Gaussi mudel ρ(θ,d) =exp(-d2/θ) Peipsi järve üldfosfori jaoks andis parimaid tulemusi (Akaike’ kooskõlakordajaid võrreldes) eksponentsiaalne mudel. 16
Peipsi järve üldfosfori semivariogramm Näitab mõõtmistulemuste varieeruvuse sõltuvust vaatluste omavahelisest paarikaupa vahemaast (Remm, 2008) Y ´(s) tähistab TP kontsentratsiooni proovipunktis s ja Y˝ (s+d) kontsentratsioone punktides, mis paiknevas punktist s kaugusel d. 17
Kokkuvõte üldfosfori kovariatsioonide kohta Dispersioon jaguneb kaheks oluliselt nullist erinevaks komponendiks : looduslik varieeruvus (σ 2) ja mõõtmisviga τ 2 Peipsi järve üldfosfori korral on mõlemad hajuvuse komponendid on logaritmilises skaalas küllaltki lähedased: 0,14 ja 0,12 vastavalt, mis tähendab 25% ja 27% hajuvust keskväärtuse suhtes. Korrelatsioonid on olulised omavahel kuni umbes 70 km kaugusel paiknevate punktide vahel
Diskussiooniteema Korrelatsioonide põhjused? Sarnased põhjatüübid ja sügavus, sissevoolu mõju Sarnased ilmatingimused-lähedastes punkides tehakse mõõtmised samadel kellaaegadel, sama lainetuse jne korral Lähedastes punktides on sarnasem toiduahel 19
Seos Emajõe sissevooluga Statistiliselt olulist seost Emajões asuva vaatluspunkti ja järvel olevate Emajõe mõjuala punktide üldfosfori väärtuste vahel pärast lineaarse mudeli komponentide (sesoonsus, aastamõju ja koordinaadid jne) mõju arvesse võtmist ei olnud. 20
Üldfosfori seos fütoplanktoni kontsentratsiooni ja vee temperatuuriga Statistiliselt oluline korrelatsioon mudeli jääkide vahel ilmnes järve üldfosfori ja fütoplanktoni korral (r = 0,35), samaaegselt mõõdetud temperatuuride ja fosfori korrelatsioon oli mitteoluline (r = -0,05).
Aitäh! Kasutatud statistilised protseduurid SAS/STAT protseduurid MIXED and VARIOGRAM Aitäh! Idee andja ja magistritöö juhendaja Märt Möls Rahastajad Eesti teaduse sihtfinantseerimisteema SF 0170006s08 ja Eesti Teadusfondi grant ETF7643 22
Tänan kuulajaid tähelepanu eest! 23