Skillnad eller samband
Denna sida är bara ett utkastIdentifiera frågeställningen
När miljöövervakningsdata ska analyseras finns många olika relevanta mål, ibland gäller det att hittar samband mellan olika variabler eller att se spår av olika åtgärder eller hot i det insamlade datamaterialet. I andra fall är det intressant att se om det finns skillnader, t.ex. mellan kontrollområden och påverkade områden eller mellan observerade värden och ett gränsvärde.Det är alltid en fördel att börja en analys med att visualisera datamaterialet, genom plottar och grafer över enskilda variabler och med mer avancerade metoder, som till exempel punkt- eller bubbeldiagram eller länkade diagram. Det är också viktigt att i ett tidigt skede fundera över datakvaliteten i datamaterialet.
Vilken metod?
Andra beslut man måste ta är om datamaterialet ska analysera- univariat eller multivariat
en variabel i taget (univariat) eller en gemensam analys av flera variabler/områden samtidigt, t.ex. genom att hitta samband mellan flera variabler (se också multivariata metoder), eller genom att analysera trender över flera platser (eller andra underindelningar, se trendytor). Även för uppföljning av miljömål kan man skilja mellan univariata mål och multipla (multivariata) mål. - har sambandet linärt (känd form) eller inte, finns det brytpunkter
linjära samband eller samband efter ett förutbestämt mönster kan ofta analyseras med t.ex. linjär regression. När formen av ett samband inte är känd, kan man låta datamaterialet styra, metoden kallas icke-parametrisk utjämning. Ibland är förändringen inte alls linjär eller glatt, men visar istället ett hopp, då kan modeller för brytpunktsdetektion vara aktuella. - finns det hjälpinformation att ta till
ofta kan en (stor) del av den slumpmässiga variationen i ett datamaterial förklaras genom väderförhållanden under eller före provtagning. Att ta med meteorologiska (hydrologiska) bakgrundsvariable i analysen eller att lägga upp provtagningen så att den naturliga variationen minskar gör det lättare att bedöma den antropogena påverkan. - parametriska eller icke-parametriska metoder
parametriska metoder bygger ofta på att fördelningen av den ingående responsvariabeln är känd (normal, log-normal, poisson,….) eller att data kan transformeras för att erhålla en känd fördelning. När fördelningen inte är känd kan icke-parametriska metoder användas.
- den temporära / spatiala upplösning (årsmedelvärden, en mätning varje månad/dag/timme, ett medelvärde för olika områden, en mätning på varje punkt i ett nät över en större region)
- hur många observationer som ingår i datamaterialet
- om saknade värden eller värden under detektionslimit ingår i datamaterialet