Vad behöver jag veta om mitt datamaterial?
För att kunna hitta en metod som går att använda på datamaterialet i fråga, så måste man vara medveten om vilka egenskaper datamaterialet har. Det hänger till viss del ihop med datakvaliten, där man måste ta ställning till om dataunderlaget är tillräckligt bra för att den aktuella frågeställningen överhuvudtaget kan besvaras. Dessutom finns det egenskaper som inte nödvändigvis försämrar kvaliteten av datamaterialet, men mycket väl kan påverka val av statistisk metod. Nedan finns några av de viktigaste egenskaper.Är observationerna oberoende?
De allra flesta beskrivningar av statistiska metoder kräver oberoende observationer, dvs att varje ny observation ska ge lika mycket information. Det finns många situationer där observationerna inte är oberoende, t.ex. är observationer i en tidserie ofta beroende i tiden (dvs att mätningar som har gjorts nära i tiden ger liknande resultat). Har man ett datamaterial som innehåller beroende, så måste en metod väljas som kan hantera detta beroende. Läs mer om beroende och oberoende observationer.Finns det värden under en eller flera detektionsgräns(er)?
Om det observeras värden som är så små att den kemiska analysen inte kan detektera de, så rapporteras värden vanligtvis som mindre än detektionsgränsen. Vill man beräkna medelvärden för ett datamaterial som innehåller värden under en detektionsgräns, så måste man ta hänsyn till att man inte har några exakta mätningar. Att ersätter värden under detektionsgräns med värdet för detektionsgränsen eller halva detta värde kan leder till mycket missvisande uppskattningar av medelvärdet. Det finns dock ett antal statisiska metoder som korrekt kan hantera även värden under en detektionsgräns.Vill jag undersöka flera serier/variabler/platser samtidigt?
En viktigt sak att ha i baktanken innan man bestämmer sig för en viss statistisk metod är också frågan om det finns intresse att analysera flera serier, variabler eller platser samtidigt.Om man vill analysera flera variabler samtidigt är man kanske intresserat att undersöker hur dessa variabler samspela eller om det finns grupperingar. Det finns många olika statistiska metoder som kan passar för sådana frågeställningar, läs mer om det i ’Analysera flera variabler samtidigt’.
Vill man uttala sig om generella förändringar i ett större område, så finns det naturligtvis ett interesse att sammanfatta informationen man får från alla övervakningsstationer inom detta område. Ett typisk tillvägagångssätt är att använda spatiala metoder (extern länk, engelska) för att genera kartor över området genom utjämning. Vi tar inte upp några metoder som klassa som spatiala metoder, men flera av metoderna som diskuteras på miljostatistik.se kan användas för att samtidigt analysera ett flertal stationer.
- Under ’Analysera flera variabler samtidigt’ presenteras multivariata metoder, där flera variabler naturligtvis också kan stå för att analysera samma kemiska variabel från flera olika stationer.
- Även trendanalyser kan göras för ett antal olika stationer samtidigt, då kan man skatta trendytor eller bara kombinera resultaten från trendtester på enskilda stationer (t.ex. med Mann-Kendall test).
- För analys av brytpunkter i serier är också önskvärd att kunna analysera flera serier samtidigt, så brytpunkter som uppträder samtidigt ger större chans att upptäcka så-kallade regimskifte i de studerade systemen.
- När det gäller att bedöma om vissa miljömål uppfylls eller ej kan man använda flera variabler och formulera multipla mål. Detta medför dock också en del problem och tolkningssvårigheter. Läs mer om detta på sidan om multipla mål.