Loading
Relaterad information
Beroende och oberoende observationer

Hantering av värden under detektionsgräns

Olika variabeltyper


Externa länkar

Vad behöver jag veta om mitt datamaterial?

För att kunna hitta en metod som går att använda på datamaterialet i fråga, så måste man vara medveten om vilka egenskaper datamaterialet har. Det hänger till viss del ihop med datakvaliten, där man måste ta ställning till om dataunderlaget är tillräckligt bra för att den aktuella frågeställningen överhuvudtaget kan besvaras. Dessutom finns det egenskaper som inte nödvändigvis försämrar kvaliteten av datamaterialet, men mycket väl kan påverka val av statistisk metod. Nedan finns några av de viktigaste egenskaper.

Är observationerna oberoende?

De allra flesta beskrivningar av statistiska metoder kräver oberoende observationer, dvs att varje ny observation ska ge lika mycket information. Det finns många situationer där observationerna inte är oberoende, t.ex. är observationer i en tidserie ofta beroende i tiden (dvs att mätningar som har gjorts nära i tiden ger liknande resultat). Har man ett datamaterial som innehåller beroende, så måste en metod väljas som kan hantera detta beroende. Läs mer om beroende och oberoende observationer.

Finns det värden under en eller flera detektionsgräns(er)?

Om det observeras värden som är så små att den kemiska analysen inte kan detektera de, så rapporteras värden vanligtvis som mindre än detektionsgränsen. Vill man beräkna medelvärden för ett datamaterial som innehåller värden under en detektionsgräns, så måste man ta hänsyn till att man inte har några exakta mätningar. Att ersätter värden under detektionsgräns med värdet för detektionsgränsen eller halva detta värde kan leder till mycket missvisande uppskattningar av medelvärdet. Det finns dock ett antal statisiska metoder som korrekt kan hantera även värden under en detektionsgräns.

Vill jag undersöka flera serier/variabler/platser samtidigt?

En viktigt sak att ha i baktanken innan man bestämmer sig för en viss statistisk metod är också frågan om det finns intresse att analysera flera serier, variabler eller platser samtidigt.

Om man vill analysera flera variabler samtidigt är man kanske intresserat att undersöker hur dessa variabler samspela eller om det finns grupperingar. Det finns många olika statistiska metoder som kan passar för sådana frågeställningar, läs mer om det i ’Analysera flera variabler samtidigt’.

Vill man uttala sig om generella förändringar i ett större område, så finns det naturligtvis ett interesse att sammanfatta informationen man får från alla övervakningsstationer inom detta område. Ett typisk tillvägagångssätt är att använda spatiala metoder (extern länk, engelska) för att genera kartor över området genom utjämning. Vi tar inte upp några metoder som klassa som spatiala metoder, men flera av metoderna som diskuteras på miljostatistik.se kan användas för att samtidigt analysera ett flertal stationer.

Vilken fördelning har observationerna?

Frågan har redan väckts när frågan ’Vad vill jag undersöka’ ställdes. Den statistiska fördelningen beror främst på val av variabeltyp som ska undersökas. I samband med val av metod kontrollera man vilka krav metoden har på fördelningen av observationerna eller residualerna och undersöker i samband med analysen om detta krav är uppfyllt. I många fall är statistiska metoder som kräver normalfördelning ganska robusta mot måttliga avvikelser från denna fördelning, ibland måste man transformera före analysen för att möta metodens krav. Om fördelning av observationer eller residualer inte passar den utvalda metoden finns det ofta icke-parametriska alternativ som kan användas istället. Sådana metoder ska dock inte användas om fördelningsantagandet faktiskt är uppfyllt, eftersom de i så fall har sämre styrka än den parametriska metoden.

Finns det både naturlig och antropogen variation?

I många datamaterial och serier som samlas in för miljöövervakning är en stor del av variation naturlig, dvs. observationernas värde beror på väderförhållandena under och före provtagning. I vissa fall vill man skilja mellan sådan variation och förändringar som kan direkt härledas till mänskliga aktiviteter, t.ex. ökat utsläpp eller speciella åtgärdsprogram. Då är det en fördel att även samla in data om hur väderförhållandena har varit under observationsperioden t.ex. genom att mäta avrinning och vattentemperatur i samband undersökningar i vattendrag eller att mäta lufttemperatur, vindstyrka och vindriktning i samband med luftkvalitetsstudier. På sidorna ’Att skilja mellan naturlig och antropogen variation’ finns den en överblick över hur man kan gå tillväga. Hur man gör i de enskilda fallen beror dock på datamaterialets egenskaper och val av frågeställning.









Ansvarig för webbsidan:
webmaster@miljostatistik.se