Loading
Relaterad information
Att designa ett övervakningsprogram

Urvalsmetoder

Skattningar

Att använda förhandsinformation

Fördelningar för observationer och skattningar


Externa länkar

Dimensionering

Att bestämma sampelstorleken är givetvis en central fråga när ett övervakningsprogram ska designas. Nu är detta en mycket svår fråga att ge svar på. Dels krävs väldigt hög detaljeringsgrad i programmets syfte, dels är frågan ganska tekniskt komplicerad och dels har man inte all information som skulle behövas. Förutsättningslöst är ändå tankegången att med ökad sampelstorlek ökar precisionen men samtidigt kostnaden. Med ökad precision minskar risken för ett felaktigt beslut vad gäller måluppfyllelsen. Ett felaktigt beslut kan sägas kosta det också. Vi har alltså två kostnader, en för inventeringen och en för ett felaktigt beslut. Vi bör minimera summan av dessa kostnader. Detta tankesätt är värdefullt i sammanhanget men ger sällan lösning på dimensioneringsproblemet eftersom vi inte kan ange (den förväntade) kostnaden för ett felaktigt beslut.

Den näst ”bästa” metoden att dimensionera är att använda styrkeberäkningar. Antag att vi ska avgöra om målet Y ≥ G är uppfyllt och att vi ska göra det med hypotesprövning och varianten fail-safe. Vi ska då med hjälp av data påvisa att det inte (knappast) kan vara sant att Y < G . Det kan vi, under ganska allmänna villkor, göra om ≥ G+1.645 ⋅ SE() , där är vårt skattade värde och SE() är dess medelfel (konstanten 1.645 gäller för signifikansnivån 5%). Vi vill nu att det är stor sannolikhet att detta kommer att inträffa (när vi så småningom har data), alltså att sannolikheten att ≥ G+1.645 ⋅ SE() kommer att inträffa är stor. Denna sannolikhet kallas styrkan. Vi måste då, ”i förväg”, beräkna styrkan för att dimensionera. Styrkan beror både på det sanna värdet Y och på den sanna standardavvikelsen (”sanna medelfelet”), där den sanna standardavvikelsen i sin tur beror på variationen i populationen (och på urvalsmetod) och på sampelstorleken. Detta innebär att vi kan dimensionera under förutsättningarna ”om Y är si och så stor i förhållande till G” och ”variationen i populationen är si och så stor” så behöver vi sampelstorleken n för att få sannolikheten säg 0.85 att kunna påvisa att målet är uppfyllt. Alla dessa ”om” (och ofta gissade sanna värden) gör givetvis att beräkningarna i praktiken enbart är hypotetiska och vägledande. De ”gissningar” som måste göras kan vara ganska välgrundade om det finns erfarenhet av liknande slags inventeringar eller om vi först gör en pilotstudie (eller om vi har ambitionsnivån att först på sikt träffa rätt i dimensioneringen och låta budgeten avgöra dimensionen till en början).

Även om styrkeberäkningar nog mest är vägledande kan det vara värt mödan att (försöka) genomföra sådana. De kan nämligen avslöja att vissa frågeställningar knappast kan komma att besvaras med en rimlig insats.

Notera att den enklaste formeln för medelfel, det välkända uttrycket s / √n med motsvarande sanna värde σ / √n, där σ är standardavvikelsen i populationen, endast är direkt tillämplig om urvalet sker OSU. För andra design (t.ex. tvåstegsurval eller tvåfasmetodik med kvotskattning) är formlerna för skattning och sann standardavvikelse åtskilligt mer komplicerade. För tvåstegsurval har vi t.ex. två variationer att beakta, ”mellan bestånd (sjöar)” och ”inom bestånd (sjöar)” och två sampelstorlekar, ”antal bestånd (sjöar)” och ”antal provpunkter per bestånd (sjö)”.

I stort sett samma beräkningar kan göras då skattade värden ska användas för klassificering (som i vattendirektivet) för att bestämma vilken sampelstorlek som gör att sannolikheten för felklassificering blir nöjaktigt liten. Fortfarande gäller dock att resultatet grundar sig på antaganden om sanna värdet Y och ”variationer i populationen”.

Notera också att styrkeberäkningar i allmänhet görs varje variabel för sig (även om man rent teoretiskt skulle man kunna betrakta flera samtidigt). Det leder givetvis till olika resultat vad gäller sampelstorleken för olika variabler. Även om man kunde genomföra mycket välunderbyggda styrkeberäkningar så skulle den slutliga dimensioneringen ändå bli en kompromiss.

Läs vidare om fördelningar




Ansvarig för webbsidan:
webmaster@miljostatistik.se