Ytterliggare kommentarer till beräkning av sannolikheten för en felklassificering
Man kan tycka att det skattade värdet i allmänhet borde vara så nära det sanna värdet EK att sannolikhetsberäkningen ovan utförd med som om det vore sant borde ge ett resultat som ligger nära den korrekta sannolikheten. Det visar sig att så är långt ifrån fallet. Om sant EK ligger nära (eller på) en gräns, t.ex. EK=0.7, så att den korrekta sannolikheten för felklassificering är 0.5, så blir förväntade (genomsnittliga) beräknade sannolikheten med som ”sant” runt 0.25, alltså en halvering (för SD=0.027 såväl som 0.075). För sant EK=0.8 (mitt i intervallet för ”God”) får man i stället en överskattning (0.29 i stället för korrekta 0.18 i fallet SD=0.075). Det är därför i allmänhet inte tillrådligt att räkna med som om det vore det sanna värdet.Om man inte kan förutsätta normalfördelning och/eller samma standardavvikelse SD överallt kan sannolikheten för felklassificering studeras genom (Monte Carlo-) simuleringar. Det innebär att man genererar ett stort antal möjliga utfall (skattningar ) genom att slumpa ut avvikelser och fel (vars fördelningar är baserade på verkliga data). Fortfarande måste man utgå från sanna EK. Proportionen felklassificerade utfall skattar sannolikheten för felklassificering. För detta ändamål kan programmet WISERBUGS användas.
Konfidensintervall
I stället för att försöka bestämma den exakta sannolikheten för felklassifcering skulle man kunna använda sig av begreppet konfidensintervall. Medan ett skattat värde, som vårt =0.73 ovan, är det enskilt bästa skattade värdet av det sanna värdet är ett konfidensintervall ett intervall av värden inom vilket man kan påstå att det sanna värdet återfinns. Påståendet är dock inte alltid sant, men andelen sanna påståenden kan styras med konfidensgraden. Med konfidensgraden 95 % och med ett antagande om normalfördelad skattning är (det tvåsidiga) intervallet ±1.96∙SD, alltså med våra värden insatta 0.73±1.96&8729;0.027, vilket ger gränserna 0.677 och 0.783. Vi kan alltså påstå (med liten risk för fel) att det sanna EK-värdet ligger mellan 0.677 och 0.783. Hade hela intervallet legat helt i en och samma kvalitetsklass kunde vi med stor säkerhet kunna påstå att kvaliteten i vattendraget är av denna klass. Nu ligger emellertid klassgränsen 0.7 i konfidensintervallet, varför det råder osäkerhet om klasstillhörigheten. Vi kan dock inte säga något om var i intervallet 0.677 till 0.783 det sanna EK-värdet ligger (om det nu ligger där), inte ens i termer av sannolikhet.Multipla indikatorer
Med flera indikatorer får vi naturligtvis mindre sannolikhet att samtliga blir korrekt klassificerade än med bara en. I vårt fall hade vi ”först” tre indikatorer vad gäller bottenfaunan. I exemplet var sannolikheten för felklassificering 0.23, d.v.s. sannolikheten för korrekt klassificering är 0.77 (vi beräknade inte sannolikheten att det hypotetiska vattendraget felaktigt klassificerades som ”hög”, men den är nära noll). Säg att de två övriga indikatorerna har sannolikheterna 0.69 och 0.92 att bli korrekt klassificerade. Om indikatorerna är helt oberoende av varandra blir sannolikheten att alla tre blir korrekt klassificerade 0.77#8729;+.69#8729;0.92=0.49, alltså mindre än 50 procent. Nu är de säkerligen inte oberoende eftersom påverkande faktorer säkert verkar i samma riktning på de olika indikatorerna. Sannolikheten att alla tre blir rätt klassificerade kan dock inte bli större än den lägsta sannolikheten av de tre, alltså här 0.69.För analytiska beräkningar eller simuleringar av sannolikheter för felklassificering av minst en indikator (eller för andra ”händelser”) behöver man känna till de simultana fördelningarna (med korrelationskoefficienter t.ex.) för de ingående skattningarna av indikatorerna. Gör man det ska man även för detta kunna använda programmet WISEBUGS (enligt beskrivningen av det).
Man kan ändå vara rätt säker på att med många indikatorer är sannolikheten för att någon ska bli felklassificerad ganska stor. Man är nog medveten om det i Vattendirektivet eftersom man tillåter specialgranskning av fall där ett vattendrag klassats som sämre än god (se t.ex. NV4, sidorna 48-51).