Förhandsinformation - hjälpvariabler
Vad som skiljer sampling (inventering) från mycket annan statistisk tillämpning är möjligheten att använda ”förhandsinformation” (hjälpinformation), som inte behöver vara objektivt insamlad. För att kunna tillämpa metoder som PPS-urval och stratifiering behöver vi viss sådan förhandsinformation om populationen (och dess värden). Har vi inte det är det ofta effektivt att använda en del av den totala inventeringsresursen åt att samla in sådan. Allmänt kan vi kalla förfarandet ”att mäta hjälpvariabler” (även om vi inte alltid mäter utan gör bedömningar eller utnyttjar befintlig). Det finns flera exempel på användning av hjälpvariabler och ett par fall tas upp här nedan (det finns flera).Tvåfassampling och kvotskattning
Det som ska mätas, variabel y, kan vara kostsamt och det finns en annan variabel x som är billig att mäta (eller rentav bedöma visuellt) och som är korrelerad med y. Man kan då mäta x för ett stort sampel (eventuellt för alla objekt i populationen), medan y endast mäts för ett subsampel. Från det stora samplet kan vi skatta (eller beräkna) populationens X-värde med hög precision. Från subsamplet kan vi skatta populationens Y-värde, men även på nytt populationens X-värde (nu med lägre precision). På grund av (den förmodade) höga korrelationen mellan x och y är dock kvoten R = Y / X skattad med hög precision från subsamplet. Denna kvot multipliceras sedan med X-skattningen från det större samplet. Urvalsmetoden kallas tvåfassampling och skattningsmetoden kvotskattning. I stället för kvot kan man använda differens (differensskattning) eller linjär regression (regressionsskattning).Till skillnad mot PPS-urval och stratifiering är vi inte bundna till en enda hjälpvariabel x. Vi kan använda olika hjälpvariabler x för olika målvariabler y.
Hjälpvariabler för allmän kalibrering
Vi kan se det som att subsamplet i tvåfassamplingen ger oss möjlighet att kalibrera x-värdena i det större samplet genom multiplikation med kvoten ”skattat R”. Det kan finnas skäl till mer allmänna kalibreringar. Antag t.ex. att mätvärden i en sjö kan påverkas av ”väder och vind”, något som man inte rår över. Genom att registrera ett par tre väderleksvariabler kan man då korrigera data för aktuellt väder med en statistisk modell (oftast en linjär modell, som varians- eller regressionsanalys). Lyckas man korrigera blir det resulterande medelfelet för den ”renodlade” skattningen av Y mindre än annars. Givetvis kostar det en del att registrera en mängd tänkbara variabler för kalibrering, varför man ska överväga om det är värt mödan. Floran av möjligheter är här rätt omfångsrik och vägledning i det enskilda fallet kan man få av litteraturstudier inom det specifika området.Ofta kan data från fjärranalys användas som hjälpinformation. Det kan finnas tillgång på flygbilder, satellitbilder, laserdata eller radardata.