Statistisk osäkerhet och riskbedömning av
förorenad mark
Öberg, T.
Posterpresentation vid Nätverket Renare Marks
vårmöte i Skövde, 19-20 mars 2002.
Det går aldrig att nå fullständig visshet om exakt hur förorenat ett markområde är. Ett begränsat antal mätningar kan däremot ge en skattning av den genomsnittliga föroreningshalten, liksom osäkerheten i denna skattning. Det ger en fast grund för vidare bedömningar och beslut om åtgärder. Här jämför jag några olika utvärderingsmetoder och visar på den praktiska tillämpningen.
Bakgrund
Grundläggande för att kunna göra en riskbedömning av förorenad mark är att man kan bestämma exponeringen. Det förutsätter att man på ett tillförlitligt sätt kan fastställa den genomsnittshalt av föroreningar som förekommer i det undersökta området.
Antalet prov som kan analyseras är alltid begränsat. Det innebär att den genomsnittliga koncentrationen aldrig kan anges exakt. Det finns olika sätt att hantera osäkerheter i riskbedömningar, men det tillvägagångssätt som i det här fallet har vunnit allmän acceptans är att addera osäkerheten i beräkningen av det aritmetiska medelvärdet. Osäkerheten anges då som det övre enkelsidiga 95%-iga konfidensintervallet, förkortat "95% UCL" ( se exempelvis EPA, 1992 eller Naturvårdsverket, 1997). Det innebär att i 95 fall av 100 så befinner sig det sanna medelvärdet under UCL.
Metoder
Normalfördelade mätdata
Ibland kan insamlade mätdata beskrivas med en symmetrisk s.k. Gauss- eller normalfördelning och då finns enkla och standardiserade metoder för att beräkna konfidensintervallen (Gilbert, 1987). Mätdata för markföroreningar följer dock ytterst sällan en normalfördelning, det "normala" är istället en "sned" fördelning med enstaka höga värden. Ibland kan dessa data anpassas till en normalfördelning genom att först logaritmera mätetalen. I figur 1 visas ett exempel på en log-normalfördelning.

Figur 1: Exempel på log-normalfördelning.
Lands metod
Charles Land presenterade 1971 en metod för beräkning av exakta konfidensintervall för det aritmetiska medelvärdet när mätdata följer en log-normalfördelning. Metoden återges i många beskrivningar av hur log-normalfördelade miljödata ska utvärderas (Gilbert, 1987; EPA, 1992). Beräkningsgången för att skatta 95% UCL enligt Lands metod är komplicerad, men det finns möjlighet att använda publicerade tabellvärden. Det krävs då kubisk interpolation för att få en exakt anpassning till egna data.
Lands metod är inte tillämpbar:
Lands metod leder också ofta till felaktiga slutsatser om antalet prov är färre än 30 (EPA, 1997).
Bootstrapping
Bootstrapping är en relativt ny statistisk metodik för att skatta fördelningar av mätdata (Efron och Tibshirani, 1993). I motsats till vad som är fallet med traditionella metoder så ligger inga teoretiska fördelningar till grund för beräkningarna. Istället skapas referensfördelningen från insamlade mätdata genom att göra ett stort antal slumpmässiga provurval från originaldata.
Praktiskt går bootstrapping till enligt följande:
Bootstrapping kan hantera situationer när traditionell statistik kommer till korta eller blir extremt komplicerad, t.ex. när många prov är under detektionsgränsen. Bootstrapping är dessutom en enkel metod, även om det krävs en dator för att genomföra de 1000-tals beräkningslooparna.
|
Namnet "bootstrapping" kommer från berättelsen om hur baron von Münchhausen tog sig upp ur ett kärr genom att lyfta sig själv i stövel-stropparna. Riktigt så fantastisk är inte den här tekniken, men lite magi är det ju onekligen i att kunna jämföra mätdata med sig själv. |
Ett räkneexempel
I en undersökning togs 10 st markprov som analyserades med avseende på bl.a. cancerogena PAH. Fyra av proven hade halter under detektionsgränsen som var 0.03 mg/kg TS (för dessa sätts halten till 0.015 i den fortsatta analysen), och övriga prov innehöll 0.11, 1.3, 14, 0.042, 16 respektive 0.71 mg/kg TS, figur 2.

Figur 2: Halter av cancerogena PAH i 10 st markprover, mg/kg TS (log-skala).
Det finns olika tumregler för att välja referensfördelning utifrån storleken på variationskoefficienten (CV), men det är mer rättvisande att använda ett statistiskt test. Shapiro-Wilks test (Shapiro et al, 1968) visar i det här fallet att normalfördelningen inte ger någon bra beskrivning. Samma sak gäller log-normalfördelningen, även om avvikelsen är mindre.
I tabell 1 redovisas som jämförelse både det nedre och övre enkelsidiga konfidensintervallen beräknade utifrån antagande om normalfördelning (approximerad med t-fördelning), med Lands metod och med bootstrapping.
Tabell 1: Beräkningar av enkelsidiga konfidensintervall.
|
95% LCL |
95% UCL |
|
|
Normalfördelning |
-0.4 |
6.8 |
|
Lands metod (log-normal) |
1.0 |
1.1·104 |
|
Bootstrapping |
0.2 |
6.4 |
Redan en snabb granskning av tabellvärdena ovan visar att bootstrapping är den enda av metoderna som ger alltigenom trovärdiga resultat. Avvikelsen är särskilt påtaglig när det gäller att beräkna det övre enkelsidiga konfidensintervallet med Lands metod, vilket i detta exempel ger helt orealistiska resultat. Likartade avvikelser redovisas i den tidigare citerade rapporten från U.S. EPA (EPA, 1997), då med betydligt fler beräkningsexempel baserade på både simuleringar och verkliga mätdata.
Slutsatser
Riskbedömningar bör baseras på mätdata och osäkerheter bör hanteras med statistisk metodik, men metoderna som används måste anpassas till den praktiska verkligheten. Ska en teoretisk fördelning användas så måste det säkerställas att förutsättningarna för detta är uppfyllda. är så inte fallet bör man istället använda en metod som inte kräver att den underliggande fördelningen är känd. Bootstrapping är ett exempel på en enkel och tillförlitlig metod för att etablera en referensfördelning enbart utgående från tillgängliga mätdata.
Referenser
Alaska Department of Environmental Conservation, 2001. Use of the bootstrap method in calculating the concentration term for estimating risks at contaminated sites.
Efron, B. och Tibshirani, R., 1993. An Introduction to the Bootstrap. Chapman and Hall.
EPA, 1992. Supplemental guidance to RAGS: Calculating the concentration term. Publication 9285.7-081. U.S. EPA.
EPA, 1997. The lognormal distribution in environmental applications. EPA/600/R-97/006. U.S. EPA.
Gilbert, R. O., 1987. Statistical methods for environmental pollution monitoring. Van Nostrand Reinhold.
Naturvårdsverket, 1997. Åtgärdskrav vid efterbehandling. Rapport 4807. Naturvårdsverket förlag.
Shapiro, S. S., Wilk, M. B. och Chen, H. J., 1968. A comparative study of various tests of normality. JASA 63, 1343-1372.
|
|