Loading
Relaterad information
Allmänt om multivariata metoder

Ett flödesschema för multivariata metoder


Externa länkar

Program:
SIMCA
PC-Ord
Canoco
PAST (gratis)

Websidor:
The ordination web page

Correspondence Analysis (CA) och Deterended Correspondence Analysis (DCA)

Beskrivning

Dessa två metoder är paralleller till principalkomponentanalys (PCA) som beskrivits ingående i ett annat avsnitt. För användaren är skillnaden mellan metoderna att CA/DCA används då man arbetar med levande organismer med , dvs. djur eller växter, medan PCA används när man har variabler med linjär respons. I bakgrunden använder CA/DCA andra algoritmer än PCA, men vi tar inte upp några detaljer här.

Exempel

Det finns ingen möjlighet att automatiskt kontrollera vilken av metoderna (PCA eller CA) som ska användas till ett visst dataset. Detta måste avgöras av användaren från fall till fall. I figur 1 har PCA använts för ett dataset med unimodal respons. Resultatet blir ett ordinationsdiagram som placerar proverna i en hästskoliknande båge, men där de inbördes avstånden mellan proverna inte avspeglar de korrekta avstånden. Detta brukar kallas för ”hästskoeffekten”, och uppstår då man analyserar data med unimodal respons med en metod som bygger på att data har linjär respons. I sådana fall ska man istället använda CA.

Datasetet använt i detta exempel finns att ladda ner här (Excel-fil).

Viktigt att veta och fallgropar

Ibland uppstår ett problem i CA. Detta brukar kallas för ”the arch effect” och visar sig i att proverna i ett ordinationsdiagram fördelar sig bågformat och därmed inte representerar de sanna sambanden i det datamaterial man analyserar (Fig. 2). Detta beror på matematiska effekter i algoritmerna bakom metoden. För att komma till rätta med detta finns ”Detrended Correspondence Analysis”, DCA, figur 3. Denna metod utnyttjar några ytterligare beräkningssteg för att eliminera ”the arch effect”. Det kan dock vara så att en förmodad bågeffekt i en CA visar de sanna sambanden, och då ska DCA inte användas. Så, DCA används bara i de fall man misstänker att en CA resulterat i en bågeffekt. I annat fall är det CA som gäller för att illustrera samband i ett multivariat dataset med unimodal respons, d.v.s. närvaro/frånvaro eller mängd organismer (växter eller djur) som beskriver de olika proverna.

Figur 1. Principalkomponentanalys, PCA, utförd på data med unimodal fördelning. Varje punkt är ett prov. I detta fall är PCA en felaktig metod och proverna ordnar sig i en hästskoliknande båge, därav namnet ”hästskoeffekten”. De inbördes avstånden mellan proverna återger inte deras samband på ett korrekt sätt i detta fall. I denna figur är bara proverna medtagna.


Figur 2. Correspondence analysis, CA, utförd på samma dataset som i figur 1. Även här blir proverna arrangerade i en båge. I detta fall är det ett tillkortakommande i metoden som orsakar att proverna arrangeras i en båge. Detta kan uppstå ibland i CA, och kallas på engelska för ”arch effect”.


Figur 3. Detrended Correspondence Analysis, DCA, utförd på samma dataset som i figur 1 och 2. Här har bågen som uppstod i CA försvunnit och de inbördes avstånden mellan proverna avspeglar bättre de sanna likheterna och olikheterna mellan proverna.

Detaljer

För tolkning av ordinationsdiagram, se beskrivningen av principalkomponentanalys. För principen bakom algoritmerna i CA och DCA hänvisas till The Ordination Web page

Datorprogram

Till skillnad från PCA som finns i många stora programpaket, finns CA/DCA oftast bara i specialprogram för multivariat analys av oftast ekologiska data. Några exempel är:

PC-Ord (kommersiellt)
Canoco (kommersiellt)
PAST (gratis)
R-modulen ”vegan”(gratis)


Ansvarig för webbsidan:
webmaster@miljostatistik.se