måndag 11 mars 2013

Blandade effekter

I förra inlägget presenterade jag en statistisk modell för att förutsäga mortaliteten i kranskärlssjukdom på befolkningsnivå utifrån olika riskfaktorer. Jag har sedan provat att använda samma oberoende variabler för att förutsäga mortalitet i vidare kategorier, som hjärtsjukdom (ICD-9: 390–429, ICD-10: I00–I51) och cirkulationssjukdom generellt (ICD-9: 390–459, ICD-10: I00–I99) i samma uppsättning befolkningar. Resultaten pekar i samma riktning som de jag redovisade i förra inlägget, men förutsägelseförmågan blir litet bättre. Dessa grövre indelningar kanske minskar känsligheten för artificiella trender, som beror på skillnader mellan olika länder när det gäller sättet att rapportera dödsorsaker.

Jag betonade i förra inlägget att man får vara mycket försiktig med att tolka in orsakssamband mellan risk/skyddsfaktorer och mortalitet i denna typ av s.k. ekologiska samband. En sak att vara uppmärksam på är att det finns grupper av länder med ett ganska likartat riskfaktor- och dödlighetsmönster, t.ex. de 13 före detta sovjetrepubliker som utgör nära en fjärdedel av de ingående länderna. Det är rimligt att tro att de kan ha andra gemensamma faktorer utöver de riskfaktorer som ingår som oberoende variabler i modellen som påverkar rapporterade dödstal i länderna. Det är alltså inte oproblematiskt att betrakta dem som oberoende statistiska datapunkter. Tänk om det varit USA, och inte Sovjetunionen, som brutit samman i början av 90-talet, så att alla delstaterna blivit självständiga. I så fall hade vi kunnat ha 49 fler befolkningar med ett amerikanskt riskfaktorer- och dödlighetsmönster, och det är troligt att förutsägelserna då hade sett annorlunda ut.

Ett vanligt sätt att hantera denna typ av problem i statistisk analys är att använda någon form av s.k. multinivåregression, där individerna delas in i olika kluster och effekterna av tillhöra ett visst kluster vägs in i modellen. Jag jämförde resultaten i den ovannämnda analysen av hjärtsjukdom en s.k. mixed effects-analys (med hjälp av funktionen lmer i R (R Development Core Team 2011)), med samma riskfaktorer som i den enkla analysen, men där befolkningarna därutöver delades in efter GBD-region (se mitt inlägg här den 29 december 2012).

Som diagrammen nedan visar gav denna multinivåanalys klart bättre förutsägelseförmåga än den enkla analysen, speciellt för åldersgrupperna över 65 år. När det gäller de äldre, där det finns notoriska problem med att ange en entydig dödsorsak, kan kulturella skillnader när det gäller rapporteringen av dödsorsaker väntas ha större betydelse än för yngre. Betydelsen av de olika riskfaktorerna påverkades. I den enkla analysen innebar t.ex. en ökning av systoliskt blodtryck med 1 mm 8–10 procent högre mortalitet i åldersgrupperna under 65 år, och 6–7 procent högre i åldersgrupperna över 65 år (p < 0, 001 i alla grupper), och 1 procentenhet fler diabetiker gav 11–12 procent högre mortalitet före 65 års ålder (p ≈ 0, 02 för både kvinnor och män), men 1 mmol/l högre totalkolesterol minskade mortaliteten före 65 års ålder med ca två tredjedelar (p ≈ 0, 008 för kvinnor; p ≈ 0, 001 för män).

I multinivåanalysen fanns ett likartat negativt samband med totalkolesterol bland kvinnor under 65 år, men det gick inte att hitta något samband i andra grupper. Sambandet med andelen diabetiker var inte heller signifikant, annat än bland män över 65 år. Ökat blodtryck medförde i åldersgrupperna under 65 år en mortalitetsökning med 4–6 procent/mm, vilket är mer linje med de effekter som setts i studier på individnivå (se (Prospective Studies Collaboration 2002)), och det gick inte att hitta några effekter bland kvinnor eller män över 65 år. Alltså verkar det finnas risk för snedvriden uppskattning av betydelsen av olika riskfaktorer om man analyserar samband mellan befolkningar på internationell nivå utan att ta hänsyn till denna typ av klustring av länder. Kanske var detta vad som drabbade t.ex. studier från mitten av 1900-talet, som jag skrev om här den 11 maj 2011, som visade relativt starka positiva samband mellan andelen fett i maten och kranskärlsmortalitet: en hög andel fett blir bara en markör för att befolkningen tillhör en västerländsk kultursfär.

Diagrammen (klicka för förstoring) visar förutsedda vs rapporterade (ln-transformerade) dödstal i hjärtsjukdom för kvinnor och män under och över 65 år i befolkningar med tillgängliga data för dödlighet och riskfaktorer i en enkelnivåanalys (se löptexten för närmare beskrivning). Landskoder: AL: Albanien, AM: Armenien, AT: Österrike, AU: Australien, BE: Belgien, BG: Bulgarien, BY: Vitryssland, CA: Canada, CH: Schweiz, CY: Cypern, CZ: Tjeckien, DE: Tyskland, DK: Danmark, EE: Estland, ES: Spanien, FI: Finland, FR: Frankrike, GB: Storbritannien, GE: Georgien, GR: Grekland, HR: Kroatien, HU: Ungern, IE: Irland, IL: Israel, IS: Island, IT: Italien, JO: Jordanien, JP: Japan, KG: Kirgizistan, KR: Sydkorea, KW: Kuwait, KZ: Kazakstan, LT: Litauen, LU: Luxemburg, LV: Lettland, MD: Moldavien, MT: Malta, MU: Mauritius, NL: Nederländerna, NO: Norge, NZ: Nya Zeeland, PL: Polen, PT: Portugal, RO: Rumänien, RS: Serbien, RU: Ryssland, SE: Sverige, SG: Singapore, SI: Slovenien, SK: Slovakien, TH: Thailand, UA: Ukraina, US: USA, UZ: Uzbekistan.
Diagrammen (klicka för förstoring) visar förutsedda vs rapporterade (ln-transformerade) dödstal i hjärtsjukdom för kvinnor och män under och över 65 år i befolkningar med tillgängliga data för dödlighet och riskfaktorer i en multinivåanalys där länderna delas in efter GBD-region (se löptexten för närmare beskrivning). Landskoder som ovan.

Referenser

Prospective Studies Collaboration. 2002. ”Age-specific relevance of usual blood pressure to vascular mortality: a meta-analysis of individual data for one million adults in 61 prospective studies”. Lancet 360. http://www.ncbi.nlm.nih.gov/pubmed/12493255.

R Development Core Team. 2011. ”R: A Language and Environment for Statistical Computing”. http://www.R-project.org/.

Inga kommentarer: