torsdag 25 augusti 2011

Periodkrångel

Jag har skrivit en del här om Jucketts och Rosenbergs modeller för åldersrelaterad orsaksspecifik dödlighet, och jag tyckte att det kunde vara av intresse att se hur väl de går att passa in på nutida svenska data. Det innebär en del problem. För att göra meningsfulla jämförelser mellan olika orsaker av det slag de gör, bör vi för det första ha en någorlunda uttömmande lista över dödsorsaker, där de olika posterna representerar avgränsade bakomliggande mekanismer. Klassifikationen ICD-10, som används för statistiken, är nog inte idealisk i detta avseende, och finns ett praktiskt taget oändligt antal olika partitioner av denna (jämför ”den vanligaste dödsorsaken”-problemet jag skrev om här 28 juli 2008).

Jag utgick från år 2008, då det är det senaste året med svensk statistik tillgänglig hos WHO, där tabellerna är indelade i femårsintervall upp till det öppna intervallet 95+ år. Socialstyrelsens rapporter har 90+ som öppet intervall, vilket kan vara en nackdel när man intresserad av beteendet hos dödsorsaker där en stor andel av dödsfallen inträffar i hög ålder, även om användbarheten hos data för de översta grupperna ofta är begränsad, på grund av litet antal dödsfall och stor risk för tillfälliga avvikelser. Vidare inkluderade jag alla ICD-10 tredjepositionskoder (som ofta täcker relativt avgränsade sjukdomar) med fler än 100 dödsfall hos kvinnor eller män. På så sätt fick jag fram 135 sjukdomskohorter, 71 kvinnliga och 64 manliga, som inkluderade ca 85 procent av den totala dödligheten i Sverige detta år. Jag fick också ungefärliga motsvarigheter till de allra flesta posterna i den lista J&R använde (som bygger på den äldre klassifikationen ICD-8), plus ytterligare några som fått ökad betydelse för åldersrelaterad dödlighet på senare år, som Alzheimers sjukdom.

Nästa steg är att bygga en fördelningskurva för livslängden hos de som dött av de olika orsakerna. Om man använder sig av den faktiska fördelningen av antalet dödsfall kan det resultera i oönskat inflytande från faktorer som påverkar de olika kohorternas storlek, som lägre antal födda och högre barndödlighet i äldre kohorter. Jag utgick då från den förväntade andelen döda per 5-årsintervall enligt SCB:s livslängdstabeller från 2008 och multiplicerade sedan andelen dödsfall i de olika orsakerna i varje intervall. Genom att beräkna varje åldersgrupps andel av summan över åldersgrupperna, fick jag en justerad fördelningskurva, som kunde användas för att bygga överlevnadskurvor för de olika orsakerna.

Jag passade sedan in överlevnadskurvorna (med hjälp av RExcel (1)) på både den enkla Weibullfunktionen ((W5) i förra inlägget) och Gompertzfunktionen för överlevnad (där parametrarna är r(0) och α, som beskrivs i inlägg här den 12 augusti, och andelen överlevande vid x, S(x)=exp[−(r(0)/α)(exp(αx)−1)]). Jag använde mig, i likhet med J&R, av icke-linjär regression, viktad efter roten av antalet döda i varje åldersgrupp, och jag använde mig av deras test för avvikelse mellan beräknad och faktisk överlevnad i (2). Båda funktionerna passade generellt kurvorna väl. J&R såg att Weibullfunktionen passade bättre in på mer specifika orsaker), vilket jag inte kunde se.

En av J&R:s käpphästar är att det finns två frihetsgrader för orsaksspecifik överlevnad, som beskrivs av deras modifierade Weibullfunktion (WJR1) i förra inlägget, dels formparametern a, som avgör hur snabbt dödligheten ökar med åldern, dels lägesparametern q (p×Δτ i deras slutliga formulering, se nedan), som avgör vid vilken ålder andelen överlevande når ett visst värde, exp(−λ) – i (2) sattes ln λ till 1,55, vilket motsvarar ca 0,9 procent överlevande. Utifrån detta skall a och q vara oberoende av varandra. Diagrammen nedan visar för det första att de båda parametrarna i (W5), a och τ, inte är okorrelerade, utan det finns ett starkt positivt samband. Som påpekades i förra inlägget anger τ den ålder då ca 37 procent är kvar i livet; vi ser också att de kvinnliga kohorterna generellt har högre τ-värden än de manliga, vilket reflekterar kvinnornas längre livslängd. Däremot finns inget tydligt samband mellan värdet på a och åldern då den linjäriserade överlevnadskurvan korsar 1,55 (motsvarar alltså värdet på logaritmen av deras λ-konstant), vilket är i linje med deras teori; vi ser också en klustring kring 100 års ålder för de flesta kohorter. J&R har också hittat periodmönster hos både a och q, som innebär att a blir en heltalsparameter, och att q delas upp i en heltalsparameter p och en konstant Δτ. Jag har nu inte försökt mig på att optimera λ och den konstanta versionen av τ för att få ett sådant periodmönster.

Jag skrev här den 29 juli om hur de också hittat ett tredje periodmönster när det gäller de olika dödsorsakernas andel av den totala dödligheten. Jag försökte mig på att testa också detta på de svenska data jag hade, med den summa över förväntad andel dödsfall åldersgrupperna jag beskriver i tredje stycket som justerad andel för varje orsak, och de deskriptiva metoder de beskriver i (3), men jag har inte kunnat hitta något tydligt mönster av det slag de beskriver. Det kanske har att göra med de problem jag beskrev i första stycket; det kan hända att partition av dödsorsakslistan jag använde inte, för dagens Sverige, matchar de bakomliggande mekanismer som skulle ge upphov till det periodmönster de beskriver.

Diagrammen (klicka för förstoring) visar korrelation mellan Weibullparametrarna a och τ, och mellan a och ålder y, då ln(−ln S(y))=1,55, för 135 dödsorsakskohorter i Sverige 2008. Data tillgängliga via WHO och SCB.

(1) Baier, T. och Neuwirth, E., Excel :: COM :: R, Computational Statistics 2007, http://www.springerlink.com/content/0943-4062/22/1/

(2) Juckett, D.A. och Rosenberg, B., Comparison of the Gompertz and Weibull functions as descriptors for human mortality distributions and their intersections, Mech. Ageing Dev. 1993, http://www.ncbi.nlm.nih.gov/pubmed/8377524

(3) Juckett, D.A. och Rosenberg, B., An unexpected periodicity among the prevalences of human age-related, mortal diseases, Mech Ageing Dev. 1991, http://www.ncbi.nlm.nih.gov/pubmed/1890878

Inga kommentarer: