Bron: tylervigen
In bovenstaande grafiek zijn voor de periode 1999-2009 weergegeven het jaarlijks aantal mensen dat in de USA werd vermoord met behulp van hete dampen en hete objecten en de leeftijd van miss America. De grafieken lijken sterk op elkaar en als je de correlatiecoëfficiënt gaat berekenen dan blijkt die best hoog (r=0,870127). Toch zullen er weinig mensen zijn die geloven dat er ook echt een oorzakelijk verband bestaat tussen de twee fenomenen. Er is dus wel sprake van een correlatie maar niet van een causale relatie.
Bron: tylervigen
In de tweede grafiek wordt het aantal verkochte Japanse auto’s afgezet tegen het aantal zelfmoorden door autocrashes. De correlatie tussen beide grafieken is hoog: r=0,9357. Maar nu zal de vraag of het een met het ander te maken heeft iets lastiger zijn, omdat een oorzakelijk verband niet onmogelijk is. Immers, stel dat een deel van de bestuurders van Japanse auto’s erg ongelukkig is met hun auto, dan zou dat – in combinatie met andere factoren- in ernstige gevallen tot een dergelijke zelfmoord kunnen leiden. Ook hier helpt denk ik het gezonde verstand: veel mensen weten dat Japanse auto’s over het algemeen zeer goed geconstrueerd zijn en waarschijnlijk geen aanleiding geven tot zelfmoordgedachten. Die correlatiecoëfficiënt van 0,9357 is dus blijkbaar nog steeds onvoldoende hoog.
Hoe zit dat in de wetenschap, wat is ‘weten’ ? In de wetenschap is een theorie een getoetst model ter verklaring van waarnemingen van de werkelijkheid. Een hypothese is een stelling die een theorie ondersteunt. De juistheid van een theorie kan volgens Karl Popper nooit absoluut bewezen worden. Je kunt bijvoorbeeld veel waarnemingen doen die de theorie bevestigen, maar nooit uitsluiten dat er ooit een waarneming komt die in strijd is met de theorie.
Toch zijn die waarnemingen van groot belang in de wetenschap. Als er veel waarnemingen zijn die in dezelfde richting wijzen dan ondersteunen die de hypothese en dus de eventuele achterliggende theorie. Voorwaarde is natuurlijk wel dat die waarnemingen reproduceerbaar zijn. Dergelijke waarnemingen zijn bij uitstek laboratoriumexperimenten en die zijn in de klimatologie schaars.
Er worden in de klimatologie vele waarnemingen gedaan, de meeste in het open veld inclusief allerlei ‘storende’ externe factoren. Die waarnemingen worden vaak uitgedrukt in tijdreeksen, zoals bijvoorbeeld de tijdreeks van de gemiddelde temperatuur op aarde tussen 1900 tot 2020. Verdere verwerking van deze data gebeurt dan met behulp van statistisch onderzoek naar bijvoorbeeld correlaties tussen tijdreeksen.
In de klimatologie is een belangrijke theorie die van de door de mens veroorzaakte opwarming, de AGW (Anthropogenic Global Warming). Die berust op een tweetal hypotheses:
- Door de mens veroorzaakte stijgende emissies van CO2 als gevolg van het gebruik van fossiele brandstoffen veroorzaken stijgende atmosferische gehaltes CO2
- Stijgende atmosferische gehaltes aan CO2 veroorzaken stijgende temperaturen aan het aardoppervlak
Beide hypotheses worden verbonden door het feit dat CO2 een broeikasgas is. Dat laatste is empirisch vastgesteld in een laboratorium. De vraag die ik aan de orde stel is of de mogelijke correlaties in beide hypothesen ook statistisch gezien causaal zijn. In dit bericht beperk ik me tot de eerste hypothese, de CO2 emissies als gevolg van het gebruik van fossiele brandstoffen en de daaruit voortvloeiende (volgens de hypothese) toename van het atmosferisch CO2.
Ik gebruik de CO2 emissiedata per land per jaar van 1960 t/m 2018, beschikbaar via het GlobalCarbonProject. De globale emissie per jaar is de som van alle landelijke emissies per jaar, uitgedrukt in Gt. Voor het atmosferisch CO2 cijfers gebruik ik de Mauna Loa CO2 annual mean growth rates van NOAA in ppm. Om ppm om te zetten naar Gt maak ik gebruik van de conversietabellen van CDIAC. Daarin is 1 ppm CO2= 2,13 GtC en 1 Gt C=3,664 Gt CO2. 1 ppm is derhalve 7,8 Gt CO2.
Het is bij correlatie-onderzoek van belang dat de data dezelfde tijdschaal hebben, in dit geval een jaar. De grafiek van de brondata ziet er dan zo uit:
Data: GlobalCarbonProject en NOAA
Te zien is dat er in beide tijdreeksen sprake is van een stijgende langjarige trend. Opvallend is dat de afwijkingen in de atmosferische growth rates ten opzichte van de trendlijn veel groter zijn dan van de emissies. De hypothese van het IPCC is dat de stijging van het atmosferisch CO2 het gevolg is van antropogene CO2-emissies.
In onderstaande grafiek zijn de CO2 emissies afgezet tegen de jaarlijkse toename van het atmosferisch CO2:
De correlatiecoëfficiënt tussen beide tijdreeksen is r = 0,743558. Het kwadraat van de correlatiecoëfficiënt (r^2) wordt de determinatiecoëfficiënt genoemd. Deze geeft aan welk gedeelte van de variatie in de ene variabele door de andere wordt verklaard. r^2 = 0,552879. Maximaal mogelijk is r=1 dus ook r^2=1 .Er is dus in de brondata sprake van een positieve correlatie die tamelijk sterk is. De correlatie wordt vervolgens getest op statistische significantie met een P-waarde van 0,001 overeenkomstig “Revised standards for statistical evidence” van PNAS (2014) en blijkt statistisch significant.
Er schuilt hier echter een flinke adder onder het gras die te maken heeft met de eigenschappen van tijdreeksen. In diverse studies is aangetoond dat niet-gerelateerde tijdreeksen met een gemeenschappelijke trendrichting vaak valse correlaties vertonen (Podobnik et al (2008), Kun Hu et al (2001), Munchi (2016).
Als beide reeksen eenzelfde richting vertonen voor wat betreft hun langjarige trend dan blijkt die overeenkomst op zich al oorzaak van een sterkere correlatie tussen de reeksen. Om te zien of er werkelijk van een correlatie sprake is tussen twee tijdreeksen moeten de trends uit beide reeksen worden verwijderd. Daarna wordt van de detrended reeksen de correlatiecoëfficiënt berekend.
In bovenstaande grafiek is van beide reeksen de trend verwijderd. De detrended correlatie moet aantonen of de bewegingen van de twee detrended reeksen afhankelijk dan wel onafhankelijk van elkaar bewegen. Op het oog is in deze grafiek geen correlatie tussen beide reeksen waar te nemen. Na berekening is de correlatiecoëfficiënt r = 0,136798 en r^2= 0,018714. Er is na het detrenden dus nauwelijks sprake van een correlatie tussen beide reeksen. De correlatie is bovendien statistisch niet significant.
Dat betekent dat de atmosferisch CO2 data statistisch niet door de antropogene CO2 emissies verklaard kan worden. De combinatie van een correlatie in de brongegevens en het ontbreken van een correlatie in de gedetrende reeksen geeft aan dat de correlatie in de brongegevens voortvloeit uit een gedeelde opwaartse langetermijntrend en dat die trend van een externe factor afkomstig moet zijn.
Dit resultaat is niet in overeenstemming met de AGW-theorie van het IPCC die uitgaat van de hypothese dat de waargenomen toename van atmosferische CO2 het gevolg is van emissies van fossiele brandstoffen. De correlaties tussen de tijdreeksen van de brondata (niet detrended) kunnen dus niet dienen als empirisch statistisch bewijs ter ondersteuning van de AGW theorie. Munshi (2017) kwam tot dezelfde conclusies bij een analyse van emissiedata en atmosferische CO2 data van 23 meetstations over de periode 1967-2015.
Dat wil overigens niet zeggen dat antropogene CO2 emissies geen invloed hebben op de CO2-gehaltes van de atmosfeer. Maar door het wegvallen van statistisch empirisch bewijs zal hypothese 1 en dus ook de AGW theorie het vooral moeten hebben van een ijzersterke deductieve redeneerwijze binnen de AGW theorie, alsmede valide andere hypotheses. Die theorie is gebouwd rond de koolstofkringloop. Ik heb echter al vaker laten zien dat die kringloop gebaseerd is op veel aannames en grote onzekerheidsmarges.
Data: NOAA
Wat in dit artikel gevonden is, namelijk de afwezigheid van een statistische correlatie tussen CO2 emissies en atmosferisch CO2, is in overeenstemming met het ontbreken van enige reactie in het atmosferisch CO2 signaal als gevolg van de scherpe daling van de CO2 emissies in het voorjaar van 2020. In een recent artikel heb ik laten zien dat die sterke afname van de CO2 emissies als gevolg van de coronacrisis niet geleid heeft tot een zichtbare afname van het atmosferisch CO2-gehalte.
De AGW theorie is een deductieve theorie, gebaseerd op een top-down methodiek. Men bouwt eerst een theorie en test daarna met behulp van onderzoek de hypotheses waarop de theorie gebaseerd is. Deugen de hypotheses niet dan deugt de theorie niet.
De brandende vraag (ook voor mij) is hier natuurlijk wat die externe factor of factoren dan wel zijn die ervoor zorgen dat zowel de emissie cijfers als de atmosferische cijfers een opwaartse trend vertonen. Nogmaals: er zal ongetwijfeld een sprake zijn van enige invloed van antropogene CO2 emissies op de atmosferische CO2 cijfers. De statistische analyse van de detrended data toont in ieder geval aan dat die invloed erg klein is.
Een volgende keer meer over deze materie.