Nederland is de afgelopen eeuw warmer geworden. Vanaf 1901 t/m 2016 is de temperatuur in De Bilt ruim 1,6 °C gestegen. Het verloop van de temperatuur van jaar tot jaar in De Bilt is in bovenstaande grafiek met de blauwe lijn weergegeven. Het betreft de gestandaardiseerde maar niet gehomogeniseerde data van De Bilt. Die lijn danst flink op en neer, het ene jaar is duidelijk het andere jaar niet. Om te weten wat de trend is kun je er een lineaire trendlijn doorheen trekken. Dat is de rode lijn in de grafiek.
Nu is zo’n lineaire trend wel een stijve hark, want hij walst niet alleen de verschillen van jaar tot jaar plat, maar ook de langjarige schommelingen. In de grafiek hierboven is het verschil per jaar aangegeven tussen de temperatuur en de lineaire trendlijn. Zou de temperatuurreeks van De Bilt exact de lineaire trendlijn volgen dan zouden in deze grafiek alle punten op de y=0 lijn liggen. Maar dat is niet zo. In het midden liggen de punten lager dan aan de uiteinden. Je moet dus een methode gebruiken die wel de verschillen van jaar tot jaar (‘ruis’) gladstrijkt maar de grotere signalen in de reeks in tact laat. Je kunt bijvoorbeeld een voortschrijdend gemiddelde gebruiken over 5 of 10 jaren. Daarmee ‘smooth’ je het oorspronkelijke signaal.
Een veel toegepaste methode is het gebruik van een LOESS filter. Die heeft een paar voordelen ten opzichte van bijvoorbeeld een voortschrijdend gemiddelde. Een ervan is dat het resultaat de hele periode bestrijkt, dus in dit geval van het eerste t/m het laatste jaar. In de grafiek hierboven heeft het KNMI dat LOESS filter gebruikt om te laten zien wat er met de temperatuur in De Bilt tussen 1901 en 2013 is gebeurd. De grafiek stamt uit het rapport “KNMI ’14 – klimaatscenario’s voor Nederland” . Dat is schrikken: vanaf 1970 priemt de smoothlijn dreigend onder een hoek van ongeveer 45° naar de hoek rechtsboven. Dat belooft wat voor de toekomst!
Ik was benieuwd hoe het KNMI aan die alarmerende lijn gekomen is. Daarom heb ik met behulp van een LOESS utility in Excel de smoothlijn van het KNMI gereproduceerd. Dit is het resultaat:
De roodbruine lijn in mijn grafiek is (op het oog) identiek aan de dikke blauwe lijn in de grafiek van het KNMI. Door een aantal keren het LOESS filter te laten rekenen kreeg ik uiteindelijk de lijn die lijkt op die van het KNMI. Dat doe je door een bepaalde ‘span’ (α) te kiezen. De span (een getal tussen 0 en 1) bepaalt samen met het totaal aantal datapunten (in dit geval 113 jaren) hoeveel datapunten het filter gebruikt voor elke stap die het programma maakt om de smoothlijn te berekenen. Hoe meer datapunten je gebruikt des te minder details overblijven van de oorspronkelijke reeks. Zo is dat ook met het LOESS filter. Hieronder is te zien wat er met de smoothlijn gebeurt als je een hoge of lage span gebruikt. Span 0.1 gebruikt 11 datapunten, span 0.9 gebruikt 101 datapunten:
Gebruik je een span van 0.01 dan wordt het aantal gebruikte datapunten 1 en is de lijn identiek aan de temperatuurreeks. Gebruik je een span van 1 dan omvat het aantal voor de ‘moving regression’ gebruikte datapunten alle punten op de x-as en wordt de uitkomst een lineaire trendlijn.
Voor mijn reconstructie van de KNMI-grafiek heb ik een span gebruikt van 0.65 . Bij die span lijkt mijn smoothlijn het meest op die van het KNMI. Een span van 0.65 betekent dat er maar liefst 73 datapunten (jaren) gebruikt worden. In de temperatuurgrafiek van De Bilt zijn er in totaal 113 datapunten. Dus meer dan de helft van het totaal aantal datapunten wordt gebruikt om de smoothlijn te maken. Dat is bij een reeks met 1000 datapunten niet erg, maar in een reeks met maar 113 datapunten verdwijnt daardoor ieder detail. Daarom ligt er een knik in de KNMI-grafiek rond 1970, terwijl in de temperatuurgrafiek er pas in 1988 een sprong waar te nemen is. En daarom ook vlakt die lijn naar het einde toe niet meer af maar blijft vanaf 1970 stijgen.
Met een reeks van 113 datapunten moet je een lage span nemen, anders vallen vrijwel alle details weg. Ik heb wat uitgeprobeerd en bij een span van 0.2 (dat is 22 datapunten) krijg ik een smoothlijn die voldoende details intact laat en toch de ruis van jaar tot jaar elimineert. De grafiek hierboven laat dat zien. Als ik dan ook de verticale as bij 0 laat beginnen dan komt de grafiek er zo uit te zien:
Vergelijk dat eens met de tweede grafiek van boven, die van het KNMI. Een wereld van verschil, nietwaar? De grafiek hier onder loopt door t/m december 2016, met een LOESS span van 0.2:
Misschien dat u zich afvraagt waarom het KNMI gekozen heeft voor die span van 0.65 in plaats van bijvoorbeeld 0.2? Daarover wordt niets geschreven. Van onwetendheid bij het KNMI op het gebied van statistiek is zeker geen sprake. Maar misschien dat men gekozen heeft voor die veel te hoge span van 0.65 juist doordat dan het rechtse deel van de smoothlijn zo dreigend omhoog steekt in plaats van de afvlakking van de temperatuur sinds 2000 te volgen. Vanwege het visueel effect dus. Dat zou me niet verbazen, het KNMI heeft er de laatste jaren een handje van om de ‘dreigende klimaatcrisis’ prominent aan de orde te stellen, om het maar eens zo uit te drukken. De druk vanuit de groene clubs, windmolenbouwers, de VN (IPCC) en de rijksoverheid in die richting is groot. Dat zou dan ook verklaren waarom men de y-as bij 7 laat beginnen in plaats van bij 0.
De Britse staatsman Benjamin Disraeli zei ooit: “There are three kinds of lies: lies, damned lies and statistics”. En zo is het, ik heb hierboven getoond dat een beetje draaien aan de ‘spanknop’ van het LOESS filter het aanzicht van de temperatuurgrafiek van De Bilt wezenlijk kan veranderen. Dat draaien aan de spanknop gebeurde overigens ook bij de homogenisatie van de temperatuurdata van De Bilt. Daarom ga ik voorlopig uit van de niet gehomogeniseerde temperatuur. Details over die homogenisatie volgen zo spoedig mogelijk.