Die warme aprilmaand deel 1

 Blauwe stippen betreffen de jaarlijkse gemiddelde temperatuur, rode stippen de gemiddelde temperatuur in april. De lijnen zijn de polynomiale trendlijnen [rangorde 7].
Bron: Meteorologica

Een vakbroeder wees me onlangs op een artikel in het Meteorologica. Onderzoeker Aarnout van Delden van de universiteit van Utrecht heeft in het juninummer een interessant artikel geschreven over de warme aprilmaanden ven de afgelopen decennia. Hij constateert dat de aprilmaanden in ons land de afgelopen 40 jaar veel sneller zijn opgewarmd dan andere maanden. Van Delden berekent dat de jaargemiddelde temperatuur in De Bilt sinds 1901 ruim 2 °C gestegen is terwijl april maar liefst 3,5 °C steeg.  Dat laatste lijkt me nogal fors. De trendlijnen in de eerste grafiek zien er inderdaad indrukwekkend uit. Op basis van de grafiek constateert Van Delden dat nu de gemiddelde apriltemperatuur gelijk is geworden aan de gemiddelde jaartemperatuur, beide trendlijnen convergeren inderdaad in 2019 naar 11 °C.

Ik was benieuwd of ik tot dezelfde constateringen zou komen als Van Delden, en maak gebruik van de  ongehomogeniseerde temperatuurreeksen van het KNMI. In de officiële (gehomogeniseerde) temperatuurreeksen van De Bilt zijn de meetgegevens tussen 1 januari 1901 en 1 september 1951 ‘gecorrigeerd’ met behulp van een statistische techniek. Gecorrigeerd betekent dat data in de meeste gevallen naar beneden zijn bijgesteld. Die correctie is omstreden, zie dit rapport van ondergetekende en Jan Ruis, Frans Dijkstra en Marcel Crok. Daarom gebruik ik de niet-gehomogeniseerde  maar wel gestandaardiseerde cijfers, tenzij anders vermeld.

Data: KNMI

In de grafiek hierboven heb ik de gemiddelde jaarlijkse temperatuur weergegeven van 1901 t/m 2018. De stippellijn is de regressielijn, de formule staat rechtsonder. Met behulp van de formule van de trendlijn kun je berekenen hoe groot de toename van de gemiddelde jaarlijkse temperatuur in De Bilt is geweest tussen januari 1901 en december 2018. Ik kom uit op 1,72 °C, Van Delden komt op ruim 2 °C, zie tekst hier onder:

Bron: Meteorologica

De volgende grafiek toont zowel de jaartemperatuurreeks als die van de maand april,  inclusief de lineaire trendlijnen:

Data: KNMI

De stijging van de gemiddelde apriltemperatuur tussen 1901 en 2018 bereken ik op 2,00 °C, Van Delden komt op 3,5 °C. Het opvallende verschil in de uitkomsten  kan te maken hebben met de vraag of er al of niet gehomogeniseerde cijfers zijn gebruikt. Daarom heb ik op basis van de gehomogeniseerde data de vergelijking herhaald. Dit is het resultaat:

Data: KNMI

Deze grafiek wijkt niet sterk af van die op basis van de niet-gehomogeniseerde data. Ik zie een toename van de gemiddelde jaartemperatuur tussen 1901 en 2018 op basis van de gehomogeniseerde Tg van 1,93 °C, terwijl de aprildata een toename laten zien van 2,07 °C, een verschil van 0,14 °C.

Misschien is ook de lengte van de gebruikte periode een verklarende factor voor de grote verschillen van april tussen mij en Van Delden. Uit de eerste grafiek in dit bericht en de tekst maak ik op dat Van Delden april 2019 waarschijnlijk in de berekeningen meegenomen heeft. Het jaargemiddelde van 2019 is natuurlijk afwezig. In onderstaande tabel heb ik tussen haakjes de cijfers van april 2019 (10.9 °C) meegenomen in de berekeningen. De uitkomsten:

Bron: Meteorologica

De verschillen tussen de cijfers van Van Delden en die van mij zijn erg groot, vooral voor april. De cijfers zijn iets hoger bij de gehomogeniseerde data dan bij de niet-gehomogeniseerde data. Oorzaak is dat de homogenisatie  alleen betrekking heeft op de cijfers van 1 januari 1901 tot 1 september 1951. Die correctie betekende dat de oudere meetdata vooral naar beneden zijn bijgesteld. Gevolg is dat door de homogenisatie de hoek van de trendlijnen iets steiler wordt.

Opvallend is dat in de tabel de toename van de gehomogeniseerde cijfers in de laatste twee kolommen bij de jaardata groter is dan bij de aprildata. Dat komt omdat de correcties vanwege de homogenisatie door de gebruikte statistische methode het grootst zijn bij de hoogste temperaturen. Omdat die nauwelijks in april voorkomen maar wel in de zomermaanden is de gemiddelde grootte van de correcties (naar beneden) per jaar groter dan in april.

Omdat ik opvallende verschillen vond wat betreft de lineaire trend van jaargemiddelden en aprilgemiddelden was ik nieuwsgierig of ik de polynomiale trendlijnen uit de eerste grafiek zou kunnen reproduceren. Hieronder de grafiek met (niet gehomogeniseerde) jaardata met polynomiale trendlijn. De [6] betekent rangorde 6. Van Delden gebruikt rangorde 7 maar Excel gaat maar tot 6. Ik heb april 2019 meegerekend.

Als ik mijn grafiek vergelijk met de eerste grafiek van Van Delden dan valt op dat de polynomiale trendlijn van april in mijn grafiek op twee punten afwijkt. In de eerste plaats buigt in mijn grafiek de april-trendlijn na 2010 naar beneden, in de grafiek van Van Delden komen beide trendlijnen in 2019 bij elkaar. In de tweede plaats is de bult in de april-trendlijn tussen 1930 en 1950 in mijn grafiek veel geprononceerder aanwezig. Ik kan me moeilijk voorstellen dat die verschillen te verklaren zijn uit het feit dat ik een rangorde 6 in plaats van 7 heb gebruikt.

Blijft de vraag knagen hoe de verschillen tussen mijn berekeningen en die van Van Delden verklaard kunnen worden. Die verschillen zijn voor de jaardata klein, maar voor april erg groot. Er is maar één verklaring mogelijk: Van Delden heeft zijn toename van de jaarcijfers ( ruim 2 °C) en van de aprilcijfers (3,5 °C) gebaseerd op de polynomiale trendlijnen in zijn grafiek! Het verschil tussen begin- en eindpunt van de polynomiale trendlijnen bepalen hier klaarblijkelijk de temperatuurtoename van de jaar- en aprilreeks. De reden dat ik dat pas in een laat stadium zag is dat dat zeer ongebruikelijk is. Toe- of afname van een tijdreeks wordt bepaald met behulp van de lineaire trend, niet met een polynomiale trendlijn. Een polynomiale trendlijn is een functie waarvan de uitkomst sterk afhankelijk is van de keuze van de rangorde. Van Delden kiest voor rangorde 7, dit is zijn motivatie:

Bron:  Meteorologica

Kies je echter een andere rangorde, zoals ik [6], dan heeft dat invloed op de trendlijn. Als je zoals Van Delden de polynomiale trend gebruikt om de mate van stijging van de temperatuurreeks te berekenen dan krijg je bij elke andere rangorde een andere uitkomst. Bovendien is de stelling dat de rangorde zo hoog mogelijk moet zijn aanvechtbaar. Elke stap hoger in rangorde levert een extra buigpunt in de polynomiale trendlijn. Meer buigpunten lijken weliswaar een betere fit van de trendlijn tot gevolg te hebben, maar het gevaar is dat er dan schijnbuigpunten kunnen ontstaan die in de grafiek niet zichtbaar zijn .

Omdat ik nieuwsgierig was of ik de polynome trendlijnen in de grafiek van Van Delden kon reproduceren heb ik voor de rangorde 3 t/m 6 grafieken gemaakt. Om vergelijking makkelijker te maken begint mijn y-as ook in 4 en heb ik de x-as gecropt. Het beste resultaat levert een polynoom met rangorde [4] die de grafiek van Van Delden op het zicht perfect reproduceert:


Deze grafiek levert zoals de grafiek van Van Delden een ‘polynomiale stijging’ van de jaargemiddelden op van iets meer dan 2 °C en van de aprilgemiddelden van 3,5 °C.

Polynoom met rangorde 6 levert de volgende grafiek op:


De polynoom van de jaarlijkse cijfers blijft ruim 2 °C, maar die van de aprilgemiddelden zakt naar 1,6 °C.

Het merkwaardige is dat je in de grafiek van Van Delden al kunt zien dat de polynoom van april nooit de rangorde [7] kan hebben. Een polynoom met die rangorde heeft 5 buigpunten, de polynoom van april in Van Deldens grafiek heeft er minder.

Bron: wikipedia

De vorige alinea’s en figuren zijn eigenlijk overbodig: de mate van stijging van een tijdreeks stel je vast met behulp van de lineaire regressielijn en niet met een polynomiale trendlijn.

Tot slot: elke trend in een temperatuurreeks is sterk afhankelijk van de keuze van het startjaar. Dat heeft te maken met de aanwezigheid van cycli in het signaal, bijvoorbeeld de AMO.  Het KNMI gebruikt voor haar tijdreeksen als startjaar 1901. Dat jaar ligt in een dal van de AMO, waardoor de trend van temperatuurreeksen versterkt wordt. Zou het startjaar bijvoorbeeld 1860 zijn geweest dan worden de trends aanzienlijk lager.

Polynomiale trendlijnen zijn extra gevoelig voor de keuze van het startjaar en laatste jaar. Van Delden heeft er voor gekozen om de reeks niet te laten eindigen in 2018 maar de aprilreeks april 2019 mee te nemen. Dat heeft nogal wat gevolgen voor de polynomiale trend:

In de reeks van april die tot 2019 loopt is het verschil tussen het begin van de reeks in 1901 en het einde, 2019, ongeveer 1,6 °C. Had Van Delden april 2019 niet meegenomen dan was het verschil niet 1,6 °C  geweest maar slechts 0,8 °C .

Over de AMO en een paar andere aspecten van de publicatie volgende keer meer.