Warme junimaand en de homogenisaties van de temperatuur van De Bilt

In het vorige bericht ontdekte ik dat er de afgelopen 2 jaar maar liefst 3 verschillende top-10 lijstjes bestaan van de warmste junimaanden sinds 1901. Dat is het gevolg van het ‘aanpassen’ van de gemeten temperaturen, het zogenaamde homogeniseren. Homogenisaties worden toegepast als er bijvoorbeeld verandering van locatie van het meetpunt plaatsvindt, of verandering van de meethoogte of meetapparatuur.

Bron:  KNMI

In bovenstaande tabel is te zien dat er in De Bilt zo nu en dan veranderingen in het temperatuurmeetpunt plaats hebben gevonden. Waarschijnlijk de grootste verandering vond plaats in 1950, toen de oude pagodehut nabij het hoofdgebouw van het KNMI verruild werd voor een Stevensonhut een eind verderop. Die verplaatsing is overigens niet aangegeven in de tabel. Dergelijke veranderingen veroorzaken normaal gesproken sprongen in de meetreeks. Om dat te voorkomen wordt vaak gedurende een periode op beide plaatsen of met beide instrumenten gemeten om de verschillen op te heffen. Het is natuurlijk de vraag wat de basis vormt voor de de calibratie, de oude of de nieuwe data?  Homogenisatie met ingewikkelde statistische methoden is een andere manier, waarbij soms decennia na de metingen die metingen worden aangepast.  Dat gebeurde de afgelopen jaren met de data van o.a. De Bilt. Wie zijn hart op wil halen kan dit technische rapport uit 2016 eens lezen.

De reeds in het vorige bericht aangehaalde Amerikaanse statisticus Briggs zegt hierover:  “In the notes to the data it said in 1950 there was “relocation combined with a transition of the hut”. Know what that means? It means that the data before 1950 is not to be married to the data after that date. Every time you move a thermometer, or make adjustments to its workings, you start a new series. The old one dies, a new one begins. If you say the mixed marriage of splicing the disjoint series does not matter, you are making a judgment. Is it true? How can you prove it? It doesn’t seem true on its face. Significance tests are circular arguments here. After the marriage, you are left with unquantifiable uncertainty.  This data had three other changes, all in the operation of the instrument, the last in 1993. This creates, so far, four time series now spliced together.”

Er is geen woord Spaans bij lijkt me.

Ik ben verder gedoken in die homogenisaties van de temperatuurdata van De Bilt. Van diverse kanten vernam ik al dat de ‘aanpassingen’ van die data tot opvallend grote verschillen hebben geleid. Ik heb daarom een vergelijking gemaakt tussen de niet-gehomogeniseerde maandtemperaturen van De Bilt en de gehomogeniseerde maanddata.

Het betreft de periode 1901 t/m 2016. Voor alle zekerheid: de data zijn vandaag van de website van het KNMI gehaald.

Data: KNMI

In bovenstaande grafiek is te zien wat homogenisatie van de temperatuur in De Bilt voor invloed heeft op de jaargemiddelden. De data zijn t/m 1970 gehomogeniseerd. Het lijkt er op dat er (minstens) twee homogenisaties hebben plaats gevonden, namelijk een op de data van 1901 tot (ongeveer) 1955, en de tweede (of meer) voor de data t/m 1970. Voor de periode tot 1955 betekent de homogenisatie dat voor alle jaren de gehomogeniseerde jaartemperatuur lager uitvalt dan de jaargemiddelden op basis van de ruwe data. Voor de periode van 1955 t/m 1970 leiden de aanpassingen grotendeels tot een verhoging van de temperaturen m.u.v. het jaar 1969.

Data: KNMI

Splitsen we de data in seizoenen dan is in bovenstaande grafiek te constateren dat voor wat betreft de eerste periode (1901-1955) de verschillen tussen gehomogeniseerde en ruwe  wintertemperaturen vrijwel 0 zijn, terwijl de zomertemperaturen door homogenisatie fors zijn verlaagd, gemiddeld zelfs met ~ 0,5 °C. Herfst- en lentetemperaturen vallen door homogenisatie ook lager uit met respectievelijk ~0,2 en ~0,1 °C.

Voor de periode 1955-1970 is het beeld veel rommeliger en lopen de lijnen chaotisch door elkaar. Hier is klaarblijkelijk een andere systematiek van homogeniseren toegepast dan op de data van de eerste helft van de 20e eeuw.

Data: KNMI

Tenslotte heb ik natuurlijk de maand juni eens geïnspecteerd (zie grafiek hierboven). Het beeld is duidelijk. Opvallend zijn de 3 jaren waarin de junitemperaturen met maar liefst 0,6 °C zijn verlaagd, namelijk 1917, 1930 en 1950. De eerste twee spelen een rol in de top-10 van warmste junimaanden. Het jaar 1917 is vanwege die enorme ‘aanpassing’  van de gemeten temperaturen zijn plaats als aanvoerder van de top-10 sinds enkele dagen kwijt. Het jaar 1930 is door de aanpassing van plaats 4 naar plaats 7 geduikeld.

Ik sluit af met een quote van Briggs:  “Don’t use statistics unless you have to… Most statistical models stink and they are never checked on new data, the only true test ” .