Zelf een homogenisatie maken

Het KNMI stelt dat temperatuurreeksen gehomogeniseerd dienen te worden als er inhomogeniteiten in de reeks zitten.  Dat zijn  rare sprongetjes in de grafiek. Die inhomogeniteiten  kunnen het gevolg zijn van twee factoren, namelijk verandering van meetinstrument en verandering van meetlocatie. Die eerste factor is raar,  meetinstrumenten dienen immers geijkt te zijn. Dat geldt voor de weegschaal bij de slager, en dat geldt ook voor de meetinstrumenten van het KNMI. De minimale eis is dat de gebruikte thermometers grondig geijkt zijn en dat opeenvolgende instrumenten dezelfde (lineaire) respons geven over het te meten temperatuurgebied. Homogeniseren omdat er van meetinstrument gewisseld wordt is dus onnodig, tenzij men de ijking of de lineaire respons niet vertrouwt.

De tweede factor, verandering van meetlocatie, is interessant. Ik heb zelf als proef een homogenisatie gedaan. Daarvoor nam ik een temperatuurreeks van 1901 tot 1971 (op locatie A gemeten) en “na verplaatsing van de thermometer” een temperatuurreeks (op locatie B gemeten) vanaf 1971 tot en met 2016. Voor de eenvoud heb ik jaargemiddelde temperaturen genomen, afgeleid van maandgemiddelden. De totale meetreeks ziet er als volgt uit:

Duidelijk is de sprong in 1971 te zien.  De temperatuurreeks van locatie A is duidelijk warmer dan die van locatie B. Die sprong is de inhomogeniteit. Omdat ik dol ben op hele lange meetreeksen wil ik van die twee reeksen er één maken, maar zonder sprong. Dat doe ik door te homogeniseren. Het KNMI gebruikt daarvoor een geavanceerd statistisch model, ‘percentile matching’ genaamd, maar dat is voor mij en dit doel te ingewikkeld.  Ik gebruik een zeer eenvoudige homogenisatietechniek waardoor de oude reeks mooi aansluit bij de nieuwe. Na een beetje schatten (‘expert opinion’ 😉  ) heb ik de jaargemiddelden van de eerste reeks met 2° C verlaagd.  Het resultaat ziet u hier:

Dat ziet er netjes uit. In de titel ziet u dat de gehomogeniseerde reeks de naam van locatie B heeft gekregen. Bij de homogenisatie van de temperatuurreeksen door het KNMI in 2016 is dat ook gebeurd. In De Bilt was het maar een verplaatsing van een paar honderd meter, men bleef in De Bilt en de nieuwe reeks heet dan ook weer De Bilt.  De verplaatsing van Den Helder naar De Kooy was hemelsbreed over een afstand van 5 km, de locatienaam van de nieuwe reeks is De Kooy. En de verplaatsing van Groningen naar Eelde betrof 10  km (reeks Eelde), de verplaatsing van Vlissingen naar Souburg  (en terug) 1,8  km, de naam bleef Vlissingen. Alleen Maastricht behield zijn naam, terwijl de thermometer 9 km verplaatst werd naar Beek.

De beide reeksen zijn niet verzonnen maar zijn bestaande reeksen.  De eerste (locatie A) is van Nantes in West-Frankrijk, de tweede (locatie B) is van De Bilt.  De knip zit in 1971, want vanaf dat jaar is geen homogenisatie toegepast op de meetgegevens van De Bilt (nog niet althans). De maanddata van Nantes en De Bilt heb ik uit de ClimateExplorer van het KNMI, de links leiden u naar de betreffende pagina’s.

Natuurlijk is er hier geen sprake van verplaatsing  (herlocatie) van meetapparatuur in de letterlijke zin van het woord, maar het gaat me om de principiële vraag of bij verandering van meetlocatie de meetreeks dezelfde blijft. Dus ik doe alsof dit een herlocatie is, ook al is de afstand Nantes – De Bilt groot, hemelsbreed zo’n 750 km. Die hogere temperatuurwaarden zijn vooral het gevolg van het feit dat Nantes op lagere breedte ligt.  Ongetwijfeld zijn ook nog allerlei andere omgevingsfactoren in Nantes  anders dan in De Bilt.  Maar is dat ook niet het geval als je de thermometer van Maastricht naar vliegveld Beek verplaatst? Ik noem maar een paar dingen: in Maastricht werd op 20m boven het maaiveld gemeten, in Beek destijds op 2,2m hoogte.  En Beek ligt 65m hoger dan Maastricht. In Maastricht is ongetwijfeld sprake van een UHI-effect dat in Beek waarschijnlijk afwezig is, in Beek komt er zo nu en dan een Boeing langs, et cetera. De mate waarin die omgevingsfactoren verschillen doet er in principe niet toe, er is sprake van een nieuwe meting.

Bron: Campbell Scientific

Zijn er protocollen voor dergelijke herlocaties? Niet dat ik weet.  Wel zijn er regels over de opstelling van de meetapparatuur.  Zie figuur hierboven. Maar over de afstand van verplaatsingen van meetapparatuur niet. Je mag dus de thermometer van Nantes naar De Bilt verplaatsen. En blijkbaar mag je de meetreeksen aan elkaar ‘plakken’. En als de knik in de meetreeks je niet bevalt mag je door middel van homogenisatie die knik verwijderen. Meteorologische organisaties zijn daar vrij in (ik ook). 

Met iedere verplaatsing veranderen echter de omgevingsfactoren, de meetcondities, en daardoor de gemeten waarden. Het doet er in principe niet toe of die veranderingen groot of klein zijn. Daarom doet de verplaatsingsafstand er ook niet toe: het effect is dat de condities veranderen. Met iedere verplaatsing beëindig je een dus bestaande meetreeks en start je een nieuwe.  Denk ik.

Terug naar de gehomogeniseerde meetreeks van De Bilt. De reden voor de noodzaak van homogenisatie blijkt verandering van de omstandigheden te zijn. Dat betekent dat een temperatuurmeting van het KNMI conditioneel is, dat wil zeggen afhankelijk van allerlei, al dan niet regelbare, parameters. Zolang de invloed van die parameters op het resultaat niet nul of constant is, kan er niet gesproken worden van “De Temperatuur in De Bilt”, maar alleen van “een conditionele maat voor de temperatuur op een locatie in de Bilt”. Wat de relatie van het meetresultaat met de omstandigheden is, is onbekend en/of onvoldoende begrepen. Daarom wordt de correctie niet fundamenteel aangepakt (de invloed van de condities exact kwantificeren op basis van fysische of chemisch fundamentele gronden, of tot nul terugbrengen door een betere niet-conditionele meetmethode), maar achteraf via modellering.

De wens om de ene reeks met de andere te verbinden suggereert een kennis van de invloed van de condities, die, als die er geweest zou zijn, die correcties overbodig zou maken. Men praat dus in een cirkelredenering naar het resultaat toe. Dat is meet-technisch een doodzonde. Vanuit een fundamenteel principe van het meten van een grootheid is het toepassen van correcties op individuele data alleen toegestaan, als per meetresultaat de fysische aard en de grootte van de correctie precies kunnen worden gegeven. Om hele datareeksen door een mathematisch filter te halen om zo een veelvoud van veranderende condities (locatie, apparatuur, meethut, begroeiing, verstedelijking et cetera) te “corrigeren” is vanuit meettechnische principes mijns inziens volledig ongeoorloofd.

Bovendien zijn de resultaten van De Bilt voor en na de homogenisatie geijkt op die van Eelde. Het is streng verboden om meetresultaten te ijken op die van anderen. IJken doe je op een standaard, niet op de resultaten van je buurman, omdat dan geen sprake meer is van onafhankelijke meetgegevens. Dat is een hoofdwet.

Het KNMI kan mijns inziens 4 dingen doen met de huidige gehomogeniseerde meetreeks van De Bilt, in volgorde van wenselijkheid:

1                    De homogenisatie terugdraaien en afzonderlijke meetreeksen maken
2                    De homogenisatie terugdraaien, 1 gecombineerde meetreeks maken met vermelding van de herlocatie
3                    Alles laten zoals het nu is, met vermelding dat de gehomogeniseerde data geen gemeten temperaturen zijn maar modelmatig berekende waarden
4                    Alles laten zoals het nu is   

Alleen de eerste oplossing is meettechnisch correct. Niet alleen voor De Bilt, maar ook voor Den Helder, De Kooy, Groningen, Eelde, Vlissingen, Souburg, Beek en Maastricht. De gemeten waarden blijven “een conditionele maat voor de temperatuur” en niet “de temperatuur”. Immers, als je de thermometer een klein stukje verplaatst krijg je al afwijkende waarden. Daar valt wat mij betreft mee te leven, en men mag die “conditionele maat voor de temperatuur” ook wel “temperatuur” noemen. Maar niet die getallen verkregen door statistisch modelleren.  Dus de enige juiste hoogste junitemperatuur in De Bilt is die van 1917,  18,3 °C, gemeten op de rode locatie op onderstaande foto. Juni 2017 is een goede tweede met  een temperatuur van 18,0 °C op de groene locatie.