Onlangs schreef ik een artikeltje over de zeer natte oktobermaand van 2023. Mijn conclusie was dat de hoge neerslag op station De Bilt géén voorbode was voor natter wordende oktobers in de nabije toekomst, zoals Peter Siegmund van het KNMI verwacht. Die natte oktobermaand was een ‘outlier’, een uitschieter in de tijdreeks. Ook in het wetenschappelijk rapport dat ten grondslag ligt aan de recente KNMI’23 klimaatscenario’s geven 3 van de 4 neerslagscenario’s voor 2100 geen toename te zien van de neerslag in de herfst.
Dr. Ir. Hessel Voortman reageerde vervolgens op mijn artikel. Hessel Voortman is deskundig op het gebied van kustverdedigingswerken en zeespiegelstijging en bovendien zeer bedreven in statistische analyses. De software die hij daarbij gebruikt overstijgt zonder twijfel het door mij gebruikte Excel. Op basis van de door mij geleverde KNMI neerslagsommen van de maand oktober vanaf 1906 rolde deze grafiek uit Hessels computer:
Fig.1 Bron: Hessel Voortman
Voortman schrijft:
Ik pas lineaire regressie toe. De verklaarde variantie (R2) is een maat voor hoe goed de regressie-lijn de metingen beschrijft. Je ziet dat hier de trendlijn een slechte weergave is van de metingen (lage R2). De oorzaak is de enorme ruis (variatie jaar-op-jaar).
Aan dit soort analyses ligt de aanname ten grondslag dat de afwijkingen van de trendlijn (residuals) een normale verdeling volgen. Hier zie je in het plaatje dat dat niet zo is. De afwijkingen naar boven zijn groter dan de afwijkingen naar beneden. Ik zou dus eigenlijk de kansverdeling van de “residuals” met een andere verdeling moeten beschrijven. Dat is nogal bewerkelijk en daarom laat ik dat nu achterwege.
Hoewel niet aan alle voorwaarden voor toepassing van deze methode is voldaan, kunnen we wel voorzichtig conclusies trekken. Deze oktober was wel degelijk bijzonder nat. De neerslagsom ligt buiten het 99% predictie-interval (de lichtblauwe band). Het predictie-interval geeft aan waar in statistische zin individuele waarnemingen liggen. Het is dus inderdaad een “outlier” zoals jij zelf ook al vond.
De donkere band geeft de onzekerheid rondom het gemiddelde (met trend). Je kan zien dat we hier met een niet-significante trend te maken hebben. Een horizontale lijn (geen trend) is namelijk één van de mogelijkheden die past binnen de donkerblauwe “toeter”. Dat betekent dat bij dit significantieniveau (1%) het teken van de trend niet eenduidig is (omhoog of omlaag) en daarmee is een trend statistisch niet aangetoond. Dat is statistiek met het timmermansoog.
Iets ingewikkelder is de F-test die de trend in statistische zin vergelijkt met het gemiddelde van de data. De nul-hypothese is dan dat het gemiddelde (zonder trendlijn) een goede beschrijving geeft van de data. Die nul-hypothese wordt in mijn analyse niet verworpenen derhalve is de trend niet significant. En als gezegd niet geheel correct omdat de “residuals” niet normaal verdeeld zijn.
Maar een houdbare conclusie lijkt:
-
-
- Was 2023 nat? Jazeker!
- Het natste sinds start metingen in 1906? Onder voorwaarde dat de meetmethode en meetlocatie niet teveel zijn veranderd; ja!.
- Is er een verandering/trend gaande? In statistische termen; nee.
-
Dat is klare taal en in lijn met wat ikzelf met míjn timmermansoog en behulp van Excel dacht te zien.