Privacyverklaring

Inhoud jaarrapporten voorspellen met AI

26 november 2024
Tekst
Peter Ooms
Beeld
Paul Geertsema by Nicolas Herbots

Op AI for Finance gaf Paul Geertsema een opgemerkte presentatie over zijn onderzoek om met artificiële intelligentie de inhoud van jaarrapporten van Amerikaanse bedrijven te voorspellen. Dat gebeurt louter op basis van de historische resultaten.

“Voor alle duidelijkheid: dit is in de eerste plaats een academisch onderzoek. We willen ermee testen of het mogelijk is om de volledige inhoud van een financieel jaarrapport te voorspellen met behulp van technieken uit artificiële intelligentie”, aldus Paul Geertsema, associate professor of Accounting and AI bij Vlerick Business School. “De uitkomst kan echter ook praktische voordelen hebben. Wanneer er een groot verschil optreedt tussen de voorspelde en de gepubliceerde resultaten kan dat verschillende redenen hebben. De kans is bijvoorbeeld groter dat het bedrijf dan een fout heeft gemaakt in zijn rapport en achteraf verplicht wordt een verbeterde versie te publiceren.”

Complementaire informatie

“Daarnaast kunnen we onze voorspelling vergelijken met die van financiële analisten, onder andere in investeringsbanken. We stellen vast dat de juistheid vergelijkbaar is, maar dat er complementaire informatie is die versterkend kan werken voor allebei. Dat maakt op zijn beurt betere voorspellingen mogelijk. Onze automatische voorspelling is objectief. Financiële analisten hebben vaak een commerciële agenda die hun resultaat mogelijk beïnvloedt”, zegt Paul Geertsema.

Paul Geertsema voert het onderzoek samen met Helen Lu (Vlerick Business School) en Guang Ma (Rutgers Business School). De onderzoekers baseerden zich op de jaarrapporten van alle bedrijven die op de Amerikaanse beurzen genoteerd staan sinds 1961 tot vandaag. Opvallend: ze gebruiken alleen data uit die jaarrapporten en dus geen beurskoersen, marktgegevens, economische modellen en dergelijke.

Voorspelling van de omzet als start

Het basisidee is dat een jaarrapport een gestructureerd geheel van cijfers is. Een aantal items daarin is belangrijk, zoals de omzet, de cost of goods sold (COGS) of andere kosten. De onderzoekers starten met een voorspelling van de omzet en gebruiken dat cijfer ook bij het voorspellen van de andere parameters. Zo ontstaat een ketting van bewerkingen die begint bij de omzet en eindigt bij de dividenden. Heel wat andere financiële parameters zijn het resultaat van wiskundige bewerkingen op die items. Die hoeven de onderzoekers niet te voorspellen, die berekenen ze gewoon. Ebitda is bijvoorbeeld de omzet min de COGS en andere kosten.

Machinelearning

De gebruikte AI-techniek – Gradient Boosting Machine – is opgebouwd uit een lange reeks van individuele beslissingen. Het gaat om artificiële intelligentie die geen gebruik maakt van een large language model, wel van machinelearning. Dat houdt ook in dat de accuraatheid van de voorspellingen toeneemt naarmate de voorspellingen geconfronteerd worden met de echte resultaten. Uit mogelijke afwijkingen leert het model weer nieuwe elementen, die het meeneemt in de volgende voorspelling.

Paul Geertsema by Nicolas Herbots