Van informatie naar kennis: hoe transformeren we onze data naar kennis? En welke rol speelt Agentic AI hierin? Tijdens de inspirerende derde (en laatste) avond van de driedelige masterclass, georganiseerd door DPG Media (Robert van de Ham), nam Martijn Aslander ons mee in de diepte van de informatiearchitectuur en ‘informatieautonomie’.
“De sleutel is gevonden naar de universele kennis van de mensheid.” – Martijn Aslander
Peirce en Turing
Martijn schrijft op dit moment aan de theoretische fundering achter het concept ‘informatieautonomie’: ‘Perceiving Turing’s Dream’. De centrale vraag hierin is fundamenteel: hoe weet je nou eigenlijk wat wat is? Dit raakt direct aan classificatie.
- Charles Sanders Peirce bedacht destijds het afleidingsmechanisme.
- Alan Turing stelde de ultieme vraag: hoe kan ik machinaal redeneren?
Het gat tussen Peirce en Turing, wordt ingevuld door de visie van Martijn: hoe komen we daadwerkelijk tot die classificatie voor onze data? Je kunt onder andere gebruik maken van bestaande registers van classificaties (denk aan het periodiek systeem der elementen), waardoor je logische stappen kunt afleiden (mits de data klopt).
Een concreet voorbeeld: wanneer twee afzonderlijke (openbare) overheidsrapportages beide melding maken van de inzet van Capgemini voor een bepaald project, geeft het dwarsverband tussen deze data nieuwe, waardevolle data, die we eerder niet hadden (in dit geval de totale kosten van de inzet van Capgemini).
Human in the Loop: De Mens Geeft Betekenis
Ondanks de enorme kracht van computers, blijft de Human in the Loop (of Lead?) onmisbaar. Een computer kan uit zichzelf geen brug slaan tussen abstracte domeinen. De mens is nodig om een extra laag toe te voegen aan de data die we al bezitten (zie het voorbeeld van de kosten voor Capgemini hierboven).
Martijn brengt gelaagde feedbackloops aan in zijn kennissysteem, waarmee de kwaliteit en betrouwbaarheid van de informatie continu verbeterd. De mens is hierin essentieel voor het geven van betekenis aan iets en het écht begrijpen (dat kan AI niet). Mooie bijvangst: hiermee krijgt de kenniswerker zijn mentale ruimte weer terug.
Casus & Demo: De Einstein Telescope
Hoe werkt dit in de praktijk? De Einstein Telescope — een groot project van 6 miljard euro dat diep terugkijkt in de tijd met behulp van zwaartekrachtgolven en snaartheorie — diende als de casus voor de theorie van Martijn.
Hoe kunnen we ons voorstellen wat deze telescoop gaat vinden? Het bevindt zich als het ware op een breuklijn of een grensvalk; een ‘goudader’ die ergens ‘geologisch’ tussen disciplines in ligt. In de wetenschap horen en verstaan verschillende vakgebieden elkaar vaak niet, waardoor er lacunes in onderzoek ontstaan. Stel dat je een machine hebt die in 280 miljoen wetenschappelijke papers kan zoeken naar precies die verbindingen en naden waar domeinen elkaar raken?
Tijdens de demo werd getoond wat deze zogenaamde ‘waarschijnlijkheidsmachine’ kan doen:
- Informatie anders organiseren: Kunnen we het werk van de telescoop overnemen? Ja! Door informatie fundamenteel anders te structureren, heb je de fysieke telescoop soms niet eens direct nodig.
- Scraped data als basiskennis: Martijn heeft als test de data van 3.000 bij het telescoopproject betrokken wetenschappers verzameld (namen achterhaald en al hun geschreven artikelen opgeslagen) om verbindingen te leggen.
- Verbinden en Redeneren: Door informatie uit openbare bronnen in één domein samen te brengen en verbanden aan te leggen, maak je de informatie ‘verbindbaar’.
De Oplossing van Google versus Agentic AI
Om het verschil met traditionele systemen te verduidelijken, werd de aanpak van Google aangehaald. Als mensen zoeken op ‘kat’ en niks vinden, gaan ze heel vaak zoeken op ‘kitten’. Google analyseert dit gedrag en maakt hier synoniemen van.
Maar alle vragen zijn in feite puzzels. Waar we voorheen alleen menselijke mede-puzzelaars hadden, hebben we nu de computer als volwaardige mede-puzzelaar.
Waarom is dit sinds een maand of zes ineens mogelijk? Omdat Agentic AI dit mogelijk maakt. Deze vorm van AI werkt vele malen sneller, zeker in combinatie met het omzetten van de data naar toegankelijke bestanden (platte tekst (zoals Markdown)). Ter illustratie: alle namen van heel Nederland beslaan in platte tekst slechts 300MB.
Hoe label je informatie?
Er bestaat geen universeel labelsysteem. Martijn werkt daarom met een gelaagd systeem waarin je per informatie-element drie dingen vastlegt:
- Waar komt het vandaan? (De herkomst van het document of het idee)
- De onderbouwing: Hoe zeker zijn we hiervan?
- De aard: Is het een hard feit of een duiding?
AI zorgt er via instructies vervolgens voor dat de data in de juiste ‘bakjes’ komt (de zogenaamde ontologie). Als je bv. drie databases over elkaar heen legt, wordt de kans dat de data klopt exponentieel groter.
Martijn past dit onder andere toe op wetenschappelijk onderzoek. De wetenschap is georganiseerd in aparte domeinen (die vaak niet met elkaar praten, zie ook mijn blog over de kolommen paradox). Juist tussen de verschillende vakgebieden is het minder druk, omdat mensen zelden dubbele gebieden bestuderen. Juist op die onontgonnen randen ligt het goud. Een oplossing uit het ene vakgebied is vaak direct toepasbaar in het andere, maar dan moet je wel van elkaar weten.
Medisch Kennisagent: VitaOS
Als concreet praktijkvoorbeeld van de medische kennisagent van Martijn (Para) werd VitaOS besproken. Dit systeem werkt volgens een strak stappenplan:
- Bijsluiters verzamelen: Het verzamelen van alle officiële bijsluiters.
- Bronnen combineren: Waarom één bron niet genoeg is? Simpelweg omdat niet alles erin staat.
- Databases koppelen: Het bij elkaar halen van diverse databases (bijwerkingen, scheikundige databases, praktijkmeldingen en de scheikunde van voeding) verspreid over 250 miljoen wetenschappelijke papers.
- Bruikbaarheid bepalen: Welke informatie kunnen we beter níet gebruiken omdat het ononderzocht is? Dit helpt om lacunes te identificeren, te falsificeren of te bevestigen.
- Voorspellen: Het functioneert uiteindelijk als een geavanceerde voorspelbaarheidsmachine.
Door databases letterlijk over elkaar heen te leggen, vind je op de naden tussen de bronnen het ‘goud’—zoals het ontdekken van gevaarlijke combinaties van stoffen in medicijnen die voorheen onopgemerkt bleven.
Blik op de Toekomst
Inmiddels bouwen 15 mensen wereldwijd hun eigen kennissysteem op basis van de principes van Martijn en wisselen zij onderling ervaringen uit. De AI fungeert hierbij als de universele vertaler die de taal tussen de verschillende databases naadloos overbrugt. Martijn blijft delen wat hij weet en ervaart om hiermee fundamentele, grote uitdagingen (‘gave shit’) voor de mensheid op te lossen.
Community
Wil je meer weten. Er lopen meerdere initiatieven:
- Digitale Fitheid: De community rondom digitale fitheid komt elke twee maanden samen tijdens een meetup in Utrecht (zie: digitalefitheid.nl).
- Overheid: Er loopt een Pilot informatie-autonomie speciaal gericht op de overheid.
- PKM Summit: In maart vindt de jaarlijkse Europese PKM Summit plaats in Utrecht (zie: pkmsummit.com).
Volgende stap: Dit was de laatste blog in een serie van 3 (avond 1, avond 2). Geïnspireerd geraakt? Lees het onlangs verschenen boek van Martijn Aslander. Je kunt het boek bestellen via de officiële website: informatieautonomie.nl
Leave a Reply