Een update uit onze ontwikkelingsafdeling: wat we leren van onze eerste massarun...
Bij 2DA hebben we onze eerste massarun uitgevoerd voor het automatisch beschrijven van 58.000 pagina’s overlijdensakten in opdracht van Brabants Historisch Informatie Centrum. Mooi aan deze opdracht was ook de samenwerking met BHIC, waarin ruimte was om dit traject zorgvuldig en in de praktijk op te bouwen.
In deze productiestraat leest een systeem eerst de akten in. Daarna wordt per stap bepaald welk model het best past bij welke specifieke actie. We laten dus niet één model alles doen, maar zetten meerdere lokale modellen gericht in op de onderdelen waar ze sterk in zijn.
Omdat het om niet-openbaar materiaal ging, heeft deze volledige run volledig offline gedraaid: lokaal, op eigen infrastructuur en zonder enige verbinding met het internet.
De beschrijving heeft daarbij een hoge goedheid gehaald. De output werd bovendien direct opgeleverd in een formaat dat zonder tussenstappen kan worden ingelezen in Memorix.
Wat we in dit project opnieuw hebben geleerd, nemen we direct mee in de verdere ontwikkeling van ons systeem voor automatische massabeschrijving. Juist dat is voor ons de kern: elke run levert niet alleen output op, maar ook nieuwe inzichten waarmee we het systeem verder verbeteren.
Zo bouwen we stap voor stap verder aan een systeem dat niet alleen op schaal kan beschrijven, maar dat ook zorgvuldig, lokaal en gecontroleerd kan doen.
#2DA #BHIC #AI #Archieven #Erfgoed #LocalAI #DocumentAI #Memorix #AIGovernance #Digitalisering