Nieuw systeem voor handschriftherkenning

22 december 2011

Bij een rechtszaak kan correcte identificatie van de schrijver van bijvoorbeeld een handgeschreven dreigbrief of een mogelijk vervalste zelfmoordbrief erg belangrijk zijn. Handschriftbiometrie is een techniek om handschriftanalyses door een computer te laten doen. Axel Brink heeft een nieuwe computertechniek (Quill) ontwikkeld voor het verifiëren en identificeren van zowel moderne als Middeleeuwse handschriften. Hij promoveerde op dit onderzoek op 2 december 2011 aan de Rijksuniversiteit Groningen binnen het programma ToKeN van NWO.

Handschriftbiometrie is het toekennen van een schrijver aan een handgeschreven tekst door een computer kenmerken van het handschrift te laten analyseren. Handschriftbiometrie is zowel te gebruiken bij schrijververificatie als bij schrijveridentificatie. Een systeem voor schrijververificatie vergelijkt het handschrift in een document met dat in een ander document. Een systeem voor schrijveridentificatie zoekt in een collectie op basis van één tekst naar documenten met hetzelfde handschrift.

Quill

Axel Brink heeft een nieuwe techniek ontwikkeld voor handschriftbiometrie. Deze techniek, genaamd Quill, meet van elke pixel op de rand van een letter of cijfer wat de richting en breedte is van het inktspoor op dat punt. Deze techniek geeft duizenden meetpunten op één pagina tekst. Al die meetpunten vormen samen het profiel van een handschrift. Dat profiel is te gebruiken bij schrijververificatie en -identificatie. Middeleeuws Quill werkt bij analyses van moderne en middeleeuwse handschriften net zo goed als de beste methoden voor handschriftbiometrie die Brink heeft onderzocht. Quill is samen met andere technieken opgenomen in GIWIS (Groningen Intelligent Writer Identification System), een programma dat men kan inzetten voor opsporingsonderzoek en geschiedenisonderzoek.

Robuust

De promovendus onderzocht ook de robuustheid, op drie aspecten, van een aantal methoden voor handschriftbiometrie. Brink: ‘Met robuust bedoel ik dat de techniek erin slaagt om de juiste schrijver te identificeren in een grote verzameling handschriften uit de praktijk. Een aantal bestaande technieken presteert prima op netjes overgeschreven teksten, maar dat zegt weinig over de prestaties onder realistische omstandigheden. In de praktijk zijn bijvoorbeeld vaak woorden doorgekrast, staan ze niet netjes op één lijn en vertoont het papier van middeleeuwse geschriften storende achtergrondverkleuring.’

Verdraaiing

Een belangrijk punt dat Brink onderzocht, is verdraaiing van een handschrift (tekens meer naar links of naar rechts laten hellen). Verdraaiing is een eenvoudige en veelgebruikte manier om een handschrift te vervalsen; want daardoor ziet een handschrift er direct anders uit. Met een computer kun je deze vorm van vervalsing tot op zekere hoogte terugdraaien. Brink: ‘Ik heb gekeken naar de herkenbaarheid van verdraaide handschriften en heb geconstateerd dat die na correctie slechter worden herkend dan de ‘natuurlijke’ handschriften. Computers kunnen het effect van verdraaiing blijkbaar maar gedeeltelijk ongedaan maken.’ Dat komt waarschijnlijk doordat mensen bij verdraaiing niet alleen de hellingshoek aanpassen, maar onbewust ook andere kenmerken van het handschrift veranderen. Wat handschriftverdraaiing betreft zijn dergelijke systemen dus nog niet robuust.

Honderd tekens

Uit Brinks robuustheidsonderzoek blijkt ten tweede dat er ongeveer honderd tekens nodig zijn voor een succesvolle schrijververificatie of -identificatie. Brink: ‘Hoe meer tekens er beschikbaar zijn voor analyse, hoe preciezer we handschriften kunnen vergelijken. Het blijkt dat de resultaten niet heel veel verbeteren als er meer dan honderd tekens beschikbaar zijn. Minder dan honderd tekens geeft wél een minder goed resultaat.’ Ten derde blijkt uit Brinks robuustheidsonderzoek dat doorgestreepte woorden kunnen blijven staan in een tekst zonder dat ze de kwaliteit van een analyse aantasten.

ToKeN

Axel Brink voerde haar onderzoek uit binnen het NWO-programma ToKeN (Toegankelijkheid en kennisontsluiting in Nederland). ToKeN is een interdisciplinair onderzoekprogramma gericht op de interactie tussen een menselijke gebruiker en kennis- en informatiesystemen. Toegankelijkheid verwijst naar de mate waarin individuele burgers kunnen beschikken over kennis en informatie die voor hun van belang is. Kennisontsluiting slaat op die methoden die voor de gebruiker kennis halen uit gegevens en informatie, die anderszins niet beschikbaar zou zijn. Op 14 januari 2010 is tijdens het jaarlijkse symposium een verslag verschenen met een overzicht van alle projecten. Deze ToKeN Highlights zijn kosteloos te bestellen via www.nwo.nl/token.

Bron: RUG

 


Bron: NWO