Geautomatiseerd conclusies trekken uit zinnen

Semantiek en pragmatiek kunnen grootschalige tekstanalyse verbeteren

21 oktober 2015

Wanneer iemand zegt 'Ik kocht luiers voor mijn zoon', dan trekken wij menselijke luisteraars daaruit automatisch de conclusie dat die zoon een baby is. Voor computers zijn dergelijke gevolgtrekkingen ('entailments') veel lastiger, en dit is dan ook een uitdaging in de taaltechnologie. Assaf Toledo ontwikkelde een nieuwe aanpak voor het ontwikkelen van automatische 'gevolgtrekkingherkenner'’. Zijn promotie, op 26 oktober aan de Universiteit Utrecht, is onderdeel van het Vici-project van Yoad Winter 'Between Logic and Common Sense: The Formal Semantics of Words'.

Taaltechnologische software die automatisch conclusies kan trekken zoals mensen dat kunnen, is interessant omdat bijvoorbeeld zoekmachines zoals Google daarmee nog veel krachtiger kunnen worden. Ook kan dergelijke software helpen om automatische samenvattingen te maken, die bijvoorbeeld helpen besluiten om een tekst wel of niet officieel te laten vertalen.

Verbetermogelijkheden voor 'big data'-analyses

Toledo stelt dat veelgebruikte 'big data'-methodes voor tekstanalyse aanzienlijk verbeterd kunnen worden door gebruik te maken van de taalkundige inzichten uit de vakgebieden semantiek en pragmatiek, oftewel de deelgebieden van de taalwetenschap die zich bezighouden met de betekenis van taaluitingen (woorden, zinnen) en hoe deze in context gebruikt kunnen worden.

Annotaties om gevolgtrekkingen te herkennen

In zijn onderzoek heeft Toledo de nieuwe methode Annotating-By-Proving ontwikkeld. Uitgangspunt hiervoor is een klassiek formeel semantisch model, gebaseerd op logica. Op basis daarvan zijn teksten door 'annoteurs' handmatig zodanig van markeringen voorzien dat de gevolgtrekkingen er met behulp van software automatisch uit konden worden afgeleid.

Toen bleek dat deze methode succesvol was, heeft Toledo een semi-geautomatiseerd annotatieplatform ontwikkeld dat het mogelijk maakt om met behulp van machine learning technieken betere gevolgtrekkingherkenners te ontwikkelen.

Meer informatie


Bron: Universiteit Utrecht

Kenmerken

Wetenschapsterrein

Geesteswetenschappen

Programma

Vernieuwingsimpuls

Speerpunt

Investeren in talent en vrij onderzoek (2011-2014)