LIN: A validated reading level tool for Dutch

Summary

While there is an urgent need for robust readability assessment tools, applicable to a range of communicative domains, none of the existing tools for Dutch offers a valid empirical basis and sufficient functionality. Recent developments in computational linguistics and discourse processing create possibilities to change this situation. We propose to develop a validated reading level tool, aiming at secondary school readers, adult readers of public information, and by extension, the Dutch-speaking population at large. First, a text-analytic tool is developed using the latest results of computational linguistics research. Second, cloze comprehension data are collected among secondary school readers, in a design assessing both differences between texts and between versions of the same text. Third, a subsample of texts is re-used to investigate on-line processing in eye-tracking studies. The combination of comprehension data and on-line processing measures provides insight in the way textual features affect the construction of cognitive representations. Fourth, additional cloze data are collected for adults reading government-citizen information texts in The Netherlands and Flanders. Fifth, the relation between cloze data and reading times on the one hand, and text features on the other hand, is analyzed in a multilevel regression analysis and in a machine learning study. These analyses are used to develop a reading level prediction tool: LIN (LeesbaarheidsIndex voor het Nederlands). This validated reading tool is relevant to various domains in society: education, publishing, government-citizen communication. It will provide the foundation for developing domain-specific readability and writing tools that has been missing so far.

Products

Scientific article

Chapter in book

  • M. Boogaard, T.J.M. Sanders, C.J.M. Jansen(2012): Alles wat je altijd al had willen weten over taal. pp. 109 - 112 , Amsterdam

Publication meant for a broad audience

  • T.J.M. Sanders(2011): Krachten gebundeld voor begrijpelijke taal: nieuw gezamenlijk onderzoek universiteiten, bedrijven en overheid. pp. 130 - 131
  • T.J.M. Sanders(2011): Wetenschap dicht communicatiekloof. pp. 18 - 20
  • H.L.W. Pander Maat(2012): De lange weg naar een serieuze leesbaarheidsindex
  • T.J.M. Sanders(2012): Begrijpelijke taal: fundamenten en toepassingen van effectieve communicatie

Publical information

  • T.J.M. Sanders(2012): Lange zinnen zijn niet per se lastig
  • S. Kleijn(2013): Leesbaarheidsformules: uit de tijd?
  • S. Kleijn(2014): Leesbaarheidsvoorspelling: Invloed van tekst, tekstversie en leesvaardigheid
  • S. Kleijn(2014): T-Scan: Diagnosing and predicting Dutch text complexity
  • S. Kleijn, H.L.W. Pander Maat, T.J.M. Sanders(2014): Van T-Scan naar LIN
  • T.J.M. Sanders(2014): Begrijpelijke taal en effectieve communicatie.
  • S. Kleijn(2015): LIN: Leesbaarheidsindex voor het Nederlands
  • T.J.M. Sanders(2015): Begrijpelijke taal.
  • T.J.M. Sanders(2015): Begrijpelijke Taal
  • T.J.M. Sanders(2015): Begrijpelijke taal
  • T.J.M. Sanders(2015): Begrijpelijke taal
  • T.J.M. Sanders(2015): Begrijpelijk communiceren met burgers.
  • T.J.M. Sanders(2015): Coherentie, cognitie en communicatie: over theorie, empirie en toepassing.
  • S. Kleijn, H.L.W. Pander Maat(2015): Tscan Demo
  • S. Kleijn, T.J.M. Sanders(2016): Language lab demonstration
  • H.L.W. Pander Maat(2016): Demonstratie T-Scan
  • T.J.M. Sanders, M. van Nuland(2016): Op weg naar begrijpelijke taal en effectieve communicatie
  • T.J.M. Sanders(2016): Radio-interview over de voorlopige resultaten van het onderzoeksprogramma 'Begrijpelijke Taal'
  • S. Kleijn, H.L.W. Pander Maat, T.J.M. Sanders(2016): Realistic effects of word difficulty on the on-line processing and understanding of texts
  • S. Kleijn(2016): Een greep uit het onderzoek naar B3GR1JP3L1JK3 7aal en effectieve communicatie
  • T.J.M. Sanders, S. Kleijn, H.L.W. Pander Maat(2016): Effects of dependency length on the processing and understanding of texts.
  • T.J.M. Sanders, H.L.W. Pander Maat, S. Kleijn(2016): How Dependency Lengths Affect Text Processing Under Naturalistic Reading Conditions.
  • S. Kleijn(2016): The LIN eye movement corpus.
  • H.L.W. Pander Maat, S. Kleijn, T.J.M. Sanders(2016): Towards a Validated Readability Index for Dutch: Fact(or)s and Figures
  • S. Kleijn, H.L.W. Pander Maat(2017): What (Little) Difference a Word Makes
  • S. Kleijn(2017): T-Scan demonstration
  • H.L.W. Pander Maat(2017): T-Scan en Leesbaarheidstool
  • T.J.M. Sanders(2017): Radio-interview over Jip-en-Janneketaal
  • H.L.W. Pander Maat(2017): Demonstratie T-Scan en Leesbaarheidstool
  • S. Kleijn, T.J.M. Sanders, H.L.W. Pander Maat(2017): Effects of syntactic dependency length on on-line text processing and comprehension
  • T.J.M. Sanders, H.L.W. Pander Maat, S. Kleijn(2017): Reopening the Cloze Discussion

Details

Project number

321-89-002

Main applicant

Prof. dr. T.J.M. Sanders

Affiliated with

Universiteit Utrecht, Faculteit Geesteswetenschappen, Letteren

Team members

S. Kleijn MA, Dr. H.L.W. Pander Maat

Duration

15/11/2012 to 30/06/2017