Computational Life Sciences

Promotie: Interessante en bruikbare patronen vinden

15 december 2009

Het ontdekken van patronen is een belangrijk onderdeel bij het vergaren van nieuwe kennis uit bestaande gegevens. Een dergelijk patroon is simpelweg een vorm van regelmaat. Voorbeelden van patronen zijn producten die vaak gezamenlijk worden verkocht, of genen die vooral actief zijn bij een bepaalde ziekte. Jilles Vreeken promoveert hierop op 15 december aan de Universiteit Utrecht binnen het programma Computational Life Sciences.

Over het algemeen is het vinden van een patroon zeer eenvoudig. Bestaande technieken vinden met gemak enorme aantallen patronen. Vaak worden er meer gevonden dan dat er gegevens zijn. Het onderwerp van het proefschrift van Jilles Vreeken is dan ook het vinden van een behapbaar aantal, zeer interessante, regelmatigheden. En in het bijzonder hoe deze patronen nuttig te gebruiken zijn bij het verder analyseren van gegevens.

Grof gezegd gaat het over het bruikbaar maken van patroon mining. In plaats van patronen individueel te beoordelen, stelt dit proefschrift voor om groepen tegelijk te beschouwen, en die groep te kiezen die de gegevens het best representeert. Dit doet Vreeken door compressie te gebruiken. De gevonden groepen worden in vijf toepassingen met succes toegepast, waaronder het meten en karakteriseren van verschillen (hoe verschillen twee patiëntgroepen?) en het bieden van privacy wanneer gegevens vrijgegeven (moeten) worden.

Bron: Universiteit Utrecht