Nieuwe inzichten in genomics dankzij TERAS

ASP lanceert belangrijke gegevensdatabase 'Protein World'

Een groots opgezette studie van meer dan 400,000 proteïnen die recent werd uitgevoerd door een consortium van Nederlandse en Europese onderzoeksinstellingen zal een belangrijke basis vormen voor nieuwe inzichten op medisch en wetenschappelijk gebied. Het project was een samenwerking van een aantal partijen onder de vlag van BioASP(het Nederlandse kennis- en dienstencentrum voor bioinformatica). NCF, de stichting Nationale Computer Faciliteiten, leverde de financiering voor ruim een half miljoen rekenuren.

De deelnemers aan het project waren het Centrum voor Moleculaire en Biomoleculaire Informatica (CMBI) van de Universiteit van Nijmegen, het Amsterdamse rekencentrum SARA, het European Bioinformatics Institute (EBI), het bedrijf Gene-IT, en pharmaceutisch bedrijf Organon (onderdeel van Akzo Nobel).

De vergelijking tussen de proteïnen kostte 21.600 dagen CPU-tijd, ofwel het werk dat een zeer snelle desktop computer kan doen wanneer hij foutloos zestig jaar achter elkaar doorrekent. Op de Nationale Supercomputer TERAS (een 1024-CPU SGI Origin 3800) die bij SARA staat was het werk in nog geen twee maanden geklaard.

Er werd gebruik gemaakt van speciale software (Biofacet) die door Gene-IT was ontwikkeld . Meer dan 400,000 proteïnen van mens, muis, plant, bacterie en vele andere organismen werden vergeleken op basis van een speciale variant van het Smith & Waterman sequentievergelijkingsalgorithme.
 
NCF financiert ook de toegankelijkheid voor onderzoekers naar de resultaten van de berekeningen door TERAS en BioASP's E-science infrastructuur. Deze nieuwe dienst - 'Protein World' - zorgt ervoor dat de data beschikbaar komt voor verder onderzoek. Het doorrekenen van de relaties tussen proteinen is pas het begin: in de komende jaren zullen internationale studies worden ondernomen naar de veranderingen die genen hebben ondergaan gedurende de evolutie. Bovendien kunnen op basis van 'Protein World' alle proteïnen worden onderverdeeld in groepen en families, zodat wetenschappers de functies van minder bekende proteïnen kunnen voorspellen.

Proteïnen zijn bouwstenen die van genen zijn afgeleid, en ze vormen de basis van alle levende organismen en dus van het leven zelf. Jarenlang hebben wetenschappers met rudimentaire data moeten werken waar het het ontstaan van de verschillende dieren en planten betrof. Nu kent men alle bouwstenen van meer dan vijftig bacteriesoorten, schimmels, gisten, parasieten, insecten, en binnenkort van alle belangrijke zoogdieren en tenminste een type plant, en kan worden geanalyseerd op een hoger niveau. Daarmee kan men eindelijk de loop van de evolutie ontleden.

Meer informatie www.bioasp.nl