Le rôle joué par les bio-informaticiens européens, notamment ceux du réseau d’excellence
BioSapiens, a été l’une des pierres angulaires d’Encode. Ils y ont apporté une contribution
notable, en particulier dans le cadre du sous-projet Gencode, en effectuant de prime abord
l’annotation du 1 % du génome sélectionné pour le projet. Sur cette base a pu être effectué
le repérage de tous les gènes potentiels, correspondant aux définitions plus ou moins
consensuelles utilisées au moment du lancement de la recherche. L’originalité de notre
approche est de mêler prédiction de gènes par des algorithmes bio-informatiques et
validation de ces prédictions par des expériences biologiques. Nous identifions d’abord les
gènes déjà connus, de manière à entraîner nos algorithmes, ce qui nous permet ensuite de
découvrir de nouveaux gènes
, explique Roderic Guigó du Centre de Regulació Genómica de Barcelona (Espagne). Au total, ce sont ainsi les fonctions biologiques de
quelque 1097 protéines qui ont été identifiées par les équipes de GEncode sur l’échantillon
des 30 millions de paires de bases de nucléotides visées dans le cadre d’Encode.
BioSapiens est sans conteste l’une des plus importantes et ambitieuses initiatives de
recherche de l’Union dans le domaine de la biologie moléculaire
, souligne Frederick
Marcus, qui supervise ce réseau d’excellence au sein de la Commission. L’objectif est de
renforcer les avancées mondialement reconnues de la bio-informatique européenne,
symbolisée par les deux bases de données d’ADN (EMBL gene bank) et de protéines
(UniProtkB/Swiss-Prot) utilisées mondialement. La double finalité de BioSapiens est la
création d’un véritable institut virtuel d’annotation des génomes, en l’accompagnant d’un
développement soutenu de la formation des chercheurs à travers une École européenne de
bio-informatique. La valeur scientifique d’une séquence génomique se mesure à la
qualité de son annotation
, explique pour sa part Tim Hubbard du Centre Sanger
d’Hinxton (United Kingdom), c’est-à-dire à la quantité d’information que l’on peut tirer de
la séquence d’ADN en la comparant à celles d’autres séquences connues. Un autre enjeu de
l’annotation est de cartographier les régions, parfois réduites à un seul nucléotide (Single
Nucleotide Polymorphism ou SNP), présentant une grande variabilité d’une personne à
l’autre, et de corréler ces variations à la survenue de pathologies, notamment de cancers.
L’industrie pharmaceutique a investi des sommes colossales dans l’étude de ces SNP, qui
promet, à terme, la mise au point de médicaments sur mesure, adaptés à la constitution
génétique de chaque patient. C’est ce qui explique la présence de représentants d’entreprises
de grand format, telles Hoffmann-La Roche ou Pfizer, au conseil scientifique de BioSapiens.