Content area
Cette these comprend un article a presenter, deux articles publies et un chapitre portant sur de nouvelles idees qui seront integrees au systeme MCSYM (Macromolecular Conformation by SYMbolic generation). Les articles publies sont: Exploring the Conformations of Nucleic Acid qui parai tra dans la revue Journal of Functional Programming et Using Multilisp for Solving Constraint Satisfaction Problems: An Application to Nucleic Acid 3D Structure Determination paru dans le volume 7 de la revue LISP AND SYMBOLIC COMPUTATION.
Nous presentons dans cette these une methodologie qui repose sur un ensemble d'outils informatiques afin d'asister le processus de modelisation des structures tridimensionnelles des acides nucleiques. Il s'agit de la generation et du traitement de contraintes relationnelles. L'utilisation d'un ensemble de sequences nous permet de contourner des questions theoriques actuellement sans reponse quand au repliement des ARNs et de suggerer des modeles tridimensionnels qui repondent aux donnees disponibles. Le premier outil est l'analyse des covariations, une methode generale reposant sur une mesure statistique de l'association entre deux variables nominales. La methode a ete appliquee avec succes a l'etude de l'ARN de transfert ainsi qu'a 11 famiilles de proteines. Pour les sequences de nucleotides, la methode se compare favorablement aux autres approches que l'on retrouve dans la litterature. Alors que pour les proteines, lorsque la methode est combinee a un filtre que nous avons developpe, nous obtenons des resultats superieurs a ce qui a ete publie a ce jour.
Le second outil prend en entree les donnees de covariations sous forme de relations et utilise des ensembles discrets de conformations et de relations et applique un algorithme de retourarriere afin de produire un ensemble de modeles 3-D. Nous faisons le point sur le developpement de ce systeme et nous comparons trois implementations: une dans un langage fonctionnel, une autre dans un langage imperatif et une derniere en programmation logique. Nous donnons des arguments illustrant les forces de la programmation fonctionnelle comme outil de developpement du prototype.
L'utilisation d'un langage fonctionnel nous a aussi permis de developper facilement et rapidement une implementation parallele du systeme. Ce systeme presente d'excellentes performances; pour l'un des tests sur 64 processeurs, nous obtenons une acceleration lineaire du programme. Une version reduite de ce systeme est maintenant utilisee par plusieurs developeurs a titre d'etalon pour les implementations de langages fonctionnels.
Nous avons etudie une alternative numerique au systeme symbolique pour la modelisation 3-D. Ce systeme offre une solution au probleme des cycles dans le graphe des contraintes relationnelles des macromolecules. Nous avons aussi cree une methode pour regrouper des elements et ameliorer les performances du systeme.
En resume, la methodologie proposee permet de construire des modeles atomiques a partir de l'information contenue dans un ensemble de sequences. L'analyse comparative d'une famille de sequences a l'aide de l'outil de mesure des covariations genere un ensemble de contraintes relationnelles. Celles-ci sont utilisees par le systeme symbolique, le systeme symbolique parallele ou le systeme numerique afin de produire un ensemble de structures tridimensionnelles.