Boinc - Equipe de la Science

Site de la miniteam Equipe de la Science composante de L’Alliance Francophone sur la grille de calcul partagé et bénévole BOINC.
  • Article

  Simap@Home ?

Présentation du projet Simap@Home

samedi 25 novembre 2006, par pas93

Qu’est ce que SIMAP ?
Site officiel

Qu’est ce que SIMAP ?

SIMAP est une base de données des sequences similaires de protéines. Cette base de données contient toutes les proteines actuellement publiée et est continuellement mise à jour. Les séquences similaires de protéines sont calculées en utilisant l’algorithme de FASTA qui fournit une vitesse et une sensibilité optimale. SIMAP est à notre connaissance le seul projet qui combine une assurance complète en ce qui concerne toutes les protéines connues et ou il est possible d’accroître la base de donnée par mise à jour.

Pour quoi SIMAP est-il employé ?

En raison de la quantité énorme d’ordres de protéines connus dans les bases de données publiquesil est apparu clairement que la plupart d’entres elles ne sera pas expérimentalement testées dans un proche avenir. Néanmoins, les protéines qui ont évolué ont souvent les mêmes fonctions (prétendues orthologs). Ainsi il est possible d’impliquer la fonction d’une protéine non caractérisée d’un ortholog avec une fonction connue. Un exemple bien connu qui est les investigations au sujet des gènes et des protéines de souris. Leurs résultats sont également vrai pour les gènes humains orthologous et des protéines dans beaucoup de cas. Les sequences similaires de protéines fournissent des informations au sujet des relations entre les protéines, et sont nécessaires pour la prévision des orthologs. Il y a de plus en plus de méthodes de bio-informatiques qui se fondeNt sur les séquences similaires de protéines . Notre base de données de sequences similaires de protéines fournit des données pré-calculées de similitude et représente les espaces connus de protéines. Ceci ouvre des perspectives complètement nouvelles comparées à la méthode généralement utilisée pour recalculer à plusieurs reprises un tel genre de données.

La matrice de similitude se prolonge si les nouveaux ordres se produisent.

 

Pourquoi avons-nous besoin de l’informatique pour SIMAP ?

 

Les coûts informatiques pour calculer les données de similitude dépenDent de comment sont placer les différents nombres d’ordres contenus. Ainsi l’effort informatique pour maintenir la matrice à jour augmente constamment. Nos ressources internes qui exécutent des calculs pour SIMAP depuis des années ne sont pas plus suffisantes pour maintenir tous les nouveaux ordres. C’est pourQuoi nous avons mis en application un client SIMAP pour la plateforme de BOINC qui est basée sur l’algorithme de FASTA pour détecter des sequences similaires .

Quels sont les établissements derrière SIMAP ?

SIMAP est un projet commun du centre national de recherche de GSF pour l’environnement et la santé, de Neuherberg et de l’université technique de Munich, centre de la vie et des sciences de l’alimentation Weihenstephan (tous les deux en Allemagne).L’utilisation de SIMAP est complètement libre pour l’éducation et la recherche du public.

 

Définition d’un protéines :

 

Orthologs : Partie du code d’une protéine dont les propriétés et les effets sont connus et toujours vérifiables.