Boinc - Equipe de la Science

Site de la miniteam Equipe de la Science composante de L’Alliance Francophone sur la grille de calcul partagé et bénévole BOINC.
  • Article

  Botanicus.org

SciLINC

mardi 19 juin 2007, par domi

Le Jardin Botanique du Missouri propose "Scientific Literature Indexing on Network Computers" (SciLINC ou "Indexation Scientifique de Littérature sur un réseau d’ordinateurs" en français), une application de calcul de ressource publique qui classera automatiquement de grands montants de littérature scientifique numérisé, qui fournira finalement aux utilisateurs un portail Web, disponible sur www.botanicus.org , pour la découverte d’informations sur les plantes. Cette application de ressource publique utilise les PC connectés à internet pour analyser les données quand le PC est inactif. Ces applications fonctionnent généralement sous forme d’écran de veille, en tirant profit de la puissance inutilisée de l’ordinateur pour traiter de vastes quantités de données.

Notre application, disponible gratuitement pour l’ensemble du public, analysera des textes numérisés de littérature botanique afin de renvoyer un index pour les textes intégral et un index pour les mot-clé pour chaque page. Ces mots-clés seront annotés avec des liens menant vers d’autres ressources internet en ligne. Des pages Web au sujet d’une plante particulière - permettant aux utilisateurs du portail de rechercher des termes, découvrir ou elles résident dans le corps de la littérature numérisé, voir les pages appropriées, et cliquer pour découvrir d’autres ressources en ligne liées à ce mot-clé. Ce portail Web pourrait devenir un outil essentiel pour ceux qui sont intéressé par les plantes, notamment les scientifiques, les étudiants et le grand public.

Le projet est mis en oeuvre pour atteindre 4 buts principaux :

1- Augmenter l’accès à la littérature scientifique pour le public. La Bibliothèque du Jardin Botanique du Missouri contient une richesse de la littérature scientifique primaire sur les plantes, mais ceci n’est pas disponible pour le public. En outre, scientifiques et étudiants voyageant partout dans le monde pour utiliser cette rare et unique littérature de notre collection. Ce matériel disponible gratuitement via le Web fournira une ressource inégalée pour les scientifiques, les étudiants et le grand public.

2- Augmenter l’utilité des matériaux numérisé en créant un dépôt de littérature scannée sur le Web, des mots-clés, et des ressources en ligne avec des outils pour la recherche et l’analyse. Les utilisateurs pourront rechercher à travers le texte numérisé et découvrir où est leur terme de recherche dans notre collection numérisé. En outre, nous emploierons SciLINC pour identifier et annoter les termes spéciaux, ou mot(s)-clé(s), dans toute notre collection numérisé. Ces mots-clés seront dérivés de notre monde - les bases de données botaniques renommées incluront des noms de plantes, des noms de lieu, des auteurs, et d’autres expressions intéressantes pour ceux qui étudient les plantes. Ces mots-clés auront des outlinks vers d’autres ressources en ligne, en créant une annotation sur le Web pour relier l’ensemble des informations sur les plantes.

3- Créer un outil éducatif pour se renseigner sur la flore. Tandis que l’application classe les mots-clés, l’ordinateur de l’utilisateur montrera des informations sur la vie des plantes aux Etats-Unis et tout autour du monde. L’information montrée décrira chaque nom de plante ou la limite actuellement classée sur l’ordinateur de l’utilisateur, et inclura des données descriptives, des images, des cartes, et des out-links annotés pour cette limite.

4- Fournir un modèle pour adopter une ressource publique des applications de calcul au sein de la communauté de bibliothèque. Des ressources publiques d’application de calcul ont été utilisées avec succès dans les communautés de recherches et de musée pour analyser de grandes quantités de données, mais jusqu’ici elles n’ont pas été appliquées dans les bibliothèques. Ces applications tiennent leur promesses pour résoudre des problèmes complexes ayant besoin de grandes quantités de puissance de calcul d’ordinateur, et nous visons à fournir le modèle pour introduire cette technologie dans la communauté de bibliothèque.

Résultats prévus : A l’accomplissement de ce projet de 3 ans, l’équipe du projet aura créé un portail Web que les scientifiques et le public pourront employer pour accéder à la littérature national assez importante au sujet des plantes. En outre, nous aurons conçu une application de calcul répartie, disponible à n’importe quel volontaire intéressé, qui automatise l’indexation de la littérature numérisé et localise l’occurrence des mots-clés dans cette littérature. En conclusion, nous aurons fourni un modèle pour la ressource publique d’incorporation calculant pour des projets de bibliothèque.

Pour plus d’infos sur le projet contacter Chris Freeland