BLAST
Un article de Wikipédia, l'encyclopédie libre.
|
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
|
| BLAST | |
|---|---|
| Développeur | Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI |
| Dernière version | 2.2.16 [+/−] |
| Environnement | Multiplate-forme |
| Type | Outil bio-informatique |
| Licence | Domaine public |
| Site web | Serveur FTP de NCBI |
BLAST (acronyme de basic local alignment search tool) est une méthode de recherche heuristique utilisée en bio-informatique permettant de trouver les régions similaires entre deux ou plusieurs séquences de nucléotides ou d'acides aminés. Ce programme permet de retrouver rapidement dans des bases de données, les séquences ayant des zones de similitude avec une séquence donnée (introduite par l'utilisateur).[1]
BLAST est utilisé pour trouver des relations fonctionnelles ou évolutives entre les séquences et peut aider à identifier les membres d'une même famille de gènes.
Sommaire |
[modifier] Histoire
Ce programme a été développé par Stephen Altschul, Warren Gish et David Lipman au National Center for Biotechnology Information (NCBI). La publication originale parue en octobre 1990, Basic local alignment search tool [2], a été citée plus de 20 000 fois, ce qui en fait l'une des plus citées dans le monde scientifique.
[modifier] Variations
[modifier] Des données utilisées
Le terme blast peut être modifié en fonction de la nature de la séquence d'entrée, et de la base de donnée utilisée:
- blast de nucléotides: Séquence nucléique contre une base de données de séquences nucléiques
- blast de protéines: Séquence de protéine contre une base de données de séquences de protéines
- blastx: Séquence nucléique traduite en séquence de protéine contre une base de données de séquences de protéines
- tblastn: Séquence de protéine contre une base de données de séquences nucléiques traduites en séquences de protéines
- tblastx: Séquence nucléique traduite en séquence de protéine contre une base de données de séquences nucléiques traduites en séquences de protéines
[modifier] De l'algorithme
Depuis sa création différentes versions de l'algorithme ont été développées:
- BlastN: Blast de séquences nucléiques, lent mais permet de retrouver des similarité localisées uniquement sur une partie des séquences
- BlastP: Blast de séquences de protéines
- Megablast: Rapide, permet de retrouver des séquences hautement similaire
- PSI-Blast (Position-Specific Iterated BLAST): Blast relancé plusieurs fois par itération, à chaque itération une séquence consensus est déterminée à partir des résultats, et utilisée comme séquence source pour l'itération suivante.
- PHI-BLAST (Pattern Hit Initiated Blast): Le programme utilise comme source une séquence protéique et un motif, celui-ci est utilisé comme point de départ des recherches de similarité avec les séquences présentes dans les bases de données.
[modifier] Référence
- ↑ Greg Gibson, Spencer V. Muse, Lionel Domenjoud, Raymond Cunin (trad. Lionel Domenjoud), Précis de génomique, De Boeck Université, 2004 (ISBN 2804143341), « 2 »
- ↑ (en) Altschul SF Gish W, Miller W, Myers EW et Lipman DJ, « Basic local alignment search tool », dans Journal of molecular biology, vol. 215, no 3, 5 octobre 1990, p. 403-10 [résumé (page consultée le 12 décembre 2008)]
[modifier] Voir aussi
[modifier] Lien externe
- (en) Site officiel
