GenBank é um banco de dados de anotações de sequências de nucleotídeos publicamente disponíveis e suas traduções de proteínas. Esse banco de dados é produzido e mantido pelo National Center for Biotechnology Information (NCBI).

Página inicial do GenBank
Página inicial do GenBank

História editar

Em 1979, o pesquisador Walter Goad e colaboradores do Laboratório Nacional Los Alamos (LANL) estabeleceram a Base de Dados de Sequências de Los Alamos, que culminou em 1982 na criação do banco de dados públicos GenBank.[1] O projeto foi financiado pelo National Institutes of Health, National Science Foundation, Departamento de Energia e pelo Departamento de Defesa dos Estados Unidos. Contando com a colaboração entre LANL e a firma Bolt, Beranek, and Newman, o GenBank já possuía mais de 2000 sequências armazenadas no final de 1983.

Organismos armazenados no GenBank editar

Com o advento das novas tecnologias de sequenciamento de DNA, o banco de dados do GenBank passou a armazenar um número cada vez maior de sequências e anotações de genomas de organismos.

Total de organismos armazenados no Genbank (Release 191)[2]
Organismo Pares de base
Homo sapiens 16.310.774.187
Mus musculus 9.974.977.889
Rattus norvegicus 6.521.253.272
Bos taurus 5.386.258.455
Zea mays 5.062.731.057
Sus scrofa 4.887.861.860
Danio rerio 3.120.857.462
Strongylocentrotus purpuratus 1.435.236.534
Macaca mulatta 1.256.203.101
Oryza sativa Japonica Group 1.255.686.573
Nicotiana tabacum 1.197.357.811
Xenopus (Silurana) tropicalis 1.249.938.611
Drosophila melanogaster 1.119.965.220
Pan troglodytes 1.008.323.292
Arabidopsis thaliana 1.144.226.616
Canis lupus familiaris 951.238.343
Vitis vinifera 999.010.073
Gallus gallus 899.631.338
Glycine max 906.638.854
Triticum aestivum 898.689.329

Referências

  1. Hanson, Todd (21 de novembro de 2000). «Walter Goad, GenBank founder, dies». Newsbulletin: obituary. Los Alamos National Laboratory 
  2. Benson, Dennis A.; Karsch-Mizrachi, Ilene; Lipman, David J.; Ostell, James; Sayers, Eric W. (1 de janeiro de 2011). «GenBank». Nucleic Acids Research (em inglês). 39 (suppl_1): D32–D37. ISSN 0305-1048. PMID 21071399. doi:10.1093/nar/gkq1079