Formato FASTA: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Linha 1:
{{em tradução}}
Em [[bioinformática]], o '''formato FASTA''' é um [[Formato de arquivo|formato]] baseado em texto para representar tanto [[Sequência de DNA|sequencias de nucleótidos]] quanto [[Sequência de DNA|sequencias de peptídeos]], no qual os nucleotídeos ou [[aminoácido|aminoácidos]] são representados usando códigos de uma única letra.<ref>{{Referência a livro|autor=Markel, Scott; León, Darryl|título=Sequence Analysis in a Nutshell|subtítulo=A guide to Common Tools and Databases|idioma=|edição=|local=Beijing|editora=O'Reilly|ano=2003|página=3-5|páginas=286|volumes=|volume=|id=ISBN 0-596-00494-X}}<!/ref><ref>{{Referência a livro|autor=Korf, Ian;Yandell, Mark;Bedell, Joseph|título=Blast|subtítulo=|idioma=|edição=|local=Beijing|editora=O'Reilly|ano=2003|páginas=339|volumes=|volume=|id=ISBN 0-596-The00299-8}}</ref>. formatO alsoformato allowstambém forpermite sequenceseqüências namesde andnomes commentse tocomentários precedeprecedendo theas sequencessequências. TheO formatformato originatesse fromorigina thedo [[FASTA]], softwarepacote packagede software, butmas hasagora nowse becometornou aum standardpadrão inna theárea fieldde [[bioinformática]]. A simplicidade do formato FASTA torna mais fácil manipular e analisar seqüências usando ferramentas de processamento de texto e [[linguagem de script|linguagens de script]] como [[Python]], [[Ruby (linguagem de programação)|Ruby]], ofe [[bioinformaticsPerl]].
The simplicity of FASTA format makes it easy to manipulate and parse sequences using text-processing tools and [[scripting language]]s like [[Python (programming language)|Python]], [[Ruby_(programming_language)|Ruby]], and [[Perl]].
Uma seqüência em formato FASTA começa com uma descrição de uma única linha, seguida por linhas de dados em seqüência.
A sequence in FASTA format begins with a single-line description, followed by lines of sequence data... The description line is distinguished from the sequence data by a greater-than (">") symbol in the first column. The word following the ">" symbol is the identifier of the sequence, and the rest of the line is the description (both are optional). There should be no space between the ">" and the first letter of the identifier. It is recommended that all lines of text be shorter than 80 characters. The sequence ends if another line starting with a ">" appears; this indicates the start of another sequence. A simple example of one sequence in FASTA format:
>gi|5524211|gb|AAD44166.1| cytochrome b <nowiki>[</nowiki>[[Asian Elephant|Elephas maximus maximus]]<nowiki>]</nowiki>
Linha 274 ⟶ 275:
=={{Ver também}}==