Formato FASTA: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Linha 15:
 
==História==
 
O formato FASTA/Pearson original é descrito na documentação para o conjunto de programas [[FASTA]]. Ele pode ser baixado com qualquer distribuição gratuita do FASTA (ver fasta20.doc, fastaNV.doc ou fastaNV.me - onde NV é o número da versão).
 
Uma seqüência em formato FASTA é representada como uma série de linhas, que não devem ter mais do que 120 caracteres e, geralmente,
não excedem 80 caracteres. Isso provavelmente ocorreu visando permitir a pré-alocação de tamanhos fixos de linhas no software: naquele momento em que a maioria dos usuários contava com terminais DEC VT (ou compatíveis) só se podia mostrar 80 ou 132 caracteres por linha. A maioria das pessoas preferia a fonte maior nos modos 80 caracteres e por isso tornou-se comum recomendar o uso de 80 caracteres ou menos (geralmente 70) para as linhas FASTA.
 
<!--
 
A sequence in FASTA format is represented as a series of lines, which should be no longer than 120 characters and usually
do not exceed 80 characters. This probably was because to allow for preallocation of fixed line sizes in software: at the time most users relied on DEC VT (or compatible) terminals which could display 80 or 132 characters per line. Most people preferred the bigger font in 80-character modes and so it became the recommended fashion to use 80 characters or less (often 70)
in FASTA lines.{{Citation needed|date=September 2010}}
 
The first line in a FASTA file starts either with a ">" (greater-than) symbol or a ";" (semicolon) and was taken as a comment. Subsequent lines starting with a semicolon would be ignored by software. Since the only comment used was the first, it quickly became used to hold a summary description of the sequence, often starting with a unique library accession number, and with time it has become commonplace use to always use ">" for the first line and to not use ";" comments (which would otherwise be ignored).