Formato FASTA: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Linha 67:
</pre>
 
===Representação de seqüências===
<!--
 
 
 
Após a linha de cabeçalho e comentários, uma ou mais linhas devem seguir descrevendo a seqüência: cada linha de uma seqüência deve ter menos de 80 caracteres. Seqüências podem ser seqüências de proteínas ou seqüências de [[ácido nucleico|ácidos nucleicos]], e elas podem conter lacunas ou caracteres de alinhamento (ver [[alinhamento de sequências]]). Seqüências devem ser representados nos códigos padrão IUB/IUPAC para [[aminoácido|aminoácidos]] e [[ácido nucleico|ácidos nucleicos]], com as seguintes exceções: minúsculas são aceitas e são mapeadas em letras maiúsculas; um único hífen ou traço pode ser usado para representar um caracter de lacuna; e em seqüências de aminoácidos, U e * são letras aceitáveis (veja abaixo). Dígitos numéricos não são permitidos, mas são usados ​​em alguns bancos de dados para indicar a posição na seqüência.
===Sequence representation===
 
TheOs nucleiccódigos acidde codesácido supportednucléico are{{Citationsuportados needed|date=June 2011}}são<ref>{{citecitar web|url=http://www.dna.affrc.go.jp/misc/MPsrch/InfoIUPAC.html|titletítulo=IUPAC code table|publisherpublicado=NIAS DNA Bank}}</ref>:
After the header line and comments, one or more lines may follow describing the sequence: each line of a sequence should have fewer than 80 characters. Sequences may be [[primary structure|protein sequences]] or [[nucleic acid]] sequences, and they can contain gaps or alignment characters (see [[sequence alignment]]). Sequences are expected to be represented in the standard IUB/IUPAC [[amino acid]] and [[nucleic acid]] codes, with these exceptions: lower-case letters are accepted and are mapped into upper-case; a single hyphen or dash can be used to represent a gap character; and in amino acid sequences, U and * are acceptable letters (see below). Numerical digits are not allowed but are used in some databases to indicate the position in the sequence.
 
The nucleic acid codes supported are{{Citation needed|date=June 2011}}<ref>{{cite web|url=http://www.dna.affrc.go.jp/misc/MPsrch/InfoIUPAC.html|title=IUPAC code table|publisher=NIAS DNA Bank}}</ref>:
{| class="wikitable sortable" style="border:solid 1px black;"
! Nucleic Acid Code
Linha 81 ⟶ 78:
|-
| A
| [[adenosineAdenosina|'''A'''denosinedenosina]]
|-
| C
| [[cytosineCitosina|'''C'''ytosineitosina]]
|-
| G
| [[guanineGuanina|'''G'''uanineuanina]]
|-
| T
| [[thymidineTimidina|'''T'''hymidineimidina]]
|-
| U
| [[uracilUracilo|'''U'''racilracila]]
|-
| R
| G A ([[purinePurina|pu'''R'''ineina]])
|-
| Y
| T U C ([[pyrimidinePirimidina|Pirimidina - do inglês p'''Y'''rimidine]])
|-
| K
| G T U ([[ketoneCetona|Cetona - do inglês '''K'''etone]]{{Citation needed|date=June 2011}})
|-
| M
| A C ([[aminoAmina|grupo a'''M'''ino groupina]]{{Citation needed|date=June 2011}})
|-
| S
| G C (Interação forte -do inglês '''S'''trong interaction{{Citation needed|date=June 2011}})
|-
| W
| A T U (Interação fraca -do inglês '''W'''eak interaction{{Citation needed|date=June 2011}})
|-
| B
| G T U C (notnão A) ('''B''' comesvem afterapós A)
|-
| D
| G A T U (notnão C) ('''D''' comesvem afterapós C)
|-
| H
| A C T U (notnão G) ('''H''' comesvem afterapós G)
|-
| V
| G C A (notnão T, notnão U) ('''V''' comesvem afterapós U)
|-
| N
| A G C T U (qualquer - a'''N'''y)
|-
| X
| mascarado
| masked
|-
| -
| lacuna de comprimento indeterminado
| gap of indeterminate length
|}
 
<!--
 
 
The codes supported (24 amino acids and 3 special codes) are: