O método da Curva Z (ou Curva-Z ) é um algoritmo de bioinformática para análise do genoma . A Curva-Z é uma curva tridimensional que constitui uma representação única de uma sequência de DNA, ou seja, para dadas Curva-Z e sequência de DNA, ambas podem ser reconstruídas univocamente a partir da outra .[1] A curva resultante tem uma forma em ziguezague, daí o nome Curva-Z.

Curva Z do cromossomo III da C. elegans

Fundamentação editar

O método da Curva Z foi criado em 1994 como uma forma de mapear visualmente uma sequência de DNA ou RNA. Diferentes propriedades da Curva Z, como sua simetria e periodicidade, podem fornecer informações únicas sobre a sequência de DNA.[2] A curva Z é gerada a partir de uma série de nós: P0, P1..PN, com as coordenadas xn, yn e zn (n = 1, 2...N, sendo N o comprimento da sequência de DNA). A Curva Z é criada conectando-se cada um dos nós sequencialmente.[3]

 

 

 

 

Aplicações editar

Informações sobre a distribuição de nucleotídeos em uma sequência de DNA podem ser determinadas a partir da Curva Z. Os quatro nucleotídeos são combinados em seis categorias diferentes. Os nucleotídeos são atribuídos a cada categoria de acordo com alguma característica e cada categoria é designada por uma letra.[4]

Purina R = A, G Amino M = A, C Ligações de hidrogênio fracas W = A, T
Pirimidina Y = C, T Ceto K = G, T Ligações de hidrogênio fortes S = G, C

Os componentes x, y e z da Curva Z mostram a distribuição de cada uma dessas categorias de bases para a sequência de DNA em estudo. O componente x representa a distribuição de bases de purinas e pirimidinas (R/Y). O componente y mostra a distribuição das bases amino e ceto (M/K) e o componente z mostra a distribuição ligações de hidrogênio fortes e fracas (S/W) na sequência de DNA.[5]

O método da Curva Z tem sido usado em muitas áreas diferentes da pesquisa genômica, como identificação de origem de replicação[6][7][8][9], predição de genes ab initio[10], identificação de isócoros[11], identificação de ilhas genômicas[12] e genômica comparativa.[13] A análise da Curva Z também mostrou-se capaz de prever se um gene contém íntrons.[14]

Pesquisa editar

Experimentos mostraram que a Curva Z pode ser usada para identificar a origem de replicação em vários organismos. Um estudo analisou a Curva Z de várias espécies de Archaea e descobriu que o oriC está localizado em um pico acentuado da curva seguido por uma ampla base. Esta região era rica em bases AT e tinha múltiplas repetições, o que é esperado para locais de origem de replicação.[8] Este e outros estudos similares foram usados para gerar um programa capaz de prever as origens de replicação a partir da Curva Z.

A curva Z também tem sido usada experimentalmente para determinar relações filogenéticas. Em um estudo, um novo coronavírus na China foi analisado usando análise de sequência e o método da Curva Z para determinar sua relação filogenética com outros coronavírus. Foi determinado que semelhanças e diferenças em espécies próximas podem ser rapidamente determinadas examinando visualmente suas curvas Z. Um algoritmo foi criado para identificar o centro geométrico e outras tendências nas Curvas Z de 24 espécies de coronavírus. Os dados foram usados para criar uma árvore filogenética. Os resultados corresponderam à árvore gerada através da análise de sequência. O método da Curva Z provou ser superior porque, enquanto a análise de sequência cria uma árvore filogenética baseada apenas em sequências de codificação no genoma, o método da Curva Z analisou o genoma inteiro.[15]

Referências editar

  1. Zhang CT, Zhang R, Ou HY (2003). «The Z curve database: a graphic representation of genome sequences». Bioinformatics. 19 (5): 593–99. PMID 12651717. doi:10.1093/bioinformatics/btg041  
  2. Zhang, Ren; Zhang, Chun-Ting (fevereiro de 1994). «Z Curves, An Intutive [sic] Tool for Visualizing and Analyzing the DNA Sequences». Journal of Biomolecular Structure and Dynamics. 11 (4): 767–782. PMID 8204213. doi:10.1080/07391102.1994.10508031 
  3. Yu, Chenglong; Deng, Mo; Zheng, Lu; He, Rong Lucy; Yang, Jie; Yau, Stephen S.-T. (18 de julho de 2014). «DFA7, a New Method to Distinguish between Intron-Containing and Intronless Genes». PLOS ONE. 9 (7): e101363. PMC 4103774 . PMID 25036549. doi:10.1371/journal.pone.0101363  
  4. Zhang, Ren; Zhang, Chun-Ting (1 de abril de 2014). «A Brief Review: The Z-curve Theory and its Application in Genome Analysis». Current Genomics. 15 (2): 78–94. ISSN 1389-2029. PMC 4009844 . PMID 24822026. doi:10.2174/1389202915999140328162433 
  5. Zhang, C. T. (7 de agosto de 1997). «A symmetrical theory of DNA sequences and its applications». Journal of Theoretical Biology. 187 (3): 297–306. ISSN 0022-5193. PMID 9245572. doi:10.1006/jtbi.1997.0401 
  6. Zhang R, Zhang CT (2005). «Identification of replication origins in archaeal genomes based on the Z-curve method». Archaea. 1 (5): 335–46. PMC 2685548 . PMID 15876567. doi:10.1155/2005/509646  
  7. Worning P, Jensen LJ, Hallin PF, Staerfeldt HH, Ussery DW (fevereiro 2006). «Origin of replication in circular prokaryotic chromosomes». Environ. Microbiol. 8 (2): 353–61. PMID 16423021. doi:10.1111/j.1462-2920.2005.00917.x 
  8. a b Zhang, Ren; Zhang, Chun-Ting (20 de setembro de 2002). «Single replication origin of the archaeon Methanosarcina mazei revealed by the Z curve method». Biochemical and Biophysical Research Communications. 297 (2): 396–400. ISSN 0006-291X. PMID 12237132. doi:10.1016/s0006-291x(02)02214-3 
  9. Worning, Peder; Jensen, Lars J.; Hallin, Peter F.; Staerfeldt, Hans-Henrik; Ussery, David W. (1 de fevereiro de 2006). «Origin of replication in circular prokaryotic chromosomes». Environmental Microbiology. 8 (2): 353–361. ISSN 1462-2912. PMID 16423021. doi:10.1111/j.1462-2920.2005.00917.x 
  10. Guo FB, Ou HY, Zhang CT (2003). «ZCURVE: a new system for recognizing protein-coding genes in bacterial and archaeal genomes». Nucleic Acids Research. 31 (6): 1780–89. PMC 152858 . PMID 12626720. doi:10.1093/nar/gkg254 
  11. Zhang CT, Zhang R (2004). «Isochore structures in the mouse genome». Genomics. 83 (3): 384–94. PMID 14962664. doi:10.1016/j.ygeno.2003.09.011 
  12. Zhang R, Zhang CT (2004). «A systematic method to identify genomic islands and its applications in analyzing the genomes of Corynebacterium glutamicum and Vibrio vulnificus CMCP6 chromosome I». Bioinformatics. 20 (5): 612–22. PMID 15033867. doi:10.1093/bioinformatics/btg453  
  13. Zhang R, Zhang CT (2003). «Identification of genomic islands in the genome of Bacillus cereus by comparative analysis with Bacillus anthracis». Physiological Genomics. 16 (1): 19–23. PMID 14600214. doi:10.1152/physiolgenomics.00170.2003 
  14. Zhang, C. T.; Lin, Z. S.; Yan, M.; Zhang, R. (21 de junho de 1998). «A novel approach to distinguish between intron-containing and intronless genes based on the format of Z curves». Journal of Theoretical Biology. 192 (4): 467–473. ISSN 0022-5193. PMID 9680720. doi:10.1006/jtbi.1998.0671 
  15. Zheng, Wen-Xin; Chen, Ling-Ling; Ou, Hong-Yu; Gao, Feng; Zhang, Chun-Ting (1 de agosto de 2005). «Coronavirus phylogeny based on a geometric approach». Molecular Phylogenetics and Evolution. 36 (2): 224–232. ISSN 1055-7903. PMC 7111192 . PMID 15890535. doi:10.1016/j.ympev.2005.03.030  

Ligacões externas editar