No sequenciamento de DNA, uma read é uma sequência inferida de pares de bases (ou probabilidades de pares de bases) correspondentes a todo ou parte de um único fragmento de DNA. Um experimento de sequenciamento típico envolve a fragmentação do genoma em milhões de moléculas, que são selecionadas por tamanho e ligadas a adaptadores. O conjunto de fragmentos é denominado biblioteca de sequenciamento, que é sequenciado para produzir um conjunto de reads.[1]

Tamanho de readsEditar

As tecnologias de sequenciamento variam no tamanho das reads produzidas. Reads de tamanho entre 20-40 pares de bases (pb) são chamadas de ultracurtas.[2] Sequenciadores típicos produzem tamanho de reads na faixa de 100-500 pb.[3] No entanto, as plataformas da Pacific Biosciences produzem reads de aproximadamente 1500 bp.[4] O tamanho da read é um fator que pode afetar os resultados dos estudos biológicos.[5] Por exemplo, reads mais longas melhoram a resolução da montagem do genoma de novo e a detecção de variantes estruturais. Estima-se que reads com tamanho superior a 100 quilobases (kb) serão necessários para a montagem de novo do genoma humano.[6] Os pipelines de bioinformática para analisar dados de sequenciamento geralmente levam em consideração o tamanho das reads.[7]

Referências

  1. «Sequencing library: what is it?». Breda Genetics. 12 de agosto de 2016. Consultado em 23 de julho de 2017 
  2. Chaisson, Mark J. (2009). «De novo fragment assembly with short mate-paired reads: Does the read length matter?». Genome Research. 19: 336–346. PMC 2652199 . PMID 19056694. doi:10.1101/gr.079053.108. Consultado em 23 de julho de 2017 
  3. Junemann, Sebastian (2013). «Updating benchtop sequencing performance comparison». Nature Biotechnology. 31: 294–296. PMID 23563421. doi:10.1038/nbt.2522 
  4. Quail, Michael A. (2012). «A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers». BMC Genomics. 13: 341. PMC 3431227 . PMID 22827831. doi:10.1186/1471-2164-13-341 
  5. Chhangawala, Sagar; Rudy, Gabe; Mason, Christopher E.; Rosenfeld, Jeffrey A. (23 de junho de 2015). «The impact of read length on quantification of differentially expressed genes and splice junction detection». Genome Biology. 16. 131 páginas. PMC 4531809 . PMID 26100517. doi:10.1186/s13059-015-0697-y 
  6. Chaisson, Mark J.P. (2015). «Genetic variation and the de novo assembly of human genomes». Nature Reviews Genetics. 16: 627–640. PMC 4745987 . PMID 26442640. doi:10.1038/nrg3933 
  7. Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J.; Elo, Laura L. (26 de janeiro de 2016). «A survey of best practices for RNA-seq data analysis». Genome Biology. 17. 13 páginas. PMC 4728800 . PMID 26813401. doi:10.1186/s13059-016-0881-8