Read

No sequenciamento de DNA, uma read é uma sequência inferida de pares de bases (ou probabilidades de pares de bases) correspondentes a todo ou parte de um único fragmento de DNA. Um experimento de sequenciamento típico envolve a fragmentação do genoma em milhões de moléculas, que são selecionadas por tamanho e ligadas a adaptadores. O conjunto de fragmentos é denominado biblioteca de sequenciamento, que é sequenciado para produzir um conjunto de reads.^[1]

Tamanho de reads editar

As tecnologias de sequenciamento variam no tamanho das reads produzidas. Reads de tamanho entre 20-40 pares de bases (pb) são chamadas de ultracurtas.^[2] Sequenciadores típicos produzem tamanho de reads na faixa de 100-500 pb.^[3] No entanto, as plataformas da Pacific Biosciences produzem reads de aproximadamente 1500 bp.^[4] O tamanho da read é um fator que pode afetar os resultados dos estudos biológicos.^[5] Por exemplo, reads mais longas melhoram a resolução da montagem do genoma de novo e a detecção de variantes estruturais. Estima-se que reads com tamanho superior a 100 quilobases (kb) serão necessários para a montagem de novo do genoma humano.^[6] Os pipelines de bioinformática para analisar dados de sequenciamento geralmente levam em consideração o tamanho das reads.^[7]

Referências

↑ «Sequencing library: what is it?». Breda Genetics. 12 de agosto de 2016. Consultado em 23 de julho de 2017
↑ Chaisson, Mark J. (2009). «De novo fragment assembly with short mate-paired reads: Does the read length matter?». Genome Research. 19: 336–346. PMC 2652199 . PMID 19056694. doi:10.1101/gr.079053.108. Consultado em 23 de julho de 2017
↑ Junemann, Sebastian (2013). «Updating benchtop sequencing performance comparison». Nature Biotechnology. 31: 294–296. PMID 23563421. doi:10.1038/nbt.2522
↑ Quail, Michael A. (2012). «A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers». BMC Genomics. 13: 341. PMC 3431227 . PMID 22827831. doi:10.1186/1471-2164-13-341
↑ Chhangawala, Sagar; Rudy, Gabe; Mason, Christopher E.; Rosenfeld, Jeffrey A. (23 de junho de 2015). «The impact of read length on quantification of differentially expressed genes and splice junction detection». Genome Biology. 16. 131 páginas. PMC 4531809 . PMID 26100517. doi:10.1186/s13059-015-0697-y
↑ Chaisson, Mark J.P. (2015). «Genetic variation and the de novo assembly of human genomes». Nature Reviews Genetics. 16: 627–640. PMC 4745987 . PMID 26442640. doi:10.1038/nrg3933
↑ Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J.; Elo, Laura L. (26 de janeiro de 2016). «A survey of best practices for RNA-seq data analysis». Genome Biology. 17. 13 páginas. PMC 4728800 . PMID 26813401. doi:10.1186/s13059-016-0881-8

Ver também

Formato FASTQ

[1] «Sequencing library: what is it?». Breda Genetics. 12 de agosto de 2016. Consultado em 23 de julho de 2017

[2] Chaisson, Mark J. (2009). «De novo fragment assembly with short mate-paired reads: Does the read length matter?». Genome Research. 19: 336–346. PMC 2652199 . PMID 19056694. doi:10.1101/gr.079053.108. Consultado em 23 de julho de 2017

[3] Junemann, Sebastian (2013). «Updating benchtop sequencing performance comparison». Nature Biotechnology. 31: 294–296. PMID 23563421. doi:10.1038/nbt.2522

[4] Quail, Michael A. (2012). «A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers». BMC Genomics. 13: 341. PMC 3431227 . PMID 22827831. doi:10.1186/1471-2164-13-341

[Sagar-5] Chhangawala, Sagar; Rudy, Gabe; Mason, Christopher E.; Rosenfeld, Jeffrey A. (23 de junho de 2015). «The impact of read length on quantification of differentially expressed genes and splice junction detection». Genome Biology. 16. 131 páginas. PMC 4531809 . PMID 26100517. doi:10.1186/s13059-015-0697-y

[6] Chaisson, Mark J.P. (2015). «Genetic variation and the de novo assembly of human genomes». Nature Reviews Genetics. 16: 627–640. PMC 4745987 . PMID 26442640. doi:10.1038/nrg3933

[conesa-7] Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J.; Elo, Laura L. (26 de janeiro de 2016). «A survey of best practices for RNA-seq data analysis». Genome Biology. 17. 13 páginas. PMC 4728800 . PMID 26813401. doi:10.1186/s13059-016-0881-8

[1]

[2]

[3]

[4]

[5]

[6]

[7]