Sequenciamento completo de genoma

 Nota: Este artigo é sobre genoma. Para DNA, veja Sequenciamento de DNA.

O sequenciamento completo de genoma (SCG) (eu inglês: whole genome sequencing - WGS), também conhecido como sequenciamento de genoma completo, sequenciamento total do genoma, ou sequenciamento do genoma inteiro, é o processo de determinar a totalidade, ou quase a totalidade, da sequência de DNA do genoma de um organismo em um único momento.[2] Isso implica o sequenciamento de todo o DNA cromossômico de um organismo, bem como do DNA contido nas mitocôndrias e, no caso das plantas, no cloroplasto.

Os eletroferogramas são comumente usados para sequenciar partes de genomas.[1]
Cariograma esquemático de um ser humano, mostrando uma visão geral do genoma humano, com 22 cromossomos homólogos, tanto a versão feminina (XX) quanto a masculina (XY) do cromossomo sexual (canto inferior direito), bem como o genoma mitocondrial (em escala no canto inferior esquerdo)

O sequenciamento completo do genoma tem sido amplamente usado como ferramenta de pesquisa, mas foi introduzido na clínica em 2014.[3][4][5] No futuro da medicina personalizada, os dados da sequência do genoma completo podem ser uma ferramenta importante para orientar a intervenção terapêutica.[6] A ferramenta de sequenciamento de genes no nível de polimorfismo de nucleotídeo único (single-nucleotide polymorphism - SNP) também é usada para identificar variantes funcionais de estudos de associação e melhorar o conhecimento disponível para pesquisadores interessados em biologia evolutiva e, portanto, pode estabelecer a base para prever a suscetibilidade a doenças e a resposta a medicamentos.

O SGC não deve ser confundido com a impressão genética, que determina apenas a probabilidade de que o material genético tenha vindo de um determinado indivíduo ou grupo e não contém informações adicionais sobre relações genéticas, origem ou suscetibilidade a doenças específicas.[7] Além disso, o sequenciamento completo do genoma não deve ser confundido com métodos que sequenciam subconjuntos específicos do genoma - tais métodos incluem o sequenciamento completo do exoma (SCE, 1-2% do genoma) ou a genotipagem de SNP (< 0,1% do genoma).

Histórico editar

 
O primeiro genoma bacteriano completo a ser sequenciado foi o da bactéria Haemophilus influenzae.
 
O nematóide Caenorhabditis elegans foi o primeiro animal a ter seu genoma completo sequenciado.
 
O genoma completo da Drosophila melanogaster foi sequenciado em 2000.
 
A Arabidopsis thaliana foi o primeiro genoma de planta sequenciado.
 
O genoma do camundongo de laboratório Mus musculus foi publicado em 2002.
 
Foram necessários 10 anos e 50 cientistas de todo o mundo para sequenciar o genoma da Elaeis guineensis (dendê). Esse genoma foi particularmente difícil de sequenciar porque tinha muitas sequências repetidas que são difíceis de organizar.[8]

Os métodos de sequenciamento de DNA usados nas décadas de 1970 e 1980 eram manuais; por exemplo, o sequenciamento Maxam-Gilbert e o sequenciamento Sanger. Vários bacteriófagos inteiros e genomas virais de animais foram sequenciados por essas técnicas, mas a mudança para métodos de sequenciamento mais rápidos e automatizados na década de 1990 facilitou o sequenciamento de genomas bacterianos e eucarióticos maiores.[9]

O primeiro vírus a ter seu genoma completo sequenciado foi o bacteriófago MS2, em 1976.[10] Em 1992, o cromossomo III de uma levedura foi o primeiro cromossomo de qualquer organismo a ser totalmente sequenciado.[11] O primeiro organismo cujo genoma completo foi totalmente sequenciado foi o Haemophilus influenzae, em 1995.[12] Depois dele, os genomas de outras bactérias e de algumas arqueas foram sequenciados pela primeira vez, em grande parte devido ao tamanho pequeno do genoma. O H. influenzae tem um genoma de 1.830.140 pares de bases de DNA.[12] Em contraste, os eucariotos, tanto unicelulares quanto multicelulares, como a Amoeba dubia e os seres humanos (Homo sapiens), respectivamente, têm genomas muito maiores (paradoxo do valor C).[13] A A. dubia tem um genoma de 700 bilhões de pares de nucleotídeos espalhados por milhares de cromossomos.[14] Os seres humanos contêm menos pares de nucleotídeos (cerca de 3,2 bilhões em cada célula germinativa; observe que o tamanho exato do genoma humano ainda está sendo revisado) do que a A. dubia, no entanto, o tamanho do genoma deles supera em muito o tamanho do genoma de bactérias individuais.[15]

Os primeiros genomas bacterianos e arqueanos, inclusive o do H. influenzae, foram sequenciados pelo sequenciamento Shotgun.[12] Em 1996, o primeiro genoma eucariótico (Saccharomyces cerevisiae) foi sequenciado. S. cerevisiae, um organismo modelo na biologia, tem um genoma de apenas cerca de 12 milhões de pares de nucleotídeos,[16] e foi o primeiro eucarioto unicelular a ter seu genoma completo sequenciado. O primeiro eucarioto multicelular, e animal, a ter seu genoma completo sequenciado foi o verme nematoide: Caenorhabditis elegans em 1998.[17] Os genomas eucarióticos são sequenciados por vários métodos, incluindo o sequenciamento Shotgun de fragmentos curtos de DNA e o sequenciamento de clones maiores de DNA de bibliotecas de DNA, como cromossomos artificiais bacterianos (bacterial artificial chromosomes - BAC) e cromossomos artificiais de levedura (yeast artificial chromosomes - YAC).[18]

Em 1999, foi publicada toda a sequência de DNA do cromossomo humano 22, o autossomo humano mais curto.[19] No ano 2000, o segundo genoma animal e o segundo invertebrado (mas o primeiro de inseto) foi sequenciado - o da mosca-das-frutas Drosophila melanogaster - uma escolha popular de organismo modelo em pesquisa experimental.[20] O primeiro genoma de planta, o do organismo modelo Arabidopsis thaliana, também foi totalmente sequenciado em 2000.[21] Em 2001, foi publicado um rascunho da sequência completa do genoma humano.[22] O genoma do camundongo de laboratório Mus musculus foi concluído em 2002.[23]

Em 2004, o Projeto Genoma Humano publicou uma versão incompleta do genoma humano.[24] Em 2008, um grupo de Leida, na Holanda, relatou o sequenciamento do primeiro genoma humano feminino (Marjolein Kriek).

Atualmente, milhares de genomas foram total ou parcialmente sequenciados.

Detalhes experimentais editar

Células usadas para sequenciamento editar

Praticamente qualquer amostra biológica que contenha uma cópia completa do DNA, mesmo uma quantidade muito pequena de DNA ou DNA antigo, pode fornecer o material genético necessário para o sequenciamento completo do genoma. Essas amostras podem incluir saliva, células epiteliais, medula óssea, cabelo (desde que o cabelo contenha um folículo piloso), sementes, folhas de plantas ou qualquer outra coisa que tenha células contendo DNA.

A sequência do genoma de uma única célula selecionada de uma população mista de células pode ser determinada usando técnicas de sequenciamento do genoma de uma única célula. Isso tem vantagens importantes na microbiologia ambiental nos casos em que uma única célula de uma determinada espécie de microrganismo pode ser isolada de uma população mista por microscopia com base em suas características morfológicas ou outras características distintivas. Nesses casos, as etapas normalmente necessárias de isolamento e crescimento do organismo em cultura podem ser omitidas, permitindo assim o sequenciamento de um espectro muito maior de genomas de organismos.[25]

O sequenciamento do genoma de uma única célula está sendo testado como um método de diagnóstico genético pré-implantação, em que uma célula do embrião criado por fertilização in vitro é coletada e analisada antes da transferência do embrião para o útero.[26] Após a implantação, o DNA fetal sem células pode ser coletado por simples punção venosa da mãe e usado para o sequenciamento do genoma completo do feto.[27]

Técnicas iniciais editar

 
Um analisador genético ABI PRISM 3100. Esses sequenciadores capilares automatizaram os primeiros esforços de sequenciamento de genomas.

O sequenciamento de quase todo o genoma humano foi realizado pela primeira vez em 2000, em parte por meio do uso da tecnologia de sequenciamento Shotgun. Embora o sequenciamento Shotgun do genoma completo para genomas pequenos (4.000 a 7.000 pares de bases) já estivesse em uso em 1979,[28] uma aplicação mais ampla se beneficiou do sequenciamento final em pares, conhecido popularmente como sequenciamento Shotgun double-barrel. À medida que os projetos de sequenciamento começaram a assumir genomas mais longos e complicados, vários grupos começaram a perceber que informações úteis poderiam ser obtidas com o sequenciamento de ambas as extremidades de um fragmento de DNA. Embora o sequenciamento de ambas as extremidades do mesmo fragmento e a manutenção do controle dos dados emparelhados fossem mais complicados do que o sequenciamento de uma única extremidade de dois fragmentos distintos, o conhecimento de que as duas sequências estavam orientadas em direções opostas e tinham aproximadamente o comprimento de um fragmento de diferença entre si era valioso para a reconstrução da sequência do fragmento-alvo original.

A primeira descrição publicada do uso de extremidades emparelhadas foi em 1990, como parte do sequenciamento do locus HPRT humano,[29] embora o uso de extremidades emparelhadas tenha se limitado a fechar lacunas após a aplicação de uma abordagem tradicional de sequenciamento Shotgun. A primeira descrição teórica de uma estratégia pura de sequenciamento de extremidades em pares, pressupondo fragmentos de comprimento constante, foi feita em 1991.[30] Em 1995, foi introduzida a inovação do uso de fragmentos de tamanhos variados,[31] e foi demonstrado que uma estratégia pura de sequenciamento de extremidades em pares seria possível em alvos grandes. A estratégia foi posteriormente adotada pelo Instituto de Pesquisa Genômica (The Institute for Genomic Research - TIGR) para sequenciar todo o genoma da bactéria H. influenzae em 1995,[32] e depois pela Celera Genomics para sequenciar todo o genoma da mosca-das-frutas em 2000,[33] e, posteriormente, todo o genoma humano. A Applied Biosystems, agora chamada Life Technologies, fabricou os sequenciadores capilares automatizados utilizados pela Celera Genomics e pelo Projeto Genoma Humano.

Técnicas atuais editar

 Ver artigo principal: Sequenciamento de DNA

Embora o sequenciamento capilar tenha sido a primeira abordagem a sequenciar com sucesso um genoma humano quase completo, ele ainda é muito caro e leva muito tempo para fins comerciais. Desde 2005, o sequenciamento capilar tem sido progressivamente substituído por tecnologias de sequenciamento de alto rendimento (de "próxima geração"), como o sequenciamento com corante Illumina, o pirosequenciamento e o sequenciamento SMRT.[34] Todas essas tecnologias continuam a empregar a estratégia básica de Shotgun, ou seja, paralelização e geração de modelos por meio da fragmentação do genoma.

Outras tecnologias surgiram, inclusive a tecnologia Nanopore. Embora a precisão do sequenciamento da tecnologia Nanopore seja menor do que as anteriores, seu comprimento de leitura é, em média, muito maior.[35] Essa geração de leituras longas é valiosa, especialmente em aplicações de sequenciamento de novo de genoma completo.[36]

Análise editar

Em princípio, o sequenciamento completo do genoma pode fornecer a sequência bruta de nucleotídeos do DNA de um organismo individual em um único momento. No entanto, uma análise mais aprofundada deve ser realizada para fornecer o significado biológico ou médico dessa sequência, por exemplo, como esse conhecimento pode ser usado para ajudar a prevenir doenças. Os métodos de análise de dados de sequenciamento estão sendo desenvolvidos e refinados.

Como o sequenciamento gera muitos dados (por exemplo, há aproximadamente seis bilhões de pares de bases em cada genoma diploide humano), seu resultado é armazenado eletronicamente e requer uma grande capacidade de computação e armazenamento.

Embora a análise dos dados WGS possa ser lenta, é possível acelerar essa etapa com o uso de hardware dedicado.[37]

Comercialização editar

 
Custo total do sequenciamento de um genoma humano completo, conforme calculado pelo Instituto Nacional de Pesquisa do Genoma Humano (National Human Genome Research Institute - NHGRI).

Várias empresas públicas e privadas estão competindo para desenvolver uma plataforma de sequenciamento de genoma completo que seja comercialmente robusta para pesquisa e uso clínico,[38] incluindo Illumina,[39] Knome,[40] Sequenom,[41] 454 Life Sciences,[42] Pacific Biosciences,[43] Complete Genomics,[44] Helicos Biosciences,[45] GE Global Research (General Electric), Affymetrix, IBM, Intelligent Bio-Systems,[46] Life Technologies, Oxford Nanopore Technologies,[47] e o Instituto de Genômica de Pequim.[48][49][50] Essas empresas são fortemente financiadas e apoiadas por investidores de capital de risco, fundo de cobertura e bancos de investimento.[51][52]

Uma meta comercial comumente referenciada para o custo de sequenciamento até o final da década de 2010 era de US$ 1.000; no entanto, as empresas privadas estão trabalhando para atingir uma nova meta de apenas US$ 100.[53]

Incentivos editar

Em outubro de 2006, a Fundação X Prize, trabalhando em colaboração com a Fundação J. Craig Venter, estabeleceu o Prêmio Archon X de Genômica,[54] com a intenção de conceder US$ 10 milhões para "a primeira equipe que puder construir um dispositivo e usá-lo para sequenciar 100 genomas humanos em 10 dias ou menos, com uma precisão de não mais do que um erro em cada 1.000.000 de bases sequenciadas, com sequências que cubram com precisão pelo menos 98% do genoma e a um custo recorrente de não mais do que US$ 1.000 por genoma".[55] O Prêmio Archon X de Genômica foi cancelado em 2013, antes de sua data oficial de início.[56][57]

História editar

Em 2007, a Applied Biosystems começou a vender um novo tipo de sequenciador chamado SOLiD System.[58] A tecnologia permitia que os usuários sequenciassem 60 gigabases por execução.[59]

Em junho de 2009, a Illumina anunciou que estava lançando seu próprio Serviço de Sequenciamento do Genoma Completo Pessoal com uma cobertura de 30× por US$ 48.000 por genoma.[60][61] Em agosto, o fundador da Helicos Biosciences, Stephen Quake, declarou que, usando o Sequenciador de Molécula Única da empresa, ele sequenciou seu próprio genoma completo por menos de US$ 50.000.[62] Em novembro, a Complete Genomics começou a vender o sequenciador SOLiD System.[62] Em novembro, a Complete Genomics publicou um artigo revisado por pares na Science demonstrando sua capacidade de sequenciar um genoma humano completo por US$ 1.700.[63][64]

Em maio de 2011, a Illumina reduziu seu serviço de sequenciamento do genoma completo para US$ 5.000 por genoma humano, ou US$ 4.000 se encomendar 50 ou mais.[65] Helicos Biosciences, Pacific Biosciences, Complete Genomics, Illumina, Sequenom, ION Torrent Systems, Halcyon Molecular, NABsys, IBM e GE Global parecem estar disputando a corrida para comercializar o sequenciamento do genoma completo.[34][66]

Com a redução dos custos de sequenciamento, várias empresas começaram a afirmar que seus equipamentos logo atingiriam o genoma de US$ 1.000: essas empresas incluíam a Life Technologies em janeiro de 2012,[67] a Oxford Nanopore Technologies em fevereiro de 2012,[68] e a Illumina em fevereiro de 2014.[69][70] Em 2015, o NHGRI estimou o custo de obtenção de uma sequência do genoma completo em cerca de US$ 1.500.[71] Em 2016, a Veritas Genetics começou a vender o sequenciamento do genoma completo, incluindo um relatório sobre algumas das informações do sequenciamento, por US$ 999.[72] No verão de 2019, a Veritas Genetics reduziu o custo do WGS para US$ 599.[73] Em 2017, a BGI começou a oferecer o WGS por US$ 600.[74]

No entanto, em 2015, alguns observaram que o uso efetivo do sequenciamento de genes inteiros pode custar consideravelmente mais de US$ 1.000.[75] Além disso, segundo informações, ainda há partes do genoma humano que não foram totalmente sequenciadas até 2017.[76][77]

Comparação com outras tecnologias editar

Microarranjos de DNA editar

O sequenciamento completo do genoma fornece informações sobre um genoma que é ordens de grandeza maior do que as dos microarranjos de DNA, o líder anterior em tecnologia de genotipagem.

Para os seres humanos, as matrizes de DNA atualmente fornecem informações genotípicas sobre até um milhão de variantes genéticas,[78][79][80] enquanto o sequenciamento completo do genoma fornecerá informações sobre todos os seis bilhões de bases do genoma humano, ou seja, 3.000 vezes mais dados. Por isso, o sequenciamento completo do genoma é considerado uma inovação disruptiva para os mercados de matrizes de DNA, pois a precisão de ambos varia de 99,98% a 99,999% (em regiões de DNA não repetitivas) e seu custo de consumíveis de US$ 5.000 por 6 bilhões de pares de bases é competitivo (para algumas aplicações) com as matrizes de DNA (US$ 500 por 1 milhão de pares de bases).[42]

Aplicações editar

Frequências de mutação editar

O sequenciamento do genoma completo estabeleceu a frequência de mutação para genomas humanos completos. A frequência de mutação no genoma inteiro entre gerações de seres humanos (de pai para filho) é de cerca de 70 novas mutações por geração.[81][82] Um nível ainda menor de variação foi encontrado comparando-se o sequenciamento do genoma inteiro em células sanguíneas de um par de monozigóticos (gêmeos idênticos) de 100 anos de idade.[83] Foram encontradas apenas 8 diferenças somáticas, embora a variação somática que ocorre em menos de 20% das células sanguíneas não seria detectada.

Nas regiões especificamente codificadoras de proteínas do genoma humano, estima-se que haja cerca de 0,35 mutações que alterariam a sequência de proteínas entre as gerações pai/filho (menos de uma proteína mutada por geração).[84]

No câncer, as frequências de mutação são muito mais altas, devido à instabilidade do genoma. Essa frequência pode depender ainda da idade do paciente, da exposição a agentes danificadores do DNA (como irradiação UV ou componentes da fumaça do tabaco) e da atividade/inatividade dos mecanismos de reparo do DNA [carece de fontes]. Além disso, a frequência de mutação pode variar entre os tipos de câncer: nas células germinativas, as taxas de mutação ocorrem em aproximadamente 0,023 mutações por megabase (Mb), mas esse número é muito maior no câncer de mama (1,18-1,66 mutações somáticas por Mb), no câncer de pulmão (17,7) ou em melanomas (≈33).[85] Como o genoma humano haploide consiste em aproximadamente 3.200 megabases,[86] isso se traduz em cerca de 74 mutações (principalmente em regiões não codificantes) no DNA de células germinativas por geração, mas 3.776-5.312 mutações somáticas por genoma haploide no câncer de mama, 56.640 no câncer de pulmão e 105.600 em melanomas.

A distribuição de mutações somáticas no genoma humano é muito desigual,[87] de modo que as regiões ricas em genes e de replicação precoce recebem menos mutações do que a heterocromatina pobre em genes e de replicação tardia, provavelmente devido à atividade diferencial de reparo do DNA.[88] Em particular, a modificação da histona H3K9me3 está associada a altas frequências de mutação,[89] e a H3K36me3 a baixas frequências de mutação.[90]

Estudos de associação do genoma completo editar

Na pesquisa, o sequenciamento de todo o genoma pode ser usado em um estudo de associação de genoma completo (Genome-Wide Association Study - GWAS), um projeto que visa determinar a variante ou variantes genéticas associadas a uma doença ou a algum outro fenótipo.[91]

Uso em diagnósticos editar

Em 2009, a Illumina lançou seus primeiros sequenciadores de genoma completo aprovados para uso clínico, e não apenas para pesquisa, e os médicos de centros médicos acadêmicos começaram a usá-los discretamente para tentar diagnosticar o que havia de errado com pessoas que as abordagens padrão não tinham conseguido ajudar.[92] Em 2009, uma equipe de Stanford liderada por Euan Ashley realizou a interpretação clínica de um genoma humano completo, o do bioengenheiro Stephen Quake.[93] Em 2010, a equipe de Ashley relatou uma autópsia molecular de genoma completo[94] e, em 2011, estendeu a estrutura de interpretação a uma família totalmente sequenciada, a família West, que foi a primeira família a ser sequenciada na plataforma Illumina.[95] O preço para sequenciar um genoma naquela época era de US$ 19.500, que era cobrado do paciente, mas geralmente pago com uma bolsa de pesquisa; uma pessoa naquela época solicitou o reembolso de sua seguradora.[92] Por exemplo, uma criança precisou de cerca de 100 cirurgias quando tinha três anos de idade e seu médico recorreu ao sequenciamento do genoma completo para determinar o problema; foi necessária uma equipe de cerca de 30 pessoas, incluindo 12 especialistas em bioinformática, três técnicos de sequenciamento, cinco médicos, dois conselheiros genéticos e dois especialistas em ética para identificar uma mutação rara no XIAP que estava causando problemas generalizados.[92][96][97]

Devido às recentes reduções de custo, o sequenciamento do genoma completo tornou-se uma aplicação realista em diagnósticos de DNA. Em 2013, o consórcio 3Gb-TEST obteve financiamento da União Europeia para preparar o sistema de saúde para essas inovações em diagnósticos de DNA.[98][99] Esquemas de avaliação de qualidade, avaliação de tecnologia de saúde e diretrizes precisam ser implementados. O consórcio 3Gb-TEST identificou a análise e a interpretação dos dados de sequência como a etapa mais complicada do processo de diagnóstico.[100] Na reunião do consórcio em Atenas, em setembro de 2014, o consórcio cunhou a palavra genotradução para essa etapa crucial. Essa etapa leva ao chamado genoreport. São necessárias diretrizes para determinar o conteúdo exigido desses relatórios.

O Genomes2People (G2P), uma iniciativa do Brigham and Women's Hospital e da Escola de Medicina de Harvard, foi criado em 2011 para examinar a integração do sequenciamento genômico no atendimento clínico de adultos e crianças.[101] O diretor do G2P, Robert C. Green, já havia liderado o estudo REVEAL (Risk Evaluation and Education for Alzheimer's Disease) uma série de ensaios clínicos que exploram as reações dos pacientes ao conhecimento de seu risco genético para Alzheimer.[102][103] Green e uma equipe de pesquisadores lançaram o Projeto BabySeq em 2013 para estudar as consequências éticas e médicas do sequenciamento do DNA de um bebê.[104][105] Uma segunda fase, BabySeq2, foi financiada pelo NIH em 2021 e é um estudo de implementação que expande esse projeto, planejando inscrever 500 bebês de diversas famílias e acompanhar os efeitos de seu sequenciamento genômico em seus cuidados pediátricos.[106]

Em 2018, pesquisadores do Instituto de Medicina Genômica da Rady Children's, em San Diego, Califórnia, determinaram que o sequenciamento rápido do genoma completo (rWGS) pode diagnosticar distúrbios genéticos a tempo de alterar o tratamento médico ou cirúrgico agudo (utilidade clínica) e melhorar os resultados em bebês com doenças agudas. Os pesquisadores relataram um estudo de coorte retrospectivo de bebês com doenças agudas internados em um hospital infantil regional de julho de 2016 a março de 2017. Quarenta e duas famílias receberam rWGS para diagnóstico etiológico de distúrbios genéticos. A sensibilidade diagnóstica do rWGS foi de 43% (18 de 42 bebês) e 10% (4 de 42 bebês) para testes genéticos padrão (P = 0,0005). A taxa de utilidade clínica do rWGS (31%, 13 de 42 bebês) foi significativamente maior do que a dos testes genéticos padrão (2%, 1 de 42; P = 0,0015). Onze (26%) bebês com diagnóstico de rWGS evitaram a morbidade, um teve uma redução de 43% na probabilidade de mortalidade e um começou a receber cuidados paliativos. Em seis dos onze bebês, as mudanças no tratamento reduziram o custo de internação em US$ 800.000 a US$ 2.000.000. Essas descobertas reproduzem um estudo anterior sobre a utilidade clínica da rWGS em bebês com doenças agudas internados e demonstram melhores resultados e economia líquida na área da saúde. A rWGS merece ser considerada como um teste de primeira linha nesse cenário.[107]

Uma análise de 2018 de 36 publicações constatou que o custo do sequenciamento do genoma completo varia de US$ 1.906 a US$ 24.810 e tem uma grande variação no rendimento do diagnóstico, de 17% a 73%, dependendo dos grupos de pacientes.[108]

Estudo de associação de variantes raras editar

Os estudos de sequenciamento do genoma completo permitem a avaliação de associações entre características complexas e variantes raras codificantes e não codificantes (frequência alélica menor (MAF) < 1%) em todo o genoma. Em geral, as análises de variante única têm baixo poder de identificar associações com variantes raras, e testes de conjuntos de variantes foram propostos para testar conjuntamente os efeitos de determinados conjuntos de várias variantes raras.[109] As anotações de SNP ajudam a priorizar as variantes funcionais raras, e a incorporação dessas anotações pode aumentar efetivamente o poder da associação genética da análise de variantes raras de estudos de sequenciamento de genoma completo.[110] Algumas ferramentas foram desenvolvidas especificamente para fornecer uma análise completa de associação de variantes raras para dados de sequenciamento de genoma completo, incluindo a integração de dados de genótipo e suas anotações funcionais, análise de associação, resumo e visualização de resultados.[111][112]

A meta-análise de estudos de sequenciamento de genoma completo oferece uma solução atraente para o problema da coleta de amostras grandes para a descoberta de variantes raras associadas a fenótipos complexos. Alguns métodos foram desenvolvidos para permitir a análise de associação de variantes raras funcionalmente informadas em coortes em escala de biobanco usando abordagens eficientes para o armazenamento de estatísticas resumidas.[113]

Oncologia editar

Nesse campo, o sequenciamento do genoma completo representa um grande conjunto de melhorias e desafios a serem enfrentados pela comunidade científica, pois possibilita a análise, a quantificação e a caracterização do DNA tumoral circulante (ctDNA) na corrente sanguínea. Isso serve como base para o diagnóstico precoce do câncer, seleção de tratamento e monitoramento de recidivas, bem como para determinar os mecanismos de resistência, metástase e padrões filogenéticos na evolução do câncer. Ele também pode ajudar na seleção de tratamentos individualizados para pacientes que sofrem dessa patologia e observar como os medicamentos existentes estão funcionando durante a progressão do tratamento. O sequenciamento profundo do genoma completo envolve uma reconstrução subclonal com base no ctDNA no plasma que permite um perfil epigenômico e genômico completo, mostrando a expressão do DNA tumoral circulante em cada caso.[114]

Preocupações éticas editar

A introdução do sequenciamento do genoma completo pode ter implicações éticas.[115] Por um lado, os testes genéticos podem potencialmente diagnosticar doenças evitáveis, tanto no indivíduo submetido a testes genéticos quanto em seus parentes.[115] Por outro lado, os testes genéticos têm possíveis desvantagens, como discriminação genética, perda de anonimato e impactos psicológicos, como a descoberta de não paternidade.[116]

Alguns especialistas em ética insistem que a privacidade dos indivíduos que se submetem a testes genéticos deve ser protegida,[115] e isso é particularmente preocupante quando menores de idade se submetem a testes genéticos.[117] O CEO da Illumina, Jay Flatley, afirmou em fevereiro de 2009 que "até 2019 terá se tornado rotina mapear os genes dos bebês quando eles nascerem".[118] Esse uso em potencial do sequenciamento do genoma é altamente controverso, pois vai contra as normas éticas estabelecidas para testes genéticos preditivos de menores assintomáticos que foram bem estabelecidas nos campos da genética médica e do aconselhamento genético.[119][120][121][122] As diretrizes tradicionais para testes genéticos foram desenvolvidas ao longo de várias décadas, desde que se tornou possível testar marcadores genéticos associados a doenças, antes do advento da triagem genética abrangente e econômica.

Quando um indivíduo se submete ao sequenciamento do genoma completo, ele revela informações não apenas sobre suas próprias sequências de DNA, mas também sobre as prováveis sequências de DNA de seus parentes genéticos próximos.[115] Essas informações podem revelar ainda mais informações preditivas úteis sobre os riscos de saúde presentes e futuros dos parentes.[123] Portanto, há questões importantes sobre quais obrigações, se houver, são devidas aos membros da família dos indivíduos que estão se submetendo a testes genéticos. Na sociedade ocidental/europeia, os indivíduos testados são geralmente incentivados a compartilhar informações importantes sobre qualquer diagnóstico genético com seus parentes próximos, uma vez que a importância do diagnóstico genético para a prole e outros parentes próximos é geralmente um dos motivos para a busca de um teste genético em primeiro lugar.[115] No entanto, um grande dilema ético pode se desenvolver quando os pacientes se recusam a compartilhar informações sobre um diagnóstico feito para um distúrbio genético grave que é altamente evitável e onde há um alto risco para os parentes que carregam a mesma mutação da doença. Nessas circunstâncias, o clínico pode suspeitar que os parentes prefeririam saber do diagnóstico e, portanto, o clínico pode enfrentar um conflito de interesses com relação ao sigilo médico-paciente.[115]

As preocupações com a privacidade também podem surgir quando o sequenciamento do genoma completo é usado em estudos de pesquisa científica. Os pesquisadores geralmente precisam colocar informações sobre os genótipos e fenótipos dos pacientes em bancos de dados científicos públicos, como bancos de dados específicos de locus.[115] Embora apenas dados anônimos de pacientes sejam enviados para bancos de dados específicos de locus, os pacientes ainda podem ser identificáveis por seus parentes no caso de encontrarem uma doença rara ou uma mutação missense rara.[115] A discussão pública sobre a introdução de técnicas forenses avançadas (como pesquisa familiar avançada usando sites públicos de ancestralidade de DNA e abordagens de fenotipagem de DNA) tem sido limitada, desarticulada e sem foco. À medida que a genética forense e a genética médica convergem para o sequenciamento do genoma, as questões relacionadas aos dados genéticos tornam-se cada vez mais conectadas, e talvez seja necessário estabelecer proteções legais adicionais.[124]

Sequências públicas do genoma humano editar

Os primeiros genomas humanos quase completos sequenciados foram dois americanos de ascendência predominantemente do noroeste europeu em 2007 (J. Craig Venter com cobertura de 7,5 vezes,[125][126][127] e James Watson com 7,4 vezes).[128][129][130] Em seguida, em 2008, houve o sequenciamento de um homem anônimo chinês da etnia Han (com cobertura de 36 vezes),[131] de um homem iorubano da Nigéria (com cobertura de 30 vezes),[132] de uma geneticista clínica (Marjolein Kriek) da Holanda (com cobertura de 7 a 8 vezes) e de uma paciente com leucemia na faixa dos 50 anos (com cobertura de 33 e 14 vezes para tecidos normais e tumorais). [133] Steve Jobs foi uma das primeiras 20 pessoas a ter seu genoma completo sequenciado, supostamente pelo custo de US$ 100.000.[134] Em junho de 2012, havia 69 genomas humanos quase completos disponíveis publicamente.[135] Em novembro de 2013, uma família espanhola disponibilizou publicamente seus dados genômicos pessoais sob uma licença de domínio público da Creative Commons. O trabalho foi liderado por Manuel Corpas e os dados foram obtidos por meio de testes genéticos diretos ao consumidor com a 23andMe e o Instituto de Genômica de Pequim. Acredita-se que esse seja o primeiro conjunto de dados de genômica pública de uma família inteira.

Bancos de dados editar

De acordo com a Science, os principais bancos de dados de genomas completos são:[136]

Biobanco Genomas completos concluídos Divulgação/acesso de informações
UK Biobank 200.000 Disponibilizado por meio de uma plataforma da web em novembro de 2021, é o maior conjunto de dados públicos de genomas completos. Os genomas estão vinculados a informações médicas anônimas e são mais acessíveis para a pesquisa biomédica do que os conjuntos de dados anteriores, menos abrangentes. Mais 300.000 genomas devem ser lançados no início de 2023.[136][137]
Trans-Omics for Precision Medicine 161.000 Institutos Nacionais da Saúde (National Institutes of Health - NIH) requerem consentimento específico para o projeto.
Programa Million Veteran 125.000 Pesquisadores de assuntos de não veteranos terão acesso em 2022.
Genomics England's 100,000 Genomes 120.000 Os pesquisadores devem participar da colaboração.
All of Us 90.000 Os NIH esperam liberar no início de 2022

Cobertura genômica editar

Em termos de cobertura e precisão genômica, o sequenciamento do genoma completo pode ser classificado em uma das seguintes opções:[138]

  • Uma sequência preliminar, cobrindo aproximadamente 90% do genoma com aproximadamente 99,9% de precisão
  • Uma sequência finalizada, cobrindo mais de 95% do genoma com aproximadamente 99,99% de precisão

A produção de uma sequência finalizada de alta qualidade de acordo com essa definição é muito cara. Portanto, a maioria dos resultados do "sequenciamento do genoma completo" humano são sequências de rascunho (às vezes acima e às vezes abaixo da precisão definida).[138]

Veja também editar

Referências

  1. Alberts, Bruce; Johnson, Alexander; Lewis, Julian; Raff, Martin; Roberts, Keith; Walter, Peter (2008). «Chapter 8». Molecular biology of the cell 5th ed. New York: Garland Science. p. 550. ISBN 978-0-8153-4106-2 
  2. «Definition of whole-genome sequencing – NCI Dictionary of Cancer Terms». National Cancer Institute (em inglês). 20 de julho de 2012. Consultado em 13 de outubro de 2018 
  3. Gilissen (julho de 2014). «Genome sequencing identifies major causes of severe intellectual disability». Nature. 511 (7509): 344–7. Bibcode:2014Natur.511..344G. PMID 24896178. doi:10.1038/nature13394 
  4. Nones, K; Waddell, N; Wayte, N; Patch, AM; Bailey, P; Newell, F; Holmes, O; Fink, JL; Quinn, MC; Tang, YH; Lampe, G; Quek, K; Loffler, KA; Manning, S; Idrisoglu, S; Miller, D; Xu, Q; Waddell, N; Wilson, PJ; Bruxner, TJ; Christ, AN; Harliwong, I; Nourse, C; Nourbakhsh, E; Anderson, M; Kazakoff, S; Leonard, C; Wood, S; Simpson, PT; Reid, LE; Krause, L; Hussey, DJ; Watson, DI; Lord, RV; Nancarrow, D; Phillips, WA; Gotley, D; Smithers, BM; Whiteman, DC; Hayward, NK; Campbell, PJ; Pearson, JV; Grimmond, SM; Barbour, AP (29 de outubro de 2014). «Genomic catastrophes frequently arise in esophageal adenocarcinoma and drive tumorigenesis». Nature Communications. 5: 5224. Bibcode:2014NatCo...5.5224N. PMC 4596003 . PMID 25351503. doi:10.1038/ncomms6224 
  5. van El, CG; Cornel, MC; Borry, P; Hastings, RJ; Fellmann, F; Hodgson, SV; Howard, HC; Cambon-Thomsen, A; Knoppers, BM; Meijers-Heijboer, H; Scheffer, H; Tranebjaerg, L; Dondorp, W; de Wert, GM (junho de 2013). «Whole-genome sequencing in health care. Recommendations of the European Society of Human Genetics». European Journal of Human Genetics. 21 Suppl 1 (Suppl 1): S1–5. PMC 3660957 . PMID 23819146. doi:10.1038/ejhg.2013.46 
  6. Mooney, Sean (setembro de 2014). «Progress towards the integration of pharmacogenomics in practice». Human Genetics. 134 (5): 459–65. PMC 4362928 . PMID 25238897. doi:10.1007/s00439-014-1484-7 
  7. Kijk magazine, 01 de janeiro de 2009
  8. Marx, Vivien (11 de setembro de 2013). «Next-generation sequencing: The genome jigsaw». Nature. 501 (7466): 263–268. Bibcode:2013Natur.501..263M. PMID 24025842. doi:10.1038/501261a  
  9. al.], Bruce Alberts ... [et (2008). Molecular biology of the cell 5th ed. New York: Garland Science. p. 551. ISBN 978-0-8153-4106-2 
  10. Fiers, W.; Contreras, R.; Duerinck, F.; Haegeman, G.; Iserentant, D.; Merregaert, J.; Min Jou, W.; Molemans, F.; Raeymaekers, A.; Van den Berghe, A.; Volckaert, G.; Ysebaert, M. (8 de abril de 1976). «Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene». Nature. 260 (5551): 500–507. Bibcode:1976Natur.260..500F. PMID 1264203. doi:10.1038/260500a0 
  11. Oliver, S. G.; van der Aart, Q. J. M.; Agostoni-Carbone, M. L.; et al. (maio de 1992). «The complete DNA sequence of yeast chromosome III». Nature. 357 (6373): 38–46. Bibcode:1992Natur.357...38O. PMID 1574125. doi:10.1038/357038a0 
  12. a b c Fleischmann, R.; Adams, M.; White, O; Clayton, R.; Kirkness, E.; Kerlavage, A.; Bult, C.; Tomb, J.; Dougherty, B.; Merrick, J.; al., e. (28 de julho de 1995). «Whole-genome random sequencing and assembly of Haemophilus influenzae Rd». Science. 269 (5223): 496–512. Bibcode:1995Sci...269..496F. PMID 7542800. doi:10.1126/science.7542800 
  13. Eddy, Sean R. (novembro de 2012). «The C-value paradox, junk DNA and ENCODE». Current Biology. 22 (21): R898–R899. PMID 23137679. doi:10.1016/j.cub.2012.10.002  
  14. Pellicer, Jaume; FAY, Michael F.; Leitch, Ilia J. (15 de setembro de 2010). «The largest eukaryotic genome of them all?». Botanical Journal of the Linnean Society. 164 (1): 10–15. doi:10.1111/j.1095-8339.2010.01072.x  
  15. Human Genome Sequencing Consortium, International (21 de outubro de 2004). «Finishing the euchromatic sequence of the human genome». Nature. 431 (7011): 931–945. Bibcode:2004Natur.431..931H. PMID 15496913. doi:10.1038/nature03001  
  16. Goffeau, A.; Barrell, B. G.; Bussey, H.; Davis, R. W.; Dujon, B.; Feldmann, H.; Galibert, F.; Hoheisel, J. D.; Jacq, C.; Johnston, M.; Louis, E. J.; Mewes, H. W.; Murakami, Y.; Philippsen, P.; Tettelin, H.; Oliver, S. G. (25 de outubro de 1996). «Life with 6000 Genes». Science. 274 (5287): 546–567. Bibcode:1996Sci...274..546G. PMID 8849441. doi:10.1126/science.274.5287.546. Cópia arquivada (PDF) em 7 de março de 2016 
  17. The C. elegans Sequencing Consortium (11 de dezembro de 1998). «Genome Sequence of the Nematode C. elegans: A Platform for Investigating Biology». Science. 282 (5396): 2012–2018. Bibcode:1998Sci...282.2012.. PMID 9851916. doi:10.1126/science.282.5396.2012 
  18. Alberts, Bruce (2008). Molecular Biology of the Cell 5th ed. New York: Garland Science. p. 552. ISBN 978-0-8153-4106-2 
  19. Dunham, I. (dezembro de 1999). «The DNA sequence of human chromosome 22». Nature. 402 (6761): 489–495. Bibcode:1999Natur.402..489D. PMID 10591208. doi:10.1038/990031  
  20. Adams MD; Celniker SE; Holt RA; et al. (24 de março de 2000). «The Genome Sequence of Drosophila melanogaster». Science. 287 (5461): 2185–2195. Bibcode:2000Sci...287.2185.. CiteSeerX 10.1.1.549.8639 . PMID 10731132. doi:10.1126/science.287.5461.2185 
  21. The Arabidopsis Genome Initiative (14 de dezembro de 2000). «Analysis of the genome sequence of the flowering plant Arabidopsis thaliana». Nature. 408 (6814): 796–815. Bibcode:2000Natur.408..796T. PMID 11130711. doi:10.1038/35048692  
  22. Venter JC; Adams MD; Myers EW; et al. (16 de fevereiro de 2001). «The Sequence of the Human Genome». Science. 291 (5507): 1304–1351. Bibcode:2001Sci...291.1304V. PMID 11181995. doi:10.1126/science.1058040  
  23. Waterston RH; Lindblad-Toh K; Birney E; et al. (31 de outubro de 2002). «Initial sequencing and comparative analysis of the mouse genome». Nature. 420 (6915): 520–562. Bibcode:2002Natur.420..520W. PMID 12466850. doi:10.1038/nature01262  
  24. International Human Genome Sequencing Consortium (7 de setembro de 2004). «Finishing the euchromatic sequence of the human genome». Nature. 431 (7011): 931–945. Bibcode:2004Natur.431..931H. PMID 15496913. doi:10.1038/nature03001  
  25. Braslavsky, Ido; et al. (2003). «Sequence information can be obtained from single DNA molecules». Proc Natl Acad Sci USA. 100 (7): 3960–3984. Bibcode:2003PNAS..100.3960B. PMC 153030 . PMID 12651960. doi:10.1073/pnas.0230489100  
  26. Heger, Monica (2 de outubro de 2013). «Single-cell Sequencing Makes Strides in the Clinic with Cancer and PGD First Applications». Clinical Sequencing News 
  27. Yurkiewicz, I. R.; Korf, B. R.; Lehmann, L. S. (2014). «Prenatal whole-genome sequencing--is the quest to know a fetus's future ethical?». New England Journal of Medicine. 370 (3): 195–7. PMID 24428465. doi:10.1056/NEJMp1215536 
  28. Staden R (junho de 1979). «A strategy of DNA sequencing employing computer programs». Nucleic Acids Res. 6 (7): 2601–10. PMC 327874 . PMID 461197. doi:10.1093/nar/6.7.2601 
  29. Edwards, A; Caskey, T (1991). «Closure strategies for random DNA sequencing». Methods: A Companion to Methods in Enzymology. 3 (1): 41–47. doi:10.1016/S1046-2023(05)80162-8 
  30. Edwards A; Voss H; Rice P; Civitello A; Stegemann J; Schwager C; Zimmermann J; Erfle H; Caskey CT; Ansorge W (abril de 1990). «Automated DNA sequencing of the human HPRT locus». Genomics. 6 (4): 593–608. PMID 2341149. doi:10.1016/0888-7543(90)90493-E 
  31. Roach JC; Boysen C; Wang K; Hood L (março de 1995). «Pairwise end sequencing: a unified approach to genomic mapping and sequencing». Genomics. 26 (2): 345–53. PMID 7601461. doi:10.1016/0888-7543(95)80219-C 
  32. Fleischmann RD; Adams MD; White O; Clayton RA; Kirkness EF; Kerlavage AR; Bult CJ; Tomb JF; Dougherty BA; Merrick JM; McKenney; Sutton; Fitzhugh; Fields; Gocyne; Scott; Shirley; Liu; Glodek; Kelley; Weidman; Phillips; Spriggs; Hedblom; Cotton; Utterback; Hanna; Nguyen; Saudek; et al. (julho de 1995). «Whole-genome random sequencing and assembly of Haemophilus influenzae Rd». Science. 269 (5223): 496–512. Bibcode:1995Sci...269..496F. PMID 7542800. doi:10.1126/science.7542800 
  33. Adams, MD; et al. (2000). «The genome sequence of Drosophila melanogaster». Science. 287 (5461): 2185–95. Bibcode:2000Sci...287.2185.. CiteSeerX 10.1.1.549.8639 . PMID 10731132. doi:10.1126/science.287.5461.2185 
  34. a b Mukhopadhyay R (fevereiro de 2009). «DNA sequencers: the next generation». Anal. Chem. 81 (5): 1736–40. PMID 19193124. doi:10.1021/ac802712u 
  35. Sevim, Volkan; Lee, Juna; Egan, Robert; Clum, Alicia; Hundley, Hope; Lee, Janey; Everroad, R. Craig; Detweiler, Angela M.; Bebout, Brad M.; Pett-Ridge, Jennifer; Göker, Markus; Murray, Alison E.; Lindemann, Stephen R.; Klenk, Hans-Peter; O’Malley, Ronan (26 de novembro de 2019). «Shotgun metagenome data of a defined mock community using Oxford Nanopore, PacBio and Illumina technologies». Scientific Data (em inglês). 6 (1). 285 páginas. Bibcode:2019NatSD...6..285S. ISSN 2052-4463. PMC 6879543 . PMID 31772173. doi:10.1038/s41597-019-0287-z 
  36. Wang, Yunhao; Zhao, Yue; Bollas, Audrey; Wang, Yuru; Au, Kin Fai (novembro de 2021). «Nanopore sequencing technology, bioinformatics and applications». Nature Biotechnology (em inglês). 39 (11): 1348–1365. ISSN 1546-1696. PMC 8988251 . PMID 34750572. doi:10.1038/s41587-021-01108-x 
  37. Strickland, Eliza (14 de outubro de 2015). «New Genetic Technologies Diagnose Critically Ill Infants Within 26 Hours – IEEE Spectrum». Spectrum.ieee.org. Consultado em 11 de novembro de 2016. Cópia arquivada em 16 de novembro de 2015 
  38. «Article : Race to Cut Whole Genome Sequencing Costs Genetic Engineering & Biotechnology News — Biotechnology from Bench to Business». Genengnews.com. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 17 de outubro de 2006 
  39. «Whole Genome Sequencing Costs Continue to Drop». Eyeondna.com. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 25 de março de 2009 
  40. Harmon, Katherine (28 de junho de 2010). «Genome Sequencing for the Rest of Us». Scientific American. Consultado em 13 de agosto de 2010. Cópia arquivada em 19 de março de 2011 
  41. San Diego/Orange County Technology News. «Sequenom to Develop Third-Generation Nanopore-Based Single Molecule Sequencing Technology». Freshnews.com. Consultado em 24 de fevereiro de 2009. Cópia arquivada em 5 de dezembro de 2008 
  42. a b «Article : Whole Genome Sequencing in 24 Hours Genetic Engineering & Biotechnology News — Biotechnology from Bench to Business». Genengnews.com. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 17 de outubro de 2006 
  43. «Pacific Bio lifts the veil on its high-speed genome-sequencing effort». VentureBeat. 10 de fevereiro de 2008. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 20 de fevereiro de 2009 
  44. «Bio-IT World». Bio-IT World. 6 de outubro de 2008. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 17 de fevereiro de 2009 
  45. «With New Machine, Helicos Brings Personal Genome Sequencing A Step Closer». Xconomy. 22 de abril de 2008. Consultado em 28 de janeiro de 2011. Cópia arquivada em 2 de janeiro de 2011 
  46. «Whole genome sequencing costs continue to fall: $300 million in 2003, $1 million 2007, $60,000 now, $5000 by year end». Nextbigfuture.com. 25 de março de 2008. Consultado em 28 de janeiro de 2011. Cópia arquivada em 20 de dezembro de 2010 
  47. «Han Cao's nanofluidic chip could cut DNA sequencing costs dramatically». Technology Review. Cópia arquivada em 29 de março de 2011 
  48. Julia Karow (26 de outubro de 2015). «BGI Launches Desktop Sequencer in China; Plans to Register Platform With CFDA». GenomeWeb. Consultado em 2 de dezembro de 2018 
  49. «BGI Launches New Desktop Sequencer in China, Registers Larger Version With CFDA». 360Dx. GenomeWeb. 11 de novembro de 2016. Consultado em 2 de dezembro de 2018 
  50. Monica Heger (26 de outubro de 2018). «BGI Launches New Sequencer as Customers Report Data From Earlier Instruments». GenomeWeb. Consultado em 2 de dezembro de 2018 
  51. John Carroll (14 de julho de 2008). «Pacific Biosciences gains $100M for sequencing tech». FierceBiotech. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 1 de maio de 2009 
  52. Sibley, Lisa (8 de fevereiro de 2009). «Complete Genomics brings radical reduction in cost». Silicon Valley / San Jose Business Journal. Sanjose.bizjournals.com. Consultado em 23 de fevereiro de 2009 
  53. Sarah Neville (5 de março de 2018). «Cheaper DNA sequencing unlocks secrets of rare diseases». Financial Times. Consultado em 2 de dezembro de 2018 
  54. Carlson, Rob (2 de janeiro de 2007). «A Few Thoughts on Rapid Genome Sequencing and The Archon Prize — synthesis». Synthesis.cc. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 8 de agosto de 2009 
  55. "PRIZE Overview: Archon X PRIZE for Genomics".
  56. Diamandis, Peter. «Outpaced by Innovation: Canceling an XPRIZE». Huffington Post. Cópia arquivada em 25 de agosto de 2013 
  57. Aldhous, Peter. «X Prize for genomes cancelled before it begins». Cópia arquivada em 21 de setembro de 2016 
  58. «SOLiD System — a next-gen DNA sequencing platform announced». Gizmag.com. 27 de outubro de 2007. Consultado em 24 de fevereiro de 2009. Cópia arquivada em 19 de julho de 2008 
  59. «The $1000 Genome: Coming Soon?». Dddmag.com. 1 de abril de 2010. Consultado em 28 de janeiro de 2011. Cópia arquivada em 15 de abril de 2011 
  60. «Individual genome sequencing — Illumina, Inc.». Everygenome.com. Consultado em 28 de janeiro de 2011. Cópia arquivada em 19 de outubro de 2011 
  61. «Illumina launches personal genome sequencing service for $48,000 : Genetic Future». Scienceblogs.com. Consultado em 28 de janeiro de 2011. Cópia arquivada em 16 de junho de 2009 
  62. a b Wade, Nicholas (11 de agosto de 2009). «Cost of Decoding a Genome Is Lowered». The New York Times. Consultado em 3 de maio de 2010. Cópia arquivada em 21 de maio de 2013 
  63. «Technology Index». ABC News. Consultado em 29 de abril de 2018. Cópia arquivada em 15 de maio de 2016 
  64. Drmanac R, Sparks AB, Callow MJ, et al. (2010). «Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays». Science. 327 (5961): 78–81. Bibcode:2010Sci...327...78D. PMID 19892942. doi:10.1126/science.1181498 
  65. «Illumina Announces $5,000 Genome Pricing – Bio-IT World». Cópia arquivada em 17 de maio de 2011 
  66. «NHGRI Awards More than $50M for Low-Cost DNA Sequencing Tech Development». Genome Web. 2009. Cópia arquivada em 3 de julho de 2011 
  67. «Life Technologies Introduces the Benchtop Ion Proton™ Sequencer; Designed to Decode a Human Genome in One Day for $1,000» (press release). Consultado em 30 de agosto de 2012. Cópia arquivada em 23 de dezembro de 2012 
  68. ANDREW POLLACK (17 de fevereiro de 2012). «Oxford Nanopore Unveils Tiny DNA Sequencing Device – The New York Times». The New York Times. Consultado em 11 de novembro de 2016. Cópia arquivada em 7 de janeiro de 2013 
  69. «Illumina Sequencer Enables $1,000 Genome». News: Genomics & Proteomics. Gen. Eng. Biotechnol. News (paper). 34 (4). 15 de fevereiro de 2014. p. 18 
  70. Check Hayden, Erika (15 de janeiro de 2014). «Is the $1,000 genome for real?». Nature: nature.2014.14530. doi:10.1038/nature.2014.14530 
  71. «The Cost of Sequencing a Human Genome». www.genome.gov. Cópia arquivada em 25 de novembro de 2016 
  72. «With $999 Whole-Genome Sequencing Service, Veritas Embarks on Goal to Democratize DNA Information». 6 de março de 2016 
  73. Andrews, Joe (1 de julho de 2019). «23andMe competitor Veritas Genetics slashes price of whole genome sequencing 40% to $600». CNBC (em inglês). Consultado em 2 de setembro de 2019 
  74. Megan Molteni (18 de maio de 2017). «A Chinese Genome Giant Sets Its Sights on the Ultimate Sequencer». Wired. Consultado em 2 de dezembro de 2018 
  75. Phillips, K. A; Pletcher, M. J; Ladabaum, U (2015). «Is the "$1000 Genome" Really $1000? Understanding the Full Benefits and Costs of Genomic Sequencing». Technology and Health Care. 23 (3): 373–379. PMC 4527943 . PMID 25669213. doi:10.3233/THC-150900 
  76. «Blog: True Size of a Human Genome | Veritas Genetics». 28 de julho de 2017 
  77. «Psst, the human genome was never completely sequenced». statnews.com. 20 de junho de 2017 
  78. «Genomics Core». Gladstone.ucsf.edu. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 30 de junho de 2010 
  79. Nishida N; Koike A; Tajima A; Ogasawara Y; Ishibashi Y; Uehara Y; Inoue I; Tokunaga K (2008). «Evaluating the performance of Affymetrix SNP Array 6.0 platform with 400 Japanese individuals». BMC Genomics. 9 (1): 431. PMC 2566316 . PMID 18803882. doi:10.1186/1471-2164-9-431  
  80. Petrone, Justin (16 de janeiro de 2007). «Illumina, DeCode Build 1M SNP Chip; Q2 Launch to Coincide with Release of Affy's 6.0 SNP Array | BioArray News | Arrays». GenomeWeb. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 16 de julho de 2011 
  81. Roach JC; Glusman G; Smit AF; et al. (abril de 2010). «Analysis of genetic inheritance in a family quartet by whole-genome sequencing». Science. 328 (5978): 636–9. Bibcode:2010Sci...328..636R. PMC 3037280 . PMID 20220176. doi:10.1126/science.1186802 
  82. Campbell CD; Chong JX; Malig M; et al. (novembro de 2012). «Estimating the human mutation rate using autozygosity in a founder population». Nat. Genet. 44 (11): 1277–81. PMC 3483378 . PMID 23001126. doi:10.1038/ng.2418 
  83. Ye K; Beekman M; Lameijer EW; Zhang Y; Moed MH; van den Akker EB; Deelen J; Houwing-Duistermaat JJ; Kremer D; Anvar SY; Laros JF; Jones D; Raine K; Blackburne B; Potluri S; Long Q; Guryev V; van der Breggen R; Westendorp RG; 't Hoen PA; den Dunnen J; van Ommen GJ; Willemsen G; Pitts SJ; Cox DR; Ning Z; Boomsma DI; Slagboom PE (dezembro de 2013). «Aging as accelerated accumulation of somatic variants: whole-genome sequencing of centenarian and middle-aged monozygotic twin pairs». Twin Res Hum Genet. 16 (6): 1026–32. PMID 24182360. doi:10.1017/thg.2013.73  
  84. Keightley PD (fevereiro de 2012). «Rates and fitness consequences of new mutations in humans». Genetics. 190 (2): 295–304. PMC 3276617 . PMID 22345605. doi:10.1534/genetics.111.134668 
  85. Tuna M; Amos CI (novembro de 2013). «Genomic sequencing in cancer». Cancer Lett. 340 (2): 161–70. PMC 3622788 . PMID 23178448. doi:10.1016/j.canlet.2012.11.004 
  86. Moran, Laurence A. (24 de março de 2011). «Sandwalk: How Big Is the Human Genome?». sandwalk.blogspot.com. Consultado em 29 de abril de 2018. Cópia arquivada em dezembro de 2017 
  87. Hodgkinson, Alan; Chen, Ying; Eyre-Walker, Adam (janeiro de 2012). «The large-scale distribution of somatic mutations in cancer genomes». Human Mutation. 33 (1): 136–143. PMID 21953857. doi:10.1002/humu.21616 
  88. Supek, Fran; Lehner, Ben (maio de 2015). «Differential DNA mismatch repair underlies mutation rate variation across the human genome». Nature. 521 (7550): 81–84. Bibcode:2015Natur.521...81S. PMC 4425546 . PMID 25707793. doi:10.1038/nature14173 
  89. Schuster-Böckler, Benjamin; Lehner, Ben (agosto de 2012). «Chromatin organization is a major influence on regional mutation rates in human cancer cells». Nature. 488 (7412): 504–507. Bibcode:2012Natur.488..504S. PMID 22820252. doi:10.1038/nature11273 
  90. Supek, Fran; Lehner, Ben (julho de 2017). «Clustered Mutation Signatures Reveal that Error-Prone DNA Repair Targets Mutations to Active Genes». Cell. 170 (3): 534–547.e23. PMID 28753428. doi:10.1016/j.cell.2017.07.003 . hdl:10230/35343 
  91. Yano, K; Yamamoto, E; Aya, K; Takeuchi, H; Lo, PC; Hu, L; Yamasaki, M; Yoshida, S; Kitano, H; Hirano, K; Matsuoka, M (agosto de 2016). «Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice.». Nature Genetics. 48 (8): 927–34. PMID 27322545. doi:10.1038/ng.3596 
  92. a b c Borrell, Brendan (14 de setembro de 2010). «US clinics quietly embrace whole-genome sequencing». Nature: news.2010.465. doi:10.1038/news.2010.465  
  93. Ashley, EA; Butte, AJ; Wheeler, MT; Chen, R; Klein, TE; Dewey, FE; Dudley, JT; Ormond, KE; Pavlovic, A; Morgan, AA; Pushkarev, D; Neff, NF; Hudgins, L; Gong, L; Hodges, LM; Berlin, DS; Thorn, CF; Sangkuhl, K; Hebert, JM; Woon, M; Sagreiya, H; Whaley, R; Knowles, JW; Chou, MF; Thakuria, JV; Rosenbaum, AM; Zaranek, AW; Church, GM; Greely, HT; Quake, SR; Altman, RB (1 de maio de 2010). «Clinical assessment incorporating a personal genome.». Lancet. 375 (9725): 1525–35. PMC 2937184 . PMID 20435227. doi:10.1016/S0140-6736(10)60452-7 
  94. Dewey, Frederick E.; Wheeler, Matthew T.; Cordero, Sergio; Perez, Marco V.; Pavlovic, Aleks; Pushkarev, Dmitry; Freeman, James V.; Quake, Steve R.; Ashley, Euan A. (abril de 2011). «Molecular Autopsy for Sudden Cardiac Death Using Whole Genome Sequencing». Journal of the American College of Cardiology. 57 (14): E1159. doi:10.1016/S0735-1097(11)61159-5  
  95. Dewey, Frederick E.; Chen, Rong; Cordero, Sergio P.; Ormond, Kelly E.; Caleshu, Colleen; Karczewski, Konrad J.; Whirl-Carrillo, Michelle; Wheeler, Matthew T.; Dudley, Joel T.; Byrnes, Jake K.; Cornejo, Omar E.; Knowles, Joshua W.; Woon, Mark; Sangkuhl, Katrin; Gong, Li; Thorn, Caroline F.; Hebert, Joan M.; Capriotti, Emidio; David, Sean P.; Pavlovic, Aleksandra; West, Anne; Thakuria, Joseph V.; Ball, Madeleine P.; Zaranek, Alexander W.; Rehm, Heidi L.; Church, George M.; West, John S.; Bustamante, Carlos D.; Snyder, Michael; Altman, Russ B.; Klein, Teri E.; Butte, Atul J.; Ashley, Euan A. (15 de setembro de 2011). «Phased Whole-Genome Genetic Risk in a Family Quartet Using a Major Allele Reference Sequence». PLOS Genetics. 7 (9): e1002280. PMC 3174201 . PMID 21935354. doi:10.1371/journal.pgen.1002280 
  96. «One In A Billion: A boy's life, a medical mystery». Jsonline.com. Consultado em 11 de novembro de 2016. Cópia arquivada em 5 de outubro de 2013 
  97. Mayer AN, Dimmock DP, Arca MJ, et al. (março de 2011). «A timely arrival for genomic medicine». Genet. Med. 13 (3): 195–6. PMID 21169843. doi:10.1097/GIM.0b013e3182095089  
  98. «Introducing diagnostic applications of '3Gb-testing' in human genetics». Cópia arquivada em 10 de novembro de 2014 
  99. Boccia S, Mc Kee M, Adany R, Boffetta P, Burton H, Cambon-Thomsen A, Cornel MC, Gray M, Jani A, Knoppers BM, Khoury MJ, Meslin EM, Van Duijn CM, Villari P, Zimmern R, Cesario A, Puggina A, Colotto M, Ricciardi W (agosto de 2014). «Beyond public health genomics: proposals from an international working group». Eur J Public Health. 24 (6): 877–879. PMC 4245010 . PMID 25168910. doi:10.1093/eurpub/cku142 
  100. «RD-Connect News 18 July 2014». Rd-connect.eu. Consultado em 11 de novembro de 2016. Cópia arquivada em 10 de outubro de 2016 
  101. «Genomes2People: A Roadmap for Genomic Medicine». www.frontlinegenomics.com. Consultado em 29 de abril de 2018. Cópia arquivada em 14 de fevereiro de 2017 
  102. «The Risk Evaluation and Education for Alzheimer's Disease (REVEAL) Study – HBHE Genetics Research Group». hbhegenetics.sph.umich.edu. Consultado em 29 de abril de 2018. Cópia arquivada em 29 de setembro de 2017 
  103. «Risk Evaluation and Education for Alzheimer's Disease (REVEAL) II – Full Text View – ClinicalTrials.gov». clinicaltrials.gov. 22 de julho de 2009. Consultado em 29 de abril de 2018. Cópia arquivada em 14 de fevereiro de 2017 
  104. «Boston Researchers To Sequence Newborn Babies' DNA». wbur.org. 5 de setembro de 2013 
  105. Holm, Ingrid A.; Agrawal, Pankaj B.; Ceyhan-Birsoy, Ozge; Christensen, Kurt D.; Fayer, Shawn; Frankel, Leslie A.; Genetti, Casie A.; Krier, Joel B.; Lamay, Rebecca C.; Levy, Harvey L.; McGuire, Amy L.; Parad, Richard B.; Park, Peter J.; Pereira, Stacey; Rehm, Heidi L.; Schwartz, Talia S.; Waisbren, Susan E.; Yu, Timothy W.; Green, Robert C.; Beggs, Alan H. (9 de julho de 2018). «The BabySeq project: implementing genomic sequencing in newborns». BMC Pediatrics. 18 (1): 225. PMC 6038274 . PMID 29986673. doi:10.1186/s12887-018-1200-1 
  106. Tarini, Beth A. (23 de agosto de 2021). «The Effect of BabySeq on Pediatric and Genomic Research—More Than Baby Steps». JAMA Pediatrics. 175 (11): 1107–1108. PMID 34424259. doi:10.1001/jamapediatrics.2021.2826 
  107. Farnaes, Lauge; Hildreth, Amber; Sweeney, Nathaly M.; Clark, Michelle M.; Chowdhury, Shimul; Nahas, Shareef; Cakici, Julie A.; Benson, Wendy; Kaplan, Robert H.; Kronick, Richard; Bainbridge, Matthew N.; Friedman, Jennifer; Gold, Jeffrey J.; Ding, Yan; Veeraraghavan, Narayanan; Dimmock, David; Kingsmore, Stephen F. (dezembro de 2018). «Rapid whole-genome sequencing decreases infant morbidity and cost of hospitalization». npj Genomic Medicine. 3 (1). 10 páginas. PMC 5884823 . PMID 29644095. doi:10.1038/s41525-018-0049-4 
  108. Schwarze, K; Buchanan, J; Taylor, Jc; Wordsworth, S (maio de 2018). «Are whole Exome and whole Genome Sequencing Approaches Cost-Effective? A Systematic Review of the Literature». Value in Health. 21: S100. doi:10.1016/j.jval.2018.04.677  
  109. Lee, Seunggeung; Abecasis, Gonçalo R.; Boehnke, Michael; Lin, Xihong (julho de 2014). «Rare-Variant Association Analysis: Study Designs and Statistical Tests». The American Journal of Human Genetics. 95 (1): 5–23. PMC 4085641 . PMID 24995866. doi:10.1016/j.ajhg.2014.06.009 
  110. Li, Xihao; Li, Zilin; Zhou, Hufeng; et al. (setembro de 2020). «Dynamic incorporation of multiple in silico functional annotations empowers rare variant association analysis of large whole-genome sequencing studies at scale». Nature Genetics. 52 (9): 969–983. PMC 7483769 . PMID 32839606. doi:10.1038/s41588-020-0676-4 
  111. Li, Zilin; Li, Xihao; Zhou, Hufeng; et al. (dezembro de 2022). «A framework for detecting noncoding rare-variant associations of large-scale whole-genome sequencing studies». Nature Methods. 19 (12): 1599–1611. PMC 10008172 . PMID 36303018. doi:10.1038/s41592-022-01640-x 
  112. «STAARpipeline: an all-in-one rare-variant tool for biobank-scale whole-genome sequencing data». Nature Methods. 19 (12): 1532–1533. Dezembro de 2022. PMID 36316564. doi:10.1038/s41592-022-01641-w 
  113. Li, Xihao; Quick, Corbin; Zhou, Hufeng; Gaynor, Sheila M.; Liu, Yaowu; Chen, Han; Selvaraj, Margaret Sunitha; Sun, Ryan; Dey, Rounak; Arnett, Donna K.; Bielak, Lawrence F.; Bis, Joshua C.; Blangero, John; Boerwinkle, Eric; Bowden, Donald W.; Brody, Jennifer A.; Cade, Brian E.; Correa, Adolfo; Cupples, L. Adrienne; Curran, Joanne E.; de Vries, Paul S.; Duggirala, Ravindranath; Freedman, Barry I.; Göring, Harald H. H.; Guo, Xiuqing; Haessler, Jeffrey; Kalyani, Rita R.; Kooperberg, Charles; Kral, Brian G.; Lange, Leslie A.; Manichaikul, Ani; Martin, Lisa W.; McGarvey, Stephen T.; Mitchell, Braxton D.; Montasser, May E.; Morrison, Alanna C.; Naseri, Take; O’Connell, Jeffrey R.; Palmer, Nicholette D.; Peyser, Patricia A.; Psaty, Bruce M.; Raffield, Laura M.; Redline, Susan; Reiner, Alexander P.; Reupena, Muagututi’a Sefuiva; Rice, Kenneth M.; Rich, Stephen S.; Sitlani, Colleen M.; Smith, Jennifer A.; Taylor, Kent D.; Vasan, Ramachandran S.; Willer, Cristen J.; Wilson, James G.; Yanek, Lisa R.; Zhao, Wei; NHLBI Trans-Omics for Precision Medicine (TOPMed) Consortium; TOPMed Lipids Working Group; Rotter, Jerome I.; Natarajan, Pradeep; Peloso, Gina M.; Li, Zilin; Lin, Xihong (janeiro de 2023). «Powerful, scalable and resource-efficient meta-analysis of rare variant associations in large whole genome sequencing studies». Nature Genetics. 55 (1): 154–164. PMC 10084891 . PMID 36564505. doi:10.1038/s41588-022-01225-6 
  114. Herberts, Cameron; Annala, Matti; Sipola, Joonatan; Ng, Sarah W. S.; Chen, Xinyi E.; Nurminen, Anssi; Korhonen, Olga V.; Munzur, Aslı D.; Beja, Kevin; Schönlau, Elena; Bernales, Cecily Q.; Ritch, Elie; Bacon, Jack V. W.; Lack, Nathan A.; Nykter, Matti (agosto de 2022). «Deep whole-genome ctDNA chronology of treatment-resistant prostate cancer». Nature (em inglês). 608 (7921): 199–208. Bibcode:2022Natur.608..199H. ISSN 1476-4687. PMID 35859180. doi:10.1038/s41586-022-04975-9 
  115. a b c d e f g h Sijmons, R.H.; Van Langen, I.M (2011). «A clinical perspective on ethical issues in genetic testing». Accountability in Research: Policies and Quality Assurance. 18 (3): 148–162. Bibcode:2013ARPQ...20..143D. PMID 21574071. doi:10.1080/08989621.2011.575033 
  116. Ayday E; De Cristofaro E; Hubaux JP; Tsudik G (2015). «The Chills and Thrills of Whole Genome Sequencing». arXiv:1306.1264  [cs.CR] 
  117. Borry, Pascal; Evers-Kiebooms, Gerry; Cornel, Martha C.; Clarke, Angus; Dierickx, Kris (2009). «Genetic testing in asymptomatic minors Background considerations towards ESHG Recommendations». European Journal of Human Genetics. 17 (6): 711–9. PMC 2947094 . PMID 19277061. doi:10.1038/ejhg.2009.25 
  118. Henderson, Mark (9 de fevereiro de 2009). «Genetic mapping of babies by 2019 will transform preventive medicine». London: Times Online. Consultado em 23 de fevereiro de 2009. Cópia arquivada em 11 de maio de 2009 
  119. McCabe LL; McCabe ER (junho de 2001). «Postgenomic medicine. Presymptomatic testing for prediction and prevention». Clin Perinatol. 28 (2): 425–34. PMID 11499063. doi:10.1016/S0095-5108(05)70094-4 
  120. Nelson RM; Botkjin JR; Kodish ED; et al. (junho de 2001). «Ethical issues with genetic testing in pediatrics». Pediatrics. 107 (6): 1451–5. PMID 11389275. doi:10.1542/peds.107.6.1451  
  121. Borry P; Fryns JP; Schotsmans P; Dierickx K (fevereiro de 2006). «Carrier testing in minors: a systematic review of guidelines and position papers». Eur. J. Hum. Genet. 14 (2): 133–8. PMID 16267502. doi:10.1038/sj.ejhg.5201509  
  122. Borry P; Stultiens L; Nys H; Cassiman JJ; Dierickx K (novembro de 2006). «Presymptomatic and predictive genetic testing in minors: a systematic review of guidelines and position papers». Clin. Genet. 70 (5): 374–81. PMID 17026616. doi:10.1111/j.1399-0004.2006.00692.x 
  123. McGuire, Amy, L; Caulfield, Timothy (2008). «Science and Society: Research ethics and the challenge of whole-genome sequencing». Nature Reviews Genetics. 9 (2): 152–156. PMC 2225443 . PMID 18087293. doi:10.1038/nrg2302 
  124. Curtis, Caitlin; Hereward, James; Mangelsdorf, Marie; Hussey, Karen; Devereux, John (18 de dezembro de 2018). «Protecting trust in medical genetics in the new era of forensics». Genetics in Medicine. 21 (7): 1483–1485. PMC 6752261 . PMID 30559376. doi:10.1038/s41436-018-0396-7 
  125. Wade, Nicholas (4 de setembro de 2007). «In the Genome Race, the Sequel Is Personal». New York Times. Consultado em 22 de fevereiro de 2009. Cópia arquivada em 11 de abril de 2009 
  126. Ledford, Heidi (2007). «Access : All about Craig: the first 'full' genome sequence». Nature. 449 (7158): 6–7. Bibcode:2007Natur.449....6L. PMID 17805257. doi:10.1038/449006a  
  127. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G, Lin Y, MacDonald JR, Pang AW, Shago M, Stockwell TB, Tsiamouri A, Bafna V, Bansal V, Kravitz SA, Busam DA, Beeson KY, McIntosh TC, Remington KA, Abril JF, Gill J, Borman J, Rogers YH, Frazier ME, Scherer SW, Strausberg RL, Venter JC (setembro de 2007). «The diploid genome sequence of an individual human». PLOS Biol. 5 (10): e254. PMC 1964779 . PMID 17803354. doi:10.1371/journal.pbio.0050254  
  128. Wade, Wade (1 de junho de 2007). «DNA pioneer Watson gets own genome map». International Herald Tribune. Consultado em 22 de fevereiro de 2009. Cópia arquivada em 27 de setembro de 2008 
  129. Wade, Nicholas (31 de maio de 2007). «Genome of DNA Pioneer Is Deciphered». New York Times. Consultado em 21 de fevereiro de 2009. Cópia arquivada em 20 de junho de 2011 
  130. Wheeler DA; Srinivasan M; Egholm M; Shen Y; Chen L; McGuire A; He W; Chen YJ; Makhijani V; Roth GT; Gomes X; Tartaro K; Niazi F; Turcotte CL; Irzyk GP; Lupski JR; Chinault C; Song XZ; Liu Y; Yuan Y; Nazareth L; Qin X; Muzny DM; Margulies M; Weinstock GM; Gibbs RA; Rothberg JM (2008). «The complete genome of an individual by massively parallel DNA sequencing». Nature. 452 (7189): 872–6. Bibcode:2008Natur.452..872W. PMID 18421352. doi:10.1038/nature06884  
  131. Wang J; Wang, Wei; Li, Ruiqiang; Li, Yingrui; Tian, Geng; Goodman, Laurie; Fan, Wei; Zhang, Junqing; Li, Jun; Zhang, Juanbin, Juanbin; Guo, Yiran, Yiran; Feng, Binxiao, Binxiao; Li, Heng, Heng; Lu, Yao, Yao; Fang, Xiaodong, Xiaodong; Liang, Huiqing, Huiqing; Du, Zhenglin, Zhenglin; Li, Dong, Dong; Zhao, Yiqing, Yiqing; Hu, Yujie, Yujie; Yang, Zhenzhen, Zhenzhen; Zheng, Hancheng, Hancheng; Hellmann, Ines, Ines; Inouye, Michael, Michael; Pool, John, John; Yi, Xin, Xin; Zhao, Jing, Jing; Duan, Jinjie, Jinjie; Zhou, Yan, Yan; et al. (2008). «The diploid genome sequence of an Asian individual». Nature. 456 (7218): 60–65. Bibcode:2008Natur.456...60W. PMC 2716080 . PMID 18987735. doi:10.1038/nature07484 
  132. Bentley DR; Balasubramanian S; et al. (2008). «Accurate whole human genome sequencing using reversible terminator chemistry». Nature. 456 (7218): 53–9. Bibcode:2008Natur.456...53B. PMC 2581791 . PMID 18987734. doi:10.1038/nature07517 
  133. Ley TJ; Mardis ER; Ding L; Fulton B; McLellan MD; Chen K; Dooling D; Dunford-Shore BH; McGrath S; Hickenbotham M; Cook L; Abbott R; Larson DE; Koboldt DC; Pohl C; Smith S; Hawkins A; Abbott S; Locke D; Hillier LW; Miner T; Fulton L; Magrini V; Wylie T; Glasscock J; Conyers J; Sander N; Shi X; Osborne JR; et al. (2008). «DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome». Nature. 456 (7218): 66–72. Bibcode:2008Natur.456...66L. PMC 2603574 . PMID 18987736. doi:10.1038/nature07485 
  134. Lohr, Steve (20 de outubro de 2011). «New Book Details Jobs's Fight Against Cancer». The New York Times. Cópia arquivada em 28 de setembro de 2017 
  135. «Complete Human Genome Sequencing Datasets to its Public Genomic Repository». Cópia arquivada em 10 de junho de 2012 
  136. a b «200,000 whole genomes made available for biomedical studies by U.K. effort». www.science.org (em inglês). Consultado em 10 de dezembro de 2021 
  137. «Whole Genome Sequencing data on 200,000 UK Biobank participants available now». www.ukbiobank.ac.uk. Consultado em 11 de dezembro de 2021 
  138. a b Kris A. Wetterstrand, M.S. «The Cost of Sequencing a Human Genome». National Human Genome Research Institute  Última atualização: 1º de novembro de 2021