Ontologia genética

Um conjunto de termos para unificar a descrição funcional de genes e produtos gênicos

Ontologia genética (em inglês: Gene Ontologic) é uma das principais bioinformática iniciativa de unificar a representação do gene e atributos de produtos génicos em todas as espécies.[1] Mais especificamente, o projeto visa: 1) manter e desenvolver o seu vocabulário controlado do gene e gene atributos do produto; 2) anotar genes e produtos de gene, e assimilar e disseminar a anotação de dados; e 3) fornecer ferramentas para o acesso fácil a todos os aspectos dos dados fornecidos pelo projeto, e para permitir uma interpretação funcional de dados experimentais, utilizando a ontologia genética, por exemplo, através do enriquecimento da análise.[2][3] A ontologia genética é parte de um esforço maior de classificação, a "Open Biomedical Ontologies "(OBO).[4]

Embora o nomenclatura de gene em si, visa manter e desenvolver o vocabulário controlado do gene e produtos de gene, a ontologia genética estende-se no esforço por utilizar linguagem de marcação para tornar os dados (não só dos genes e seus produtos, mas também de todos os seus atributos) legível por máquina, e fazer isso de uma forma que é unificado em todas as espécies (considerando que as convenções de nomenclatura do gene varia em táxon biológicos).

Termos e ontologia editar

De uma perspectiva prática, uma ontologia é uma representação de algo que conhecemos. "Ontologias" consistem em uma representação de coisas que são detectáveis ou diretamente observáveis, e as relações entre essas coisas. Não existe uma terminologia padrão universal em biologia e domínios relacionados, e os usos a termo podem ser específicos para uma espécie, área de pesquisa ou até mesmo um grupo de pesquisa específico. Isso dificulta a comunicação e o compartilhamento de dados.[5]

O projeto de ontologia genética[6] fornece uma ontologia de definição de termos representando as propriedades do produto génico. A ontologia abrange três domínios:

  • componente celular, as partes de uma célula ou de seus ambientes extracelulares;[7]
  • função molecular, as atividades elementares de um produto do gene ao nível molecular,tais como a ligação ou catálise;
  • processo biológico, operações ou conjuntos de eventos moleculares com início e fim definidos, pertinentes ao funcionamento de unidades de vida integradas: células, tecidos, órgãos e organismos.

Cada um termo de ontologia genética tem um nome de termo, o que pode ser uma palavra ou seqüência de palavras; um identificador alfanumérico único; uma definição com fontes citadas; e um espaço de nomes, indicando que o domínio ao qual ele pertence. Os termos também podem ter sinônimos, que são classificados como sendo exatamente equivalente ao prazo de nome, mais largo, mais estreito, ou relacionados; referências a conceitos equivalentes em outros bancos de dados; e comentários no termo de significado ou uso. A ontologia genética é estruturada como uma direcionado acíclico gráfico, e cada termo tem definido as relações para um ou mais termos no mesmo domínio, e, por vezes, para outros domínios. O vocabulário da ontologia genética é projetado para ser espécie-neutro, e inclui termos aplicáveis a procariotas e eucariotas, único e os organismos multicelulares.

Ontologia genética não é estática, e adições, correções e alterações sugeridas, e solicitados, os membros da pesquisa e anotação das comunidades, bem como por aqueles diretamente envolvidos no projeto.[8] Por exemplo, um anotador de maio de solicitação de um termo específico para representar uma via metabólica, ou uma seção da ontologia podem ser revistos, com a ajuda de especialistas da comunidade (e.g.[9]). Sugeriu edições são analisados pelos editores de ontologia, e implementado, onde apropriado.

O arquivo de ontologia genética está disponível gratuitamente a partir do website do projeto ontologia genética[10] em um número de formatos, ou pode ser acessado on-line usando o GO navegador AmiGO. O Gene Ontology projeto também fornece para download mapeamentos de seus termos para outros sistemas de classificação.

Exemplo de termo de editar

: id: IR:0000016
: nome: atividade de lactase
: namespace: molecular_function
: def: "Catálise da reação: lactose + H2O=D-glicose + D-galactose." [CE:3.2.1.108]
: sinônimo: "a lactase-phlorizin hydrolase atividade" AMPLO [CE:3.2.1.108]
: sinônimo: "lactose galactohydrolase atividade" EXATA [CE:3.2.1.108]
: xref: CE:3.2.1.108
: xref: MetaCyc:LACTASE-RXN
: xref: Reactome:20536
: é_um: IR:0004553 ! hydrolase atividade, hydrolyzing O-glycosyl compostos

Fonte de dados:[11]

Anotação editar

O genoma de anotação é a prática de captura de dados sobre um produto do gene, e anotações de ontologia genética e usa termos do projeto para fazê-lo. Os membros do consórcio de ontologia genética apresentam a anotação de integração e disseminação de ontologia genética do site, onde eles podem ser baixados diretamente ou visualizados on-line utilizando o AmiGO.[12] Além do gene de identificador de produto e relevantes termos ontologia genética, Anotações de ontologia genética tem os seguintes dados: A referência usada para fazer a anotação (por exemplo, um artigo de revista); Uma evidência de código que denota o tipo de evidências que a anotação é baseado; A data e o criador da anotação

A evidência de que o código vem a partir de um vocabulário controlado de códigos, abrangendo tanto a anotação de métodos manual e automatizada. Por exemplo, Traceable Author Statement (TAS) significa um curador tem de ler a publicação de um artigo científico e os metadados para que a anotação tenha uma citação, para que o papel; Inferred from Sequence Similarity (ISS) significa que um ser humano curador analisou a saída a partir de uma sequência de similaridade de pesquisa e verificou-se que é biologicamente significativa. As anotações de processos automatizados (por exemplo, remapeamento de anotações criadas usando outra anotação de vocabulário), recebem o código Inferred from Electronic Annotation (IEA). Em abril 1, 2010, mais de 98% de todos fazer anotações ontologia genética foram inferidos computacionalmente, não por curadores.[13] Como estas anotações não são verificados por um ser humano, o Consórcio de ontologia genética considera-o menos confiável e inclui apenas um subconjunto de dados disponível on-line em AmiGO. Total de anotação de conjuntos de dados pode ser transferido a partir do website da ontologia genética. Para apoiar o desenvolvimento de anotação, o Consórcio fornece estudo de campos e mentores para novos grupos de desenvolvedores.

Recentemente, muitos algoritmos de aprendizagem de máquina têm sido criados e implementados para prever anotações ontologias genéticas.[14][15]

Exemplo de anotação editar

: Produto do Gene: Actina, o alfa de músculo cardíaco 1, a uniprotkb:P68032
: Termo de ontologia genética: contração cardíaca ; IR:0060047 (processo biológico)
: Prova código: Inferida a partir do Fenótipo Mutante (IMP)
: Referência: PubMed
: Atribuído por: a uniprotkb, junho 6, 2008

Fonte de dados:[16]

Ferramentas editar

Há um grande número de ferramentas disponíveis[17] on-line e para download que utilizam os dados fornecidos pelo projeto ontologia genética. A grande maioria destas provenientes de terceiros; o Consórcio desenvolve e suporta duas ferramentas, AmiGO e OBO-Editar.

AmiGO[12][18] é uma aplicação baseada na web que permite que os usuários para consultar, procurar e visualizar as ontologias e o produto do gene de anotação de dados. Ele também tem uma ferramenta BLAST,[19][20] permitindo a análise de grandes conjuntos de dados,[21][22] e uma interface para consulta do banco de dados da ontologia genética diretamente.[23]

AmiGO pode ser usado on-line no site da ontologia genética para acessar os dados fornecidos pelo Consórcio, ou pode ser baixado e instalado para uso local em qualquer banco de dados empregando o OG esquema de banco de dados (e.g.[24]). Ele é livre, software de código aberto e está disponível como parte do go-dev distribuição de software.[25]

OBO-Editar[26] é um open source, independente da plataforma editor de ontologias desenvolvido e mantido pelo Consórcio de ontologia genética. Ele é implementado em Java e utiliza um grafo orientado abordagem para exibir e editar ontologias. OBO-Edição inclui um abrangente de busca e interface de filtro, com a opção de processar os subconjuntos de termos para torná-los visualmente distintos; a interface do usuário também pode ser personalizado de acordo com as preferências do usuário. OBO-Edição tem também um italiano, que podem inferir links que não tenham sido explicitamente indicado, com base nas relações existentes e suas propriedades. Embora ele foi desenvolvido para ontologias biomédicas, OBO-Edição pode ser utilizada para visualizar, pesquisar e editar qualquer ontologia. Está disponível gratuitamente para "download".[25]

Consórcio editar

O Consórcio é o conjunto de bancos de dados biológicos e grupos de pesquisa envolvidos ativamente no projeto ontologia genética.[27] Isso inclui um número de modelo de organismo e de bases de dados multi-espécies de proteína de bancos de dados, desenvolvimento de "software", grupos, e uma dedicada editoria.

História editar

O projeto de ontologia genética foi construído originalmente em 1998 por um consórcio de pesquisadores que estudam o genoma de três organismos-modelo: Drosophila melanogaster (mosca da fruta), Mus musculus (camundongo) e Saccharomyces cerevisiae (levedura ou fermento de padeiro).[28] Muitos outros Bancos de dados de Modelo de Organismo juntaram-se ao consortium ontologia genética, contribuindo não apenas a anotação de dados, mas também contribuindo para o desenvolvimento de ontologias e ferramentas para visualizar e aplicar os dados. Até agora, a maioria das principais bases de dados em plantas, animais e microorganismos fazem uma contribuição para este projeto. Desde janeiro de 2008, contém mais de 24,500 termos aplicáveis a uma ampla variedade de organismos biológicos. Existe um corpo significativo de literatura sobre o desenvolvimento e o uso de ontologia genética, e tornou-se uma ferramenta padrão em bioinformática arsenal. Seus objetivos têm três aspectos: a construção de ontologia genética, a atribuição de uma ontologia para o gene/produtos de gene e desenvolvimento de software e bancos de dados para os dois primeiros objetos.

Diversas análises do ontologia genética usando formal, domínio independente de propriedades de classes (o metaproperties) também estão começando a aparecer. Por exemplo, uma análise ontológica do biológicos ontologias ver.[29]

Referências

  1. «The Gene Ontology project in 2008». Nucleic Acids Research. 36. PMC 2238979 . PMID 17984083. doi:10.1093/nar/gkm883 
  2. Dessimoz; Škunca (eds.). The Gene Ontology Handbook. 1446. [S.l.: s.n.] ISBN 9781493937431. ISSN 1064-3745. doi:10.1007/978-1-4939-3743-1   
  3. «Primer on the Gene Ontology». 1446. ISSN 1064-3745. doi:10.1007/978-1-4939-3743-1_3 
  4. «The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration». Nature Biotechnology. 25. PMC 2814061 . PMID 17989687. doi:10.1038/nbt1346 
  5. Gene Ontology The Gene Ontology Consortium (2001) Genome Res. 11:1425-1433
  6. The Gene Ontology project in 2008 | The Gene Ontology Consortium Nucleic Acids Research, Volume 36, edição Supl 1, 1º de janeiro, 2008, Pages D440–D444, https://doi.org/10.1093/nar/gkm883
  7. Vasyutin, I. A.; Lyundup, A. V.; Viranov, A. Z.; Butnaru, D. V.; Kuznetsov, S. L. (2017). «Urethra Reconstruction with Tissue-Engineering Technology». Vestnik Rossiiskoi Akademii Meditsinskikh Nauk. 72 (1): 17–25. ISSN 0869-6047. PMID 29308838 
  8. Lovering, Ruth C. «How Does the Scientific Community Contribute to Gene Ontology?». In: Dessimoz; Skunca. The Gene Ontology Handbook. Col: Methods in Molecular Biology. 1446. [S.l.: s.n.] ISSN 1064-3745. doi:10.1007/978-1-4939-3743-1_7 
  9. «Ontology development for biological systems: immunology». Bioinformatics. 23. PMID 17267433. doi:10.1093/bioinformatics/btm029 
  10. «Gene Ontology Database» 
  11. «gene_ontology.1_2.obo» (OBO 1.2 flat file) 
  12. a b AmiGO--the current official web-based set of tools for searching and browsing the Gene Ontology database
  13. «The what, where, how and why of gene ontology--a primer for bioinformaticians». Briefings in Bioinformatics. 12. PMC 3220872 . PMID 21330331. doi:10.1093/bib/bbr002 
  14. «Computational algorithms to predict Gene Ontology annotation». BMC Bioinformatics. 16. PMC 4416163 . PMID 25916950. doi:10.1186/1471-2105-16-S6-S4 
  15. Cozzetto, Domenico; Jones, David T. «Computational Methods for Annotation Transfers from Sequence». In: Dessimoz; Skunca. The Gene Ontology Handbook. Col: Methods in Molecular Biology. 1446. [S.l.: s.n.] ISSN 1064-3745. doi:10.1007/978-1-4939-3743-1_5 
  16. «AmiGO: P68032 Associations» 
  17. «SerbGO: searching for the best GO tool». Nucleic Acids Research. 36. PMC 2447766 . PMID 18480123. doi:10.1093/nar/gkn256 
  18. «AmiGO: online access to ontology and annotation data». Bioinformatics. 25. PMC 2639003 . PMID 19033274. doi:10.1093/bioinformatics/btn615 
  19. AmiGO BLAST tool
  20. «High-throughput functional annotation and data mining with the Blast2GO suite». Nucleic Acids Research. 36. PMC 2425479 . PMID 18445632. doi:10.1093/nar/gkn176 
  21. AmiGO Term Enrichment tool; finds significant shared GO terms in an annotation set
  22. AmiGO Slimmer; maps granular annotations up to high-level terms
  23. GOOSE, GO Online SQL Environment; allows direct SQL querying of the GO database
  24. «Plant Ontology Consortium» 
  25. a b «Gene Ontology downloads at SourceForge» 
  26. «OBO-Edit--an ontology editor for biologists». Bioinformatics. 23. PMID 17545183. doi:10.1093/bioinformatics/btm112 
  27. «The GO Consortium» 
  28. «Gene ontology: tool for the unification of biology. The Gene Ontology Consortium». Nature Genetics. 25. PMC 3037419 . PMID 10802651. doi:10.1038/75556 
  29. «An ontological analysis of some biological ontologies». Frontiers in Genetics. 3. PMC 3509948 . doi:10.3389/fgene.2012.00269 

Ligações externas editar