Matriz de substituição

Em bioinformática e biologia evolutiva uma matriz de substituição, ou de pontuação, descrive o ritmo em que um caráter em uma sequência altera-se a outro caráter com o tempo. As matrizes de substituição são vistas usualmente no contexto de alinhamento de sequências de aminoácidos ou ADN, onde a semelhança entre sequências depende do tempo desde sua divergência e dos ritmos de substituição segundo são representadas na matriz.[1] Estas matrizes são utilizadas como parâmetros dos algoritmos de alinhamento (por exemplo os de Needlemann-Wunsch ou Smith-Waterman), nos quais cumprem o papel de assinalar uma determinada pontuação a cada emparelhamento entre os aminoácidos das sequências a alinhar, contribuindo assim à pontuação global do alinhamento.

Matriz PAM70 para 23 aminoácidos, calculada com o serviço web do Wageningen University Laboratory of Bioinformatics (Laboratório de Bioinformática da Universidade de Wageningen) para tal fim.

Este tipo de matrizes são mais usuais nos alinhamento de sequências de aminoácidos (proteínas) que nos de nucleotídeos (ADN), já que neste último caso um sistema de pontuação muito mais simples é geralmente usada para o emparelhamento entre os quatro diferentes nucleotídeos e geralmente atribui uma pontuação positiva para a coincidência no emparelhamento, uma pontuação nula ou negativa para a incompatibilidade e uma pontuação negativa para as lacunas ou gaps.[2]

Referências

  1. Attwood, T. K. (2002). «6». Introducción a la bioinformática. [S.l.]: Prentice Hall. 117 páginas. ISBN 84-205-3551-6 
  2. Mount, D.W. (2004). «3 - Alignment of Pairs of Sequences». Bioinformatics. Sequence and Genome Analysis 2ª ed. [S.l.]: CSHL Press. 65 páginas. ISBN 0-87969-687-7