Matrizes PAM, ou conjunto de matrizesPAM, de Point Accepted Mutation (do inglês, mutação pontual aceita), também Percent Accepted Mutation (porcentagem de mutação aceita), e também matriz de dados de mutação de Dayhoff ou MD, é um conjunto de matrizes de mutação de peptídeos, ou matrizes de substituição, calculado por Margaret Dayhoff ao final dos anos 1970,[1] no que se converteria em um trabalho determinante no campo da bioinformática. Cada matriz, quadrada e simétrica, é normalmente de um tamanho de 20 por 20 (pelos vinte aminoácidos padrão, embora nada impeça contemplar o resto e estender, consequentemente, a ordem da matriz).
O valor de uma certa célula representa a probabilidade da substituição de um aminoácido por outro, conhecida como mutação pontual. Como a matriz é calculada observando-se diferenças nas proteínas que estão muito próximas evolutivamente (com pelo menos 85% de similaridade), as substituições em questão não têm efeito sobre a função da proteína, portanto trata-se de mutações aceitas (daí seu nome) no processo evolutivo.[2]
Existem diferentes matrizes PAM. PAM1 foi calculado considerando sequências com uma mutação pontual para cada cem aminoácidos.[1] Em outras palavras, a matriz PAM1 estima o ritmo de substituição esperado entre dois aminoácidos se 1% dos aminoácidos são substituídos. Outras matrizes PAM são derivadas da multiplicação da PAM1 por ela mesma, já que se assume que mutações repetidas seguiriam, em termos de suas probabilidades, o mesmo padrão que aquelas estabelecidas na matriz PAM1, assim como múltiplas substituições podem ocorrer ao mesmo tempo. Matrizes assim derivadas são, portanto, mais adequadas para relacionar sequências evolutivamente mais distantes.[2] PAM250, por exemplo, é o resultado de elevar a 250a potência a PAM1, e é equivalente a 250 substituições para cada cem aminoácidos. Este último exemplo, no qual o número de substituições é superior ao de aminoácidos, é ilustrativo quanto à consideração necessária de múltiplas substituições em um determinado aminoácido (ou em sua situação na sequência) por períodos suficientemente longos.
Devido ao exposto, é perceptível que a Dayhoff fez um trabalho com um forte componente teórico ao assumir que uma matriz pode ser calculada para sequências divergentes de uma matriz para sequências intimamente relacionadas, elevando essa segunda matriz a uma determinada potência. Não se deve esquecer que nos anos de desenvolvimento deste trabalho o número de sequências conhecidas foi relativamente baixo, para que obras posteriores com uma base empírica mais completa estejam oferecendo melhores resultados aos pesquisadores (caso das matrizes BLOSUM).[3] Por outro lado, a mesma metodologia de Dayhoff tem sido usada nas décadas subsequentes, mas aproveitando os grandes bancos de dados de proteínas atuais[4][5] (caso das matrizes JTT).
As matrizes PAM de uso mais comum são as PAM30 e PAM70.[6]
Referências
↑ abAttwood, T. K. (2002). «6». Introducción a la bioinformática. [S.l.]: Prentice Hall. 117 páginas. ISBN84-205-3551-6
↑ abDayhoff, M.O.; et al. (1978). «6». In: Dayhoff, M. O. Atlas of Protein Sequence and Structure, Vol 5, Suppl 3. [S.l.]: Natl Biomedical Research. pp. 345–352. ISBN84-205-3551-6 !CS1 manut: Uso explícito de et al. (link)
↑Korf, I; et al. (2003). «4 - Sequence Similarity»(PDF). BLAST. [S.l.]: O'Reilly. 55 páginas. ISBN0-596-00299-8 !CS1 manut: Uso explícito de et al. (link) Nota: O Capítulo 4, sobre similaridade de sequências, e cobrindo um bom número de conceitos relevantes sobre matrizes de substituição e, em particular, matrizes de PAM, é oferecido gratuitamente pelo editor neste documento.
↑Gonnet GH, Cohen MA, Benner SA (1992). «Exhaustive matching of the entire protein sequence database». Science. 256: 1443-1445 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Jones DT, Taylor WR, Thornton JM (1992). «The rapid generation of mutation data matrices from protein sequences». Comput Applic Biosci. 8: 275-282 !CS1 manut: Nomes múltiplos: lista de autores (link)