Algoritmo Needleman-Wunsch

Algoritmo de Needleman-Wunsch.

El algoritmo de Needleman-Wunsch sirve para realizar alineamientos globales de dos secuencias. Se suele utilizar en el ámbito de la bioinformática para alinear secuencias de proteínas o de ácidos nucleicos. Fue propuesto por primera vez en 1970, por Saul Needleman y Christian Wunsch. Se trata de un ejemplo típico de programación dinámica. El algoritmo funciona del mismo modo independientemente de la complejidad o longitud de las secuencias y garantiza la obtención del mejor alineamiento.[1]

Las dos secuencias a alinear, llamadas A y B en los ejemplos, de longitud y , están formadas por elementos de un alfabeto finito de símbolos. El algoritmo necesita saber qué símbolos son diferentes entre sí y cuáles son iguales. Podemos utilizar una matriz cuadrada (S) para este propósito, en la que cada elemento indique la similitud entre los elementos i y j del alfabeto usado. Si nuestro alfabeto de símbolos no fuese finito, en vez de una matriz podríamos usar una función que tuviese como parámetros ambos símbolos a comparar y cuya salida fuese la similitud entre ambos. También se necesita otro parámetro (d) que nos indique cómo vamos a valorar que un símbolo no quede alineado con otro y que en su lugar se utilice un hueco.

Por ejemplo podemos definir la siguiente matriz:

Y entonces el siguiente alineamiento:

AGACTAGTTAC
CGA---GACGT

con una penalización por hueco de nos devolvería como solución óptima:

Para determinar la puntuación óptima y poder reconstruir el alineamiento que devolvería esa puntuación se necesita otra matriz, F, que almacena los resultados parciales de cada posible alineamiento. Las dimensiones de la matriz F son el número de elementos en la secuencia A y el de B ().

En cada iteración del algoritmo recibe valor un elemento de la matriz F. El valor que recibe el elemento representa la puntuación obtenida al alinear de forma óptima los primeros i elementos de A y los primeros j de B. Cuando el algoritmo termine, el último elemento de F (, con y ) contendrá la puntuación para el alineamiento óptimo de ambas secuencias.

  Inicio del algoritmo:
  
  
  Recursión para obtener el siguiente elemento de forma óptima:
  

La matriz F se calcula con el siguiente algoritmo:

   for i=0 to length(A)-1
     F(i,0) <- d*i
   for j=0 to length(B)-1
     F(0,j) <- d*j
   for i=1 to length(A)
     for j = 1 to length(B)
     {
       Choice1 <- F(i-1,j-1) + S(A(i), B(j))
       Choice2 <- F(i-1, j) + d
       Choice3 <- F(i, j-1) + d
       F(i,j) <- max(Choice1, Choice2, Choice3)
     }

Cuando el algoritmo acaba tenemos calculada la matriz F; el resultado es la puntuación devuelta por el mejor alineamiento posible, de acuerdo a los parámetros que hemos definido. Para obtener la secuencia se necesita ejecutar el siguiente algoritmo, que hace uso de la matriz F. Este algoritmo comienza por el último elemento, , y va retrocediendo hasta llegar a un elemento de la primera fila o la primera columna de F. En cada paso se comparan 3 elementos de F para ver cuál de ellos es el que se ha seguido en la solución óptima. Para cada debemos comparar y . Si el elemento usado es , entonces se ha alineado con un hueco; si es , entonces se ha alineado con un hueco; y si no, si el elemento elegido es , los elementos y han sido alineados. Es importante destacar que el que dos elementos sean alineados no implica necesariamente que sean iguales; significa que entre esa posibilidad, alinear con huecos o alinear símbolos diferentes, esa era la mejor opción. El pseudo-algoritmo que permite obtener el alineamiento correcto es el siguiente:

   AlignmentA <- ""
   AlignmentB <- ""
   i <- length(A) 
   j <- length(B)
   while (i > 0 AND j > 0)
   {
     Score <- F(i,j)
     ScoreDiag <- F(i - 1, j - 1)
     ScoreUp <- F(i, j - 1)
     ScoreLeft <- F(i - 1, j)
     if (Score == ScoreDiag + S(A(i), B(j)))
     {
       AlignmentA <- A(i-1) + AlignmentA
       AlignmentB <- B(j-1) + AlignmentB
       i <- i - 1
       j <- j - 1
     }
     else if (Score == ScoreLeft + d)
     {
       AlignmentA <- A(i-1) + AlignmentA
       AlignmentB <- "-" + AlignmentB
       i <- i - 1
     }
     otherwise (Score == ScoreUp + d)
     {
       AlignmentA <- "-" + AlignmentA
       AlignmentB <- B(j-1) + AlignmentB
       j <- j - 1
     }
   }
   while (i > 0)
   {
     AlignmentA <- A(i-1) + AlignmentA
     AlignmentB <- "-" + AlignmentB
     i <- i - 1
   }
   while (j > 0)
   {
     AlignmentA <- "-" + AlignmentA
     AlignmentB <- B(j-1) + AlignmentB
     j <- j - 1
   }

Se puede demostrar formalmente que tanto el tiempo de ejecución como el espacio necesario para ejecutar el algoritmo son de orden O(nm). Para alguna aplicaciones, sobre todo en bioinformática, el requerimiento de espacio es prohibitivo, puesto que se alinean secuencias muy largas. Existe una optimización de este algoritmo, denominada algoritmo de Hirschberg, que solo necesita espacio del orden O(m+n), pero a costa de incrementar el tiempo de computación.

Sitios externos

Véase también

Referencias

  1. Needleman, S.B. and Wunsch, C.D. (1970). «A general method applicable to the search for similarities in the amino acid sequence of two proteins». Journal of molecular biology (Elsevier) 48 (3): 443-453. 
  • A general method applicable to the search for similarities in the amino acid sequence of two proteins. S.B. Needleman, C.D. Wunsch (1970) J. Mol. Biol. 48(3):443-453.

Read other articles:

Arquidiócesis de Manila Archidioecesis Manilen(sis) (en latín) Catedral basílica de la Inmaculada ConcepciónInformación generalIglesia católicaIglesia sui iuris latinaRito romanoSufragánea(s) • Antipolo• Caloocan• Cubao• Imus• Malolos• Novaliches• Parañaque• Pásig• San PabloPatronazgo Virgen María Fecha de erección 6 de febrero de 1579 (como diócesis)Bula de erección Illius fulti praesidioElevación a arquidiócesis 14 de agosto de 1595SedeCatedral basílica de ...

 

Teaching of a particular religion For an overview of religious education as taught in schools around the world, see religious education in primary and secondary education. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Religious education – news · newspapers · books · scholar · JSTOR (April 2010) (Learn how...

 

Constitution Partyحزب الدستورملف:Constitution Party(Egypt) Logo.jpgالزعيممحمد البرادعىشعار كلامىعيش حرية عدالة أجتماعيةتاريخ التاسيس28 ابريل 2012الفكرBig tent[1]National affiliationNational Association for ChangeOfficial colorsBlue and GreenPeople's Assembly0 / 498Shura Council0 / 180الويبسايتhttp://www.aldostourparty.org//Politics of EgyptPolitical partiesElections محمد ا

State Security Advisor of West Bengal and former Indian police officer Surajit Kar PurkayasthaIPSPurkayastha as Police commissioner of Kolkata in 38th International Kolkata Book Fair at Milan Mela Complex in 2014Born (1957-01-01) 1 January 1957 (age 66)West Bengal, IndiaNationalityIndianEducationMechanical engineering and PGDIT Alma materIIT Kharagpur and IIFT, New DelhiSpouseSharmistha [1]Police careerCountry IndiaAllegianceIndian Police ServiceDepartmentWest Bengal Po...

 

Imagem de Sophie Chatel Sophie Chatel é uma política canadiana que foi eleita para representar o distrito eleitoral de Pontiac na Câmara dos Comuns do Canadá nas eleições federais canadenses de 2021. Antes de ser eleita trabalhava como funcionária pública.[1] Referências ↑ «Sophie Chatel elected in Pontiac riding». CBC News. 20 de setembro de 2021. Consultado em 21 de setembro de 2021  Portal da política

 

Christian Theodor von Meien Christian Theodor von Meien (* 8. Januar 1781 in Hellinghausen, Grafschaft Lippe; † 30. November 1857 auf Gut Exten) war ein deutscher Gutsbesitzer, Verwaltungsjurist und Politiker. Inhaltsverzeichnis 1 Leben 2 Literatur 3 Weblinks 4 Einzelnachweise Leben Auf der Domäne Hellinghausen aufgewachsen, studierte Christian Theodor von Meien an der Friedrich-Alexander-Universität Rechtswissenschaft. Dort schloss er sich 1801 den Erlanger Westfalen (1794–1809) an. ...

Nasal decongestant and optical isomer of methamphetamine LevomethamphetamineINN: LevmetamfetamineClinical dataRoutes ofadministrationMedical: Inhalation (nasal)Recreational: Oral, intravenous, insufflation, inhalation, suppositoryLegal statusLegal status AU: S8 (Controlled drug) BR: Class A3 (Psychoactive drugs)[1] CA: Schedule I DE: Anlage II (Authorized trade only, not prescriptible) UK: Class A US: Schedule II and for specific formulations OTC UN:...

 

Crocodile DundeeTheatrical release posterSutradara Peter Faiman Produser John Cornell Ditulis oleh John Cornell Paul Hogan Ken Shadie SkenarioJohn CornellPaul HoganKen ShadieCeritaPaul HoganPemeranPaul HoganLinda KozlowskiPenata musikPeter BestSinematograferRussell BoydPenyuntingDavid StivenDistributorParamount PicturesTanggal rilis 30 April 1986 (1986-04-30) Durasi98 min.Negara Australia Amerika Serikat Bahasa Inggris AnggaranAUD$8,800,000 (perkiraan)SekuelCrocodile Dundee IIIMDbI...

 

Mclass=notpageimage| Major mining areas in Colombia Gold    La Colosa, Quinchía Silver    Marmato Nickel    Cerro Matoso Platinum    Nóvita (TL) Emeralds    Muzo, Chivor Coal    Cerrejón, La Francia Salt    Nemocón, Zipaquirá This is a list of mining areas in Colombia.[1] The mineral industry of Colombia is large and diverse; the country occu...

Sporting event delegationDominican Republic at the2000 Summer OlympicsFlag of the Dominican RepublicIOC codeDOMNOCDominican Republic Olympic CommitteeWebsitewww.colimdo.org (in Spanish)in SydneyCompetitors13 (11 men and 2 women) in 5 sportsFlag bearer Wanda RijoMedals Gold 0 Silver 0 Bronze 0 Total 0 Summer Olympics appearances (overview)1964196819721976198019841988199219962000200420082012201620202024 The Dominican Republic competed at the 2000 Summer Olympics in Sydney, Australia. ...

 

Manuel SondakhSekretaris Jenderal Partai Kristen IndonesiaMasa jabatan5 Februari 1961 – 11 Februari 1962PresidenSoekarnoPendahuluHandrianus SinagaPenggantiChristian MooyAnggota Dewan Perwakilan RakyatMasa jabatan24 Maret 1956 – 26 Juni 1960PresidenSoekarnoAnggota Dewan Perwakilan Rakyat Gotong RoyongMasa jabatan26 Juni 1960 – 15 November 1965PresidenSoekarno Informasi pribadiLahir(1905-12-25)25 Desember 1905 Motoling, Manado, Hindia BelandaMeninggal18 November...

 

Universitas Negeri Nama Universitas (dalam Bahasa Inggris) Nama Universitas ( dalam Bahasa Polandia (singkatan)) Lokasi Didirikan Universitas Białystok Uniwersytet w Białymstoku fakultas: Fakultas Biologi, Kimia, Ekonomi, Pendidikan, Sejarah, Hukum, Matematika, Filologi , Fisika, Psikologi, Sosiologi, Teologi Białystok 1997 Universitas Casimir Uniwersytet Kazimierza Wielkiego w Bydgoszczy, UKW Fakultas Ilmu Budaya Fakultas Matematika, Fisika dan Ilmu Teknik Ilmu alam Fakultas Pedagogi dan ...

This article needs to be updated. Please help update this article to reflect recent events or newly available information. (January 2018) Various countries have blocked access to The Pirate Bay website This is a list on countries where at least one internet service provider (ISP) formerly or currently censors the popular file sharing website The Pirate Bay (TPB). Argentina On 30 June 2014, the Argentine CNC (National Communications Commission) ordered the blocking of all The Pirate Bay domain...

 

Garden in Manhattan, New York Inscribed with names of Counties of England The Queen Elizabeth II September 11th Garden is located in Hanover Square in the Financial District of Lower Manhattan, New York City. It commemorates the Commonwealth of Nations member states' victims of the September 11, 2001 attacks on the World Trade Center. It was officially opened by Queen Elizabeth II on July 6, 2010, in a ceremony alongside her husband Prince Philip, Duke of Edinburgh, then-Mayor of New York Cit...

 

American non-profit trade association Computing Technology Industry AssociationTrade nameCompTIA (January 1, 1982-present)TypeNon-profitFoundedJanuary 1, 1982; 41 years ago (1982-01-01)Headquarters3500 Lacey Road Suite 100 Downers Grove, IL 60515, U.S.Number of locationsUnited StatesArea servedGlobalProductsTechAmerica (2014-present)WebsiteOfficial website The Computing Technology Industry Association, more commonly known as CompTIA, is an American non-profit trade associati...

Bahraini politician This article is an orphan, as no other articles link to it. Please introduce links to this page from related articles; try the Find link tool for suggestions. (April 2022) Ahmed Abdullatif al-Bahar (Arabic: أحمد عبد اللطيف البحر) is a Bahraini politician.[1] Biography Al-Bahar was born in the capital of Manama. He holds a Master of Science in Human Resource Development from the University of Sheffield and a diploma in education from the University...

 

Art gallery in London Dante Gabriel Rossetti's Paolo and Francesca da Rimini (1867) was shown at the original Leicester Galleries Leicester Galleries was an art gallery located in London from 1902 to 1977 that held exhibitions of modern British, French and international artists' works. Its name was acquired in 1984 by Peter Nahum, who operates Peter Nahum at the Leicester Galleries in Mayfair. History In July 1902, Cecil and Wilfred Phillips opened a gallery in Leicester Square. The following...

 

World War II fortifications Harbor Defenses of Manila and Subic BaysThe harbor of Manila and surrounding areasActive1905–1942Country United StatesBranchUnited States Army Coast Artillery CorpsTypeCoast artilleryRoleHarbor Defense CommandPart of Philippine Department (1922–1941) United States Army Forces in the Far East (1941–1942) Garrison/HQFort Mills, CorregidorMascot(s)OozlefinchEngagementsPhilippines campaign (1941–1942)CommandersNotablecommanders MG George F. Moore Col....

Logo của Dự án Quá trình tự nhân đôi DNA. Dự án Bản đồ gen Người (tiếng Anh: Human Genome Project - HGP) là một dự án nghiên cứu khoa học quốc tế có mục đích chính là xác định trình tự của các cặp cơ sở (base pairs) tạo thành phân tử DNA và xác định khoảng 25.000 gen trong bộ gen của con người. Dự án khởi đầu vào năm 1990 với sự đứng đầu của James D. Watson. Bản phác thảo đầu tiên ...

 

Lady Knox Geyser The Lady Knox Geyser is a geyser in the Waiotapu area of the Taupo Volcanic Zone in New Zealand. It is named after Lady Constance Knox, the second daughter of Uchter Knox, 15th Governor of New Zealand. The geyser is induced to erupt daily at 10:15 am by dropping a surfactant into the opening of the vent. Eruptions produce a jet of water reaching up to 20m and can last for over an hour,[1] depending on the weather. The visible spout is made of rocks placed around ...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!