Un código xenético expandido é un código xenético modificado artificialmente no cal un ou máis codóns específicos foron reasignados para codificar un aminoácido que non está entre os 22 aminoácidos proteinoxénicos comúns codificados naturalmente.[1]
Os elementos clave para crear un código xenético expandido son:
unha ARNt sintetase que recoñeza só ese ARNt e só o aminoácido non estándar.
A expansión do código xenético é un eido de investigación da bioloxía sintética, unha disciplina de bioloxía aplicada que ten como fin modificar por enxeñaría os sistemas vivos para propósitos útiles. A expansión do código xenético enriquece o repertorio de ferramentas útiles dispoñibles pola ciencia.
En maio de 2019 os investigadores, nun esforzo notable, informaron da creación dunha nova forma sintética (posiblemente artificial) de vida viable, unha variante da bacteriaEscherichia coli, reducindo o número natural de 64 codóns no xenoma bacteriano a 61 codóns, dos cales 59 se usaron para codificar 20 aminoácidos, para o cal eliminaron dous dos seis codóns que codifican a serina e un dos tres codóns de stop.[2][3]
Introdución
É salientable que o código xenético de todos os organismos vivos sexa esencialmente o mesmo, de modo que todos os seres vivos usan a mesma ’linguaxe xenética’ para 'escribir' as súas variadas informacións xenéticas.[4] En xeral, a introdución de novos aminoácidos non naturais funcionais nas proteínas das células dos seres vivos rompe esa universalidade da linguaxe xenética, o cal idealmente podería levar a crear formas alternativas de vida.[5] As proteínas prodúcense grazas ás moléculas do sistema traducional, que descodifican as mensaxes dos ARN creando unha cadea de aminoácidos. A tradución da información xenética contida no ARN mensaxeiro (ARNm) a unha proteína é catalizada polos ribosomas. Os ARN transferentes (ARNt) utilízanse como claves para descodificar o ARNm ao polipéptido codificado. O ARNt recoñece un codón específico de tres nucleótidos no ARNm por medio dunha secuencia complementaria chamada anticodón que ten nun dos seus bucles. Cada codón de tres nucleótidos (triplete) é traducido a algún dos vinte aminoácidos naturais habituais nas proteínas.[6] Hai polo menos un ARNt para cada codón, e ás veces múltiples codóns codifican o mesmo aminoácido, o que se chama dexeneración do cçodigo xenético. Moitos ARNts son compatibles con varios codóns. Un encima chamado aminoacil ARNt sintetase une covalentemente o aminoácido ao ARNt apropiado.[7] A maioría das células teñen unha sintetase diferente para cada aminoácido (hai 20 sintetases ou máis). Por outra parte, algunhas bacterias teñen menos de 20 aminoacil ARNt sintetases, e introducen os "aminoácidos perdidos" por modificación dun aminoácido estruturalmente relacionado por medio dun encima aminotransferase.[8] Unha característica aproveitada na expansión do código xenético é que a aminoacil ARNt sintetase a miúdo non recoñece a zona do anticodón, senón outra parte do ARNt, o que significa que se o anticodón mutase a codificación dese aminoácido cambiaría a un novo codón. No ribosoma a información do ARNm é traducida a aminoácidos específicos cando o codón do ARNm coincide co anticodón complementario dun ARNt, e o aminoácido unido engádese á cadea polipeptídica en crecemento. Cando se libera do ribosoma, a cadea polipeptídica sofre un pregamento orixinando unha proteína funcional.[7]
Para incorporar un novo aminoácido ao código xenético cómpren varios cambios. Primeiro, para unha tradución con éxito dun novo aminoácido, o codón ao cal se asigna o novo aminoácido non pode xa codificar un dos 20 aminoácidos naturais. Xeralmente, utilízase un codón sen sentido (codón de stop) ou un codón de catro bases (os normais son de tres bases ou tripletes).[6] Segundo, é necesario un novo par de ARNt e aminoacil ARNt sintetases, estes chámanse o conxunto ortogonal. O conxunto ortogonal non debe interferir cos conxuntos de ARNt e sintetases, pero debe seguir sendo compatible funcionalmente co ribosoma e outros compoñentes do aparato de tradución. O sitio activo da sintetase é modificado para que acepte só o novo aminoácido. Habitualmente, críbase unha biblioteca de sintetases mutantes buscando unha que cargue o ARNt co aminoácido desexado. A sintetase é modificada tamén para que recoñeza soamente o ARNt ortogonal.[6] O par formado polo ARNt e a sintetase adoita ser modificado por enxeñaría noutras bacterias ou en células eucariotas.[9]
Nesta área de investigación, os 20 aminoácidos proteinoxénicos codificados denomínanse aminoácidos estándar ou alternativamente canónicos ou naturais, mentres que os aminoácidos engadidos son denominados aminoácidos non estándar (NSAAs), non naturais. Non obstante, hai que matziar o uso dos termos aminoácido natural e non natural, porque, por exemplo, a fosfoserina é un aminoácido que aparece de forma natural nas proteínas como unha modificación postraducional, pero non se introduce na proteína directamente na tradución porque ningún codón a codifica (é un aminoácido non proteinoxénico); porén, á fosfoserina pode asignárselle experimentalmente un codón (por expansión do código xenético) e dese modo si sería introducida directamente na tradución. Hai outros aminoácidos usados na expansión do código xenético que non aparecen nunca na natureza.
Aminoácidos non estándar
O primeiro elemento do sistema é o aminoácido que se engadiu ao código xenético dunha certa cepa de organismo.
Engadíronse uns 71 aminoácidos non estándar a diferentes cepas de E. coli, lévedos ou células de mamíferos.[10] Debido a detalles técnicos (síntese química máis doada de aminoácidos non estándar, menos interacción e evolución máis fácil da aminoacil-ARNt sintetase), os aminoácidos non estándar son xeralmente máis grandes que os estándar e a maioría adoita ter un núcleo defenilalanina pero cunha gran variedade de substituíntes diferentes. Isto permite un gran repertorio de novas funcións, como as seguintes: funcionar como etiquetas (ver figura), funcionar como reporteiros fluorescentes (por exemplo, a dansilalanina)[11] ou para producir proteínas traducionais en E. coli con modificacións postraducionais eucariotas (por exemplo, fosfoserina, fosfotreonina e fosfotirosina).[10][12]
O traballo pioneiro fíxoo Rolf Furtner, que sen axuda de ninguén usou o par ARNtPhe/PheRS de lévedo para incorporar p-iodofenilalanina a E.coli.[13]
Os aminoácidos non naturais incorporados ás proteínas comprenden os seguints tipos:
aminoácidos con novas propiedades estéricas e electrónicas; os aminoácidos que forman fotoenlaces cruzados que poden usarse para probar interaccións proteína-proteína in vitro ou in vivo;
aminoácidos que conteñen grupos ceto, acetileno, azida e boronato, que poden usarse para introducir selectivamente un gran número de sondas biofísicas, etiquetas, e novos grupos funcionais químicos nas proteínas in vitro ou in vivo;
aminoácidos activos en reaccións redox para sondar e modular a transferencia de electróns;
aminoácidos fotoengaiolados e fotoisomerizables para fotorregular procesos biolóxicos;
aminoácidos que se unen a metais para a catálise e percepción de ións metálicos;
aminoácidos que conteñen que cadeas laterais fluorescentes ou infravermellos activas para sondar estruturas de proteínas e dinámicas;
ácidos α-hidroxi e D-aminoácidos como sondas da conformación dos esqueletos das moléculas e interaccións de enlaces de hidróxeno; e
aminoácidos sulfatados e miméticos de aminoácidos fosforilados como sondas de modificacións postraducional.[14][15][16]
A dispoñibilidade de aminoácidos non estándar require que o organismo os importe do medio ou os biosintetice. No primeiro caso, o aminoácido non natural sintetízase quimicamente primeiro na súa forma L opticamente pura.[17] Despois, engádese ao medio de crecemento da célula.[10] Unha biblioteca de compostos é xeralmente probado para o seu uso na incorporación dos novos aminoácidos, pero isto non é sempre necesario; por exemplo, varios sistemas de transporte poden manexar aminoácidos non naturais con cadeas laterais apolares.
No segundo caso, cómpre preparar por enxeñaría unha vía biosintética, por exemplo, unha cepa de E. coli que biosintetiza un novo aminoácido (p-aminofenilalanina) a partir de fontes de carbono básicas e inclúeo no seu código xenético.[16][18][19] Outro exemplo: a produción de fosfoserina, un metabolito natural, e consecuentemente necesita a alteración da súa vía para incrementar a súa produción.[12]
Asignación de codóns
Outro elemento do sistema é un codón ao que asignar o aminoácido novo.
Un problema importante para a expansión do código xenético é que non hai codóns libres. O código xenético non ten unha composición non aleatoria que mostre signos que deixen enxergar as fases da súa evolución primordial, porén, desde que se formou quedou 'conxelado' e está case universalmente conserconservado.[20] Non obstante, algúns codóns son máis raros en canto á súa abundancia que outros. De feito, en E. coli (e en todos os organismos) o uso dos codóns non é igual, senón que presenta varios codóns raros (ver táboa despregable), sendo o máis raro (pouco frecuente) o codón de stop 'ámbar' (UAG).
A posibilidade de reasignar codóns foi feita realidade por Normanly et al. en 1990 cando unha cepa mutante viable de E. coli leu o codón de stop UAG ("ámbar") como un aminoácido.[22] Posteriormente, no laboratorio de Schultz, utilizaron a ARNtTyr/tirosil-ARNt sintetase (TyrRS) da arqueaMethanococcus jannaschii[6] para introducir unha tirosina en vez do STOP, o valor normal do codón ámbar.[23] Isto conseguiuse debido ás diferenzas entre as sintases bacterianas endóxenas e a sintase ortóloga arqueana, que non se recoñecen unha á outra. Seguidamente, o grupo fixo evolucionar o par ARNt/sintase ortogonal para utilizar o aminoácido non estándar O-metiltirosina.[6] A isto seguiu o aminoácido máis grande naftilalanina[24] e a benzoilfenilalanina formadora de fotoenlaces cruzados,[25] o cal probaba a potencial utilidade do sistema.
O codón ámbar é o codón menos usado en Escherichia coli (0,03%), pero facer que se lea ten como resultado unha perda substancial de fitness. De feito, un estudo atopou que había polo menos 83 péptidos afectados de forma importante pola lectura a través do codón[26] Ademais, o etiquetado era incompleto. Como consecuencia, fixérase que varias cepas reduciran o número destes codóns, incluíndo a eliminación de todos os codóns ámbar do xenoma.
Na maioría das cepas de E. coli K-12 hai 314 codóns UAG de stop. En consecuencia, dedicouse unha enorme cantidade de traballo á substitución destes codóns. Unha estratexia da que foi pioneiro o grupo do Profesor George Church de Harvard, consistía en utilizar as técnicas MAGE e CAGE: isto dependía dunha transformación múltiple e a subseguinte recombinación das cepas para eliminar todos os codóns UAG, a última parte presentada como un punto dubidoso nun primeiro artigo,[27] pero isto foi despois superado. Isto orixinou unha cepa de E. coli C321.ΔA, que carece de todos os codóns UAG e o factor de liberación 1 (RF1). Isto fíxose substituíndo todos os codóns UAG por outro codón de stop distinto e despois usando UAG, que quedaba libre como codón, para a introdución dun aminoácido non estándar; deste xeito non se afectaba a fitness, porque os codóns de stop seguían funcionando nas súas posicións, aínda que substituídos por outro codón de stop diferente.[28] Isto permitiu realizar un experimento con esta cepa para facela "adicta" ao aminoácido bifenilalanina ao facer evolucionar varios encimas clave para que sexa requirido estruturalmente, poñendo así o seu código xenético expandido baixo selección positiva.[29]
Reasignación de codón raro con sentido
Ademais do codón ámbar, tamén se considerou o uso de codóns con sentido raros (pouco frecuentes no xenoma). O codón AGG codifica a arxinina, pero unha cepa foi modificada con éxito para facer que codifique a 6-N-aliloxicarbonil-lisina.[30]
Outro candidato é o codón AUA da isoleucina, que é pouco común. Ao anticodón do ARNt AUA introducíuselle unha base especial, a lisidina. A deleción da sintase (tilS) foi posible grazas á substitución do ARNt nativo polo de Mycoplasma mobile (sen lisidina). A fitness reducida é un primeiro paso para empurrar a cepa a perder todos os codóns AUA, o que permite usar este codón para a expansión do código xenético.[31]
Codóns de catro bases (cuadrupletes)
Aínda o código xenético está baseado en codóns de tres bases (tripletes) na natureza, a mutación de desprazamento da pauta de lectura +1 é un proceso natural que permite o uso de secuencias de catro nucleótidos (codóns cuadrupletes) para codificar un aminoácido.[32] Desenvolvementos recentes na enxeñaría do código xenético tamén mostraron que o codón cuadruplete podería usarse para codificar aminoácidos non estándar en condicións experimentais.[33][34][35] Isto permitiu o uso simultáneo de dous aminoácidos non naturais, a p-azidofenilalanina (pAzF) e a N6-[(2-propiniloxi)carbonil]lisina (CAK), que establecen enlaces cruzados entre si por cicloadición de Huisgen.[36] A descodificación de cuadrupletes en cepas de tipo salvaxe non recodificadas é moi ineficaz.[36] Isto débese a que a interacción entre os ARNt preparados por enxeñaría con complexos ternarios ou outros compoñentes da tradución non é tan favorable e forte coma con elementos de tradución endóxena da célula.[37] Este problema pode superarse modificando por enxeñaría especificamente e facendo evolucionar un ARNt que poida descodificar codóns cuadrupletes en cepas non recodificadas.[38] Up to 4 different quadruplet orthogonal tRNA/tRNA synthethase pairs can be generated in this manner. [39] Quadruplet codon decoding approach has also been applied to the construction of an HIV-1 vaccine.[40]
Par ARNt/sintetase
Outro elemento clave é o par ARNt/sintetase.
O conxunto ortólogo da sintetase e o ARNt pode ser mutado e cribado por evolución dirixida para cargar o ARNt cun aminoácido diferente, incluso novo. As mutacións no plásmido que contén o par poden introducirse por PCR proclive ao erro ou por cebadores dexenerados para o sitio activo da sintetase.
A selección implica múltiples roldas dun proceso en dous pasos, no que o plásmido se transfire en células que expresan un encima cloranfenicol acetil transferase cun codón ámbar prematuro. En presenza de cloranfenicol tóxico e do aminoácido non natural, as células superviventes anularán o codón ámbar usando o ARNt ortogonal aminoacilado co aminoácido estándar ou o non natural. Para eliminar o primeiro deles, insírese o plásmido nas células cun xene barnase (tóxico) cun codón ámbar prematuro pero sen o aminoácido non natural, eliminando todas as sintases ortogonais que non recoñecen especificamente o aminoácido non natural.[6]
Ademais de recodificar o ARNt a un codón diferente, pode ser mutado para recoñecer un codón de catro bases, o que permite opcións adicionais de codificación libre.[41]
O aminoácido non natural introduce, como resultado, diversas propiedades fisicoquímicas e biolóxicas para utilizalas como ferramenta para explorar a estrutura das proteínas e a súa función ou para crear proteínas novas ou melloradas para propósitos prácticos.
Conxuntos ortogonais en organismos modelos
Os pares ortogonais de sintetases e ARNts que funcionan para un organismo poden non funcionar para outro, xa que a sintetase pode aminoacilar incorrectamente ARNts endóxenos ou o propio ARNt pode ser aminoacilado incorrectamente por unha sintetase endóxena. Como resultado, os conxuntos creados ata agora son distintos entre os diferentes organismos.
Publicado en 2004 e mutado para o ácido 2-aminooctanoico, o-metil tirosina, e o-nitrobencil cisteína.[48] Feito evolucionar en lévedos para a 4,5-dimetoxi-2-nitrobencil serina,[50][51] testado en células de ratos e de mamíferos con 4,5-dimetoxi-2-nitrobencil-cisteína fotosensible.[52][53]
En 2017 informouse dun rato modificado por enxeñaría cun código xenético expandido que podía producir proteínas con aminoácidos non naturais.[55]
Ribosomas ortogonais
Igual que os ARNt e as aminoacil ARNt sintetases ortogonais (aaRSs), os ribosomas ortogonais foron preparados por enxeñaría para que traballen en paralelo aos ribosomas naturais, sen interferírense. Os ribosomas ortogonais idealmente usan diferfentes trasncritos de ARNm que os dos ribosomas naturais e finalmente deberían operar sobre un conxunto diferente de ARNts. Isto debería reducir parte da perda de fitness que actualmente aínda se orixina polo uso de técnicas como a supresión do codón ámbar. Ademais, os ribosomas ortogonais poden ser mutados e optimizados para tarefas particulares, como o recoñecemento de codóns cuadruplete. Tal optimización non é posible ou moi desvantaxosa para os ribosomas naturais.
o-Ribosoma
En 2005 publicáronse tres conxuntos de ribosomas, que non recoñecen o ARNm natural, senón que traducen unha poboación separada de ARNm ortogonal (o-mRNA).[56] Isto conseguiuse cambiando o recoñecemento da secuencia do ARNm, a secuencia de Shine-Dalgarno, e a secuencia de recoñecemento correspondente no ARNr 16S do ribosoma, a denominada secuencia anti-Shine-Darlgarno. Deste xeito, segue sendo posible o apareamento de bases, que normalmente se perde se unha das secuencias muta. Porén as mutacións no ARNr 16S non estaban limitadas aos nucleótidos con apareamento de bases obvio da secuencia anti-Shine-Darlgarno clásica.
Ribo-X
En 2007 o grupo de Jason W. Chin presentou un ribosoma ortogonal, que foi optimizado coa supresión do codón ámbar.[57] O ARNr 16S mutouse de tal maneira que se unise ao factor de liberación RF1 con menos forza do que o fai o ribosoma natural. Este ribosoma non eliminaba o problema da diminución da fitness da célula causada pola supresión de codóns de stop nas proteínas naturais. Porén, por medio da mellora da especificidade aumentaron significativamente o rendemento da proteína diana sintetizada correctamente (de ~20% a >60% para a supresión dun codón ámbar e de <1% a >20% para dous codóns ámbar).
Ribo-Q
En 2010 o grupo de Jason W. Chin presentou unha versión máis optimizada de ribosoma ortogonal. O Ribo-Q é un ARNr 16S optimizado para recoñecer ARNts, que teñen anticodóns cuadruplete que recoñecen os codóns cuadruplete, en vez dos codóns triplete naturais.[36] Con esta estratexia o número de posibles codóns sobe de 64 a 256. Mesmo tendo en conta unha variedade de codóns de stop, poderían potencialmente ser codificados deste modo máis de 200 aminoácidos diferentes.
Grampado do ribosoma
Consiste en deseñar un ARN ribosómico que se una covalentemente ás subunidades do ribosoma por medio dunha grampa de ARN, que manterá ambas as subunidades unidas. Os ribosomas ortogonais descritos antes estaban todos enfocados a optimizar o ARNr 16S. Ata agora, este ARNr 16S optimizado era combinado con subunidades maiores ribosómicas naturais para formar ribosomas ortogonais. Se o ARNr 23S, o principal compoñente de ARN da subunidade ribosómica maior, ten que ser optimizado tamén, hai que ter a certeza de que non hai interacción na ensamblaxe dos ribosomas ortogonal e natural. Para asegurar que o ARNr 23S optimizado só se forma nos ribosomas con ARNr 16S optimizado, os dous ARNr foron combinados nun só transcrito.[58] Inserindo a secuencia para o ARNr 23S (a grampa) nunha rexión bucle da secuencia do ARNr 16S, ambas as unidades seguen adoptando pregamentos funcionais. Como os dous ARNr están ligados e así en constante proximidade, únense preferentemente entre si, non a outras subunidades ribosómicas que floten libremente no medio.
Centro de peptidil transferase modificado por enxeñaría
En 2014 descubriuse ao alterar o centro peptidil transferase do ARNr 23S, que os ribosomas podían crearse para funcionar con poboacións de ARNt ortogonal.[59] O extremo 3’ dos ARNt está universalmente conservado para ser sempre CCA. Os dous nucleótidos de citosina aparéanse cos dous de guanina do ARNr 23S para que o ARNt se una ao ribosoma. Esta interacción cómpre para garantir a fidelidade traducional. Porén, ao co-mutaren os nucleótidos que se van unir dunha maneira que aínda permita que se poidan aparear, a fidelidade traducional pode conservarse. O extremo 3’ do ARNt é mutado de CCA a CGA, mentres que dous nucleótidos de citosina nos sitios A e P dos ribosomas están mutados a nucleótidos de guanina. Isto fai que estes ribosomas non acepten os ARNt naturais como substratos e que estes ARNt non poidan ser usaos como substratos polos ribosomas naturais.
Para usar estes ARNt con efectividade, terían que ser aminoacilados por encimas aaRSs ortogonais específicas. A maioría das aaRSs naturais recoñecen o extremo 3’ do seu ARNt correspondente.[60][61] Aínda non se dispón de aaRSs para estes ARNt mutados no extremo 3'. Ata agora, este sistema só se viu que funcionase nunha tradución in vitro (libre de células) onde a aminoacilación do ARNt ortogonal se conseguía usando os chamados “flexicimas”. Os flexicimas (ou flexizimas) son ribocimas con actividade de aminoacilación de ARNt.[62]
Aplicacións
Cun código xenético expandido os aminoácidos non naturais poden ser xeneticmente dirixidos a calquera sitio que se elixa na proteína de interese. A alta eficiencia e fidelidade deste proceso permite un mellor control da situación da modificación en comparación coa modificación de proteínas postraducional, que, en xeral, afecta a todos os aminoácidos do mesmo tipo, como todos os grupos tiol da cisteína e o grupo amino da lisina.[63] Ademais, un código xenético expandido permite que as modificacións se leven a cabo in vivo. A capacidade de dirixir a un sitio específico dunha proteína compostos químicos sintetizados no laboratorio permite realizar moitos tipos de estudos que doutro odo serían extremadamente difíciles, como:
Investigar a estrutura e función das proteínas. Usando aminoácidos de tamaños lixeiramente diferentes como a o-metiltirosina ou a dansilalanina en vez da tirosina e inserindo compostos reporteiros codificados xeneticamente (que cambian de cor ou son activos no spin) en sitios da proteína seleccionados, poden medirse información sobre a estrutura e función da proteína.
Investigar o papel de modificacións postraducional na estrutura e función da proteína. Usando aminoácidos que imitan modificacións postraducionais como a fosfoserina, pode obterse unha proteína bioloxicamente activa, e a natureza específica de sitio da incorporación do aminoácido pode dar información sobre como afecta a posición, densidade e distribución da fosforilación da proteína á función proteica.[64][65][66][67]
Identificar e regular a actividade de proteínas. Usando aminoácidos fotoengaiolados, a función da proteína pode ser cambiada de activa a inactiva iluminando o organismo.
Cambiar o modo de acción dunha proteína. Pode empezarse co xene dunha proteína que se une a certa secuencia de ADN e, inserindo un aminoácido quimicamente activo no sitio de unión, convertela nunha proteína que corta o ADN en vez de quedar unida a el.
Mellorar a inmunoxenicidade e superar a autotolerancia. Substituíndo tirosinas estratexicamente elixidas por p-nitro fenilalanina, pode facerse que unha autoproteina tolerada sexa inmunoxénica.[68]
Destrución selectiva de compoñentes celulares seleccionados. Usando un código xenético expandido compostos quimicamente destrutivos non naturais (ás veces chamados "cabezas explosivas químicas") poden incorporarse a proteínas que teñen como diana compoñentes celulares específicos.[69]
Producir proteínas mellores. Facer evolucionar bacteriófagos T7 que codificaban a 3-iodotirosina no codón ámbar nunha cepa non evolucionada de E. coli , ten como resultado unha poboación mellor que a de tipo salvaxe grazas á presenza de iodotirosina no seu proteoma.[70]
A expansión do código xenético está aínda na súa infancia. A actual metodoloxía normalmente usa só un aminoácido non estándar á vez, mentres que idealmente se poderían utilizar moitos. De feito, o grupo de Jason Chin bateu recentemente a marca ao recodificar xeneticamente unha cepa de d E.coli que podía incorporar simultaneamente ata 4 aminoácidos non naturais.[72] Ademais, houbo desenvolvementos de software que permiten a combinación de ribosomas ortogonais e pares ARNt/RS non naturais para mellorar o rendemento de proteína e a fidelidade.[73]
Xenoma sintético recodificado
Unha maneira de conseguir a codificación de múltiples aminoácidos non naturais é sintetizando e reescribindo o xenoma.[74] En 2010, cun custo de 40 millóns de dólares, construíuse un organismo, o Mycoplasma laboratorium, que era controlado por un xenoma sintético pero non recodificado.[75] O primeiro organismo recodificado xeneticamente creouse por unha colaboración entre os laboratorios de George Church e Farren Isaacs, cando a cepa de tipo salvaxe de E.coli MG1655 foi recodificada de tal maneira que a totalidade dos seus 321 codóns de stop coñecidos (UAG) foron substituídos por codóns sinónimos UAA e o factor de liberación 1 foi sometido a knockout para eliminar a interacción con codóns de stop exóxenos e mellorar a síntese de proteínas non naturais.[76] En 2019, creouse Escherichia coli Syn61, cun xenoma recodificado de 4 megabases que constaba de só 61 codóns en vez dos 64 naturais.[3][2]
Ademais da eliminación do uso de codóns raros, a especificidade do sistema precisa ser aumentada xa que moitos ARNt recoñecen varios codóns.[74]
Alfabeto xenético expandido
Outra estratexia é expanir as nucleobases para incrementar a copacidade de codificación.
Un par de bases non natural (UBP, do inglés unnatural base pair) é unha subunidade (ou nucleobase) deseñada de ADN que se crea no laboratorio e non aparece na natureza. Unha demostración de UBPs conseguina in vitro o grupo de Ichiro Hirao no instituto RIKEN do Xapón. En 2002, desenvolveron un par de bases non natural entre 2-amino-8-(2-tienil)purina (s) e piridina-2-ona (y) que funciona in vitro na transcrición e tradución para a incorporación específica de sitio de aminoácidos non estándar nas proteínas.[77] En 2006, crearon a 7-(2-tienil)imidazo[4,5-b]piridina (Ds) e o pirrol-2-carbaldehido (Pa) como un terceiro par de bases para a replicación e a transcrición.[78] Despois, descubríuse que a Ds e o 4-[3-(6-aminohexanamido)-1-propinil]-2-nitropirrol (Px) eran un par de alta fidelidade na amplificación por PCR.[79][80] En 2013, aplicaron o par Ds-Px á xeración dun aptámero de ADN por selección in vitro (SELEX) e demostraron que a expansión do alfabeto xenético aumenta significativamente as afinidades do aptámero de ADN polas proteínas diana.[81]
En 2012 un grupo de científicoa norteamericanos liderados por Floyd Romesberg, un biólogo químico do Instituto de Investigación Scripps de San Diego, California, publicou que o seu equipo deseñara un par de bases non natural.[82] Os dous novos nucleótidos artificiais ou pares de bases non naturais foron denominados "d5SICS" e "dNaM." Máis tecnicamente, estes nucleótidos artificiais, que levaban nucleobaseshidrófobas, presentan dous aneis aromáticos fusionados que forman un complexo (d5SICS–dNaM) ou pares de bases no ADN.[83][84] En 2014 o mesmo equipo do Instituto de Investigación Scripps informou que sintetizaran un tramo de ADN circular coñecido como plásmido que contén os pares de bases naturais T-A e C-G xunto cun par de bases non natural con mellores prestacións que se deseñara no laboratorio de Romesberg, e foi inserido en células da bacteria E. coli, que replicou con éxito o par de bases non natural durante moitas xeracións.[85] Este é o primeiro exemplo coñecido dun organismo vivo que transmite o código xenético expandido ás seguintes xeracións.[83][86] Isto conseguiuse en parte pola adición dun xene de alga de apoio que expresa un transportador de nucleósidos trifosfato que importa eficientemente os trifosfatos de d5SICSTP e de dNaMTP á bacteria E. coli.[83] Despois, as vías de replicación bacteriana natural úsanos para replicar con precisión o plásmido que contiña d5SICS–dNaM.
A incorporación con éxito dun terceiro par de bases nun organismo vivo é un logro significativo cara ao obxectivo de expandir o máis posible o número de aminoácidos que poden codificarse no ADN, expandindo así o potencial para un organismo vivo para producir novas proteínas.[85] As cadeas artificiais de ADN non codifican aínda nada, mais os científicos especulan que poderían deseñarse para que fabriquen novas proteínas que poderían ter usos industriais e farmacéuticos.[87]
En maio de 2014 anunciaron que conseguiran introducir con éxito dous novos nucleótidos artificiais no ADN bacteriano, e incluíndo nucleótidos artificiais individuais no medio de cultivo, puideron facelos pasar á bacteria e o plásmido replicouse 24 veces; porén, non crearon ARNm ou proteínas capaces de usar os nucleótidos artificiais.[83][88][89][90]
Métodos relacionados
Método da incorporación por presión selectiva (SPI) para a produción de aloproteínas
Fixéronse moitos estudos que produciron proteínas con aminoácidos non estándar, pero non altreran o código xenético. Estas proteínas, chamadas aloproteínas, fanse incubando as células cun aminoácido non natural en ausencia dun aminoácido codificado similar para que o primeiro se incorpore na proteína en lugar do segundo, por exemplo o ácido L-2-aminohexanoico (Ahx) en lugar de metionina (Met).[91]
Estes estudos dependen da actividade promiscua natural da aminoacil ARNt sintetase para engadir á súa diana (o ARNt) un aminoácido non natural (é dicir, un análogo) similar ao substrato natural, por exemplo na confusión de isoleucina por metionina feita pola metionil-ARNt sintetase.[92] En cristalografía de proteínas, por exemplo, a adición de selenometionina ao medio de cultivo dunha cepa auxótrofa da metionina ten como resultado proteínas que conteñen selenometionina en oposición á metionina (ver dispersión anómala de multilonxitude de onda).[93] Outro exemplo é que se engaden fotoleucina e fotometionina en vez de leucina e metionina para colocar etiquetas cruzadas en proteínas.[94]
De xeito similar, algúns fungos tolerantes ao telurio poden incorporar telurocisteína e telurometionina nas súas proteínas en vez de cisteína e metionina.[95] O obxectivo de expandir o código xenético é máis radical, xa que non substitúe un aminoácido, senón que engade un ou máis ao código. Por outra parte, as substitucións en todo o proteoma son realizadas máis eficientemente por substitucións de aminoácidos globais. Por exemplo, intentáronse substitucións en todo o proteoma de aminoácidos naturais con análogos fluorados en Escherichia coli[96] e Bacillus subtilis.[97] En 2015 informouse dunha subtitución completa de triptófano por tienopirrol-alanina en resposta a 20899 codóns UGG existentes en E. coli feita por Budisa e Söll.[98] Ademais, moitos fenómenos biolóxicos, como o pregamento e estabilidade de proteínas, están baseados en efectos sinérxicos en moitas posicións na secuencia de proteínas.[99]
Nese contexto o método SPI xera proteínas recombinantes variantes ou aloproteínas directamente por substitución de aminoácidos naturais polos seus equivalentes non naturais.[100] Un hóspede con expresión axótrofa dun aminoácido é suplementado cun aminoácido análogo durante a expresión de proteínas diana.[101] Esta estratexia evita os inconvenientes dos métodos baseados na supresión[102] e é superior a el en canto a eficiencia, reproducibildade e necesidade duns equipamentos experimentais extremadamente simples.[103] Numerosos estudos demostraron como a substitución global de aminoácidos canónicos por varios análogos isostéricos causaban perturbacións estruturais mínimas pero cambios drásticos en termodinámica,[104] pregamento,[105] agregación[106] propiedades espectrais[107][108] e actividade encimática.[109]
A expansión do código xenético descrita antes é in vivo. Unha alternativa é os experimentos de tradución in vitro de cambio de codificación. Isto require a depleción de todos os ARNt e a reintrodución selectiva de certos ARNt aminoacilados, algús aminoacilados quimicamente.[110]
Síntese química
Hai varias técnicas para producir péptidos quimicamente, xeralmente é por química de protección en fase sólida. Isto significa que pode engadirse calquera aminoáckido (protexido) á secuencia nacente.
En novembro de 2017 un equipo do Instituto de Investigación Scripps informou de que conseguiran construír un xenoma semisintético da bacteria E. coli usando seis nucleótidos diferentes (fronte aos catro atopados na natureza). As dúas "letras" extra forman un terceiro par de bases non natural (ademais dos dous pares naturais, que son: A-T, G-C). Os organismos resultantes podían prosperar e sintetizar proteínas usando "aminoácidos non naturais".[111][112] O par de bases non natural usado é o dNaM–dTPT3.[112] Este par de bases non natural coñecíase previamente,[113][114] pero este é o primeiro informe de transcrición e tradución de proteínas usando un par de bases non natural.
Notas
↑Xie J, Schultz PG (decembro de 2005). "Adding amino acids to the genetic repertoire". Current Opinion in Chemical Biology9 (6): 548–54. PMID16260173. doi:10.1016/j.cbpa.2005.10.011.
↑Kubyshkin V, Budisa N (agosto de 2017). "Synthetic alienation of microbial organisms by using genetic code engineering: Why and how?". Biotechnology Journal12 (8): 1600097. PMID28671771. doi:10.1002/biot.201600097.
↑Cardillo G, Gentilucci L, Tolomelli A (marzo de 2006). "Unusual amino acids: synthesis and introduction into naturally occurring peptides and biologically active analogues". Mini Reviews in Medicinal Chemistry6 (3): 293–304. PMID16515468. doi:10.2174/138955706776073394.
↑Mehl RA, Anderson JC, Santoro SW, Wang L, Martin AB, King DS, Horn DM, Schultz PG (xaneiro de 2003). "Generation of a bacterium with a 21 amino acid genetic code". Journal of the American Chemical Society125 (4): 935–9. PMID12537491. doi:10.1021/ja0284153.
↑Wang L, Brock A, Schultz PG (marzo de 2002). "Adding L-3-(2-Naphthyl)alanine to the genetic code of E. coli". Journal of the American Chemical Society124 (9): 1836–7. PMID11866580. doi:10.1021/ja012307j.
↑Atkins, J. F.; Bjoerk, G. R. "A gripping tale of ribosomal frameshifting: extragenic suppressors of frameshift mutations spotlight P-site realignment." Microbiol. Mol. Biol. Rev. 2009, 73, 178-210.
↑Anderson, J. C.; Wu, N.; Santoro, S. W.; Lakshman, V.; King, D. S.; Schultz, P. G. "An expanded genetic code with a functional quadruplet codon." Proc. Natl. Acad. Sci. U. S. A. 2004, 101, 7566-7571.
↑Neumann, H.; Wang, K.; Davis, L.; Garcia-Alai, M.; Chin, J. W. "Encoding multiple unnatural amino acids via evolution of a quadruplet-decoding ribosome." Nature 2010, 464, 441-444.
↑Niu, W.; Schultz, P. G.; Guo, J. "An expanded genetic code in mammalian cells with a functional quadruplet codon." ACS Chem. Biol. 2013, 8, 1640-1645.
↑Niu, W., Schultz, P. G., and Guo, J. (2013) An expanded genetic code in mammalian cells with a functional quadruplet codon. ACS Chem Biol 8, 1640-1645.
↑Chen, Y., Wan, Y., Wang, N., Yuan, Z., Niu, W., Li, Q., and Guo, J. (2018) Controlling the Replication of a Genomically Recoded HIV-1 with a Functional Quadruplet Codon in Mammalian Cells. ACS Synth. Biol. 7, 1612-1617.
↑Watanabe T, Muranaka N, Hohsaka T (marzo de 2008). "Four-base codon-mediated saturation mutagenesis in a cell-free translation system". Journal of Bioscience and Bioengineering105 (3): 211–5. PMID18397770. doi:10.1263/jbb.105.211.
↑Anderson JC, Schultz PG (agosto de 2003). "Adaptation of an orthogonal archaeal leucyl-tRNA and synthetase pair for four-base, amber, and opal suppression". Biochemistry42 (32): 9598–608. PMID12911301. doi:10.1021/bi034550w.
↑ 48,048,1Wu N, Deiters A, Cropp TA, King D, Schultz PG (novembro de 2004). "A genetically encoded photocaged amino acid". Journal of the American Chemical Society126 (44): 14306–7. PMID15521721. doi:10.1021/ja040175z.
↑Palei S, Buchmuller B, Wolffgramm J, Muñoz-Lopez Á, Jung S, Czodrowski P, Summerer D (abril de 2020). "Light-Activatable TET-Dioxygenases Reveal Dynamics of 5-Methylcytosine Oxidation and Transcriptome Reorganization". Journal of the American Chemical Society142 (16): 7289–7294. PMID32286069. doi:10.1021/jacs.0c01193.
↑Rackham O, Chin JW (agosto 2005). "A network of orthogonal ribosome x mRNA pairs". Nature Chemical Biology1 (3): 159–66. PMID16408021. doi:10.1038/nchembio719.
↑Terasaka N, Hayashi G, Katoh T, Suga H (xullo de 2014). "An orthogonal ribosome-tRNA pair via engineering of the peptidyl transferase center". Nature Chemical Biology10 (7): 555–7. PMID24907900. doi:10.1038/nchembio.1549.
↑Ohuchi M, Murakami H, Suga H (outubro de 2007). "The flexizyme system: a highly flexible tRNA aminoacylation tool for the translation apparatus". Current Opinion in Chemical Biology11 (5): 537–42. PMID17884697. doi:10.1016/j.cbpa.2007.08.011.
↑Kipper K, Lundius EG, Ćurić V, Nikić I, Wiessler M, Lemke EA, Elf J (febreiro de 2017). "Application of Noncanonical Amino Acids for Protein Labeling in a Genomically Recoded Escherichia coli". ACS Synthetic Biology6 (2): 233–255. PMID27775882. doi:10.1021/acssynbio.6b00138.
↑Dunkelmann DL, Oehm SB, Beattie AT, Chin JW (agosto de 2021). "A 68-codon genetic code to incorporate four distinct non-canonical amino acids enabled by automated orthogonal mRNA design". Nature Chemistry13 (11): 1110–1117. PMID34426682. doi:10.1038/s41557-021-00764-5.
↑Dunkelmann DL, Oehm SB, Beattie AT, Chin JW (agosto de 2021). "A 68-codon genetic code to incorporate four distinct non-canonical amino acids enabled by automated orthogonal mRNA design". Nature Chemistry13 (11): 1110–1117. PMID34426682. doi:10.1038/s41557-021-00764-5.
↑ 74,074,1Krishnakumar R, Ling J (xaneiro de 2014). "Experimental challenges of sense codon reassignment: an innovative approach to genetic code expansion". FEBS Letters588 (3): 383–8. PMID24333334. doi:10.1016/j.febslet.2013.11.039.
↑Gibson DG, Glass JI, Lartigue C, Noskov VN, Chuang RY, Algire MA, et al. (xullo de 2010). "Creation of a bacterial cell controlled by a chemically synthesized genome". Science329 (5987): 52–6. Bibcode:2010Sci...329...52G. PMID20488990. doi:10.1126/science.1190719.
↑Hirao I, Kimoto M, Mitsui T, Fujiwara T, Kawai R, Sato A, et al. (setembro de 2006). "An unnatural hydrophobic base pair system: site-specific incorporation of nucleotide analogs into DNA and RNA". Nature Methods3 (9): 729–35. PMID16929319. doi:10.1038/nmeth915.
↑Suchanek M, Radzikowska A, Thiele C (abril de 2005). "Photo-leucine and photo-methionine allow identification of protein-protein interactions in living cells". Nature Methods2 (4): 261–7. PMID15782218. doi:10.1038/NMETH752.
↑Ramadan SE, Razak AA, Ragab AM, el-Meleigy M (xuño de 1989). "Incorporation of tellurium into amino acids and proteins in a tellurium-tolerant fungi". Biological Trace Element Research20 (3): 225–32. PMID2484755. doi:10.1007/BF02917437.
↑Budisa N (decembro de 2004). "Prolegomena to future experimental efforts on genetic code engineering by expanding its amino acid repertoire". Angewandte Chemie43 (47): 6426–63. PMID15578784. doi:10.1002/anie.200300646.
↑Link AJ, Mock ML, Tirrell DA (decembro de 2003). "Non-canonical amino acids in protein engineering". Current Opinion in Biotechnology14 (6): 603–9. PMID14662389. doi:10.1016/j.copbio.2003.10.011.
↑Agostini F, Völler JS, Koksch B, Acevedo-Rocha CG, Kubyshkin V, Budisa N (agosto de 2017). "Biocatalysis with Unnatural Amino Acids: Enzymology Meets Xenobiology". Angewandte Chemie56 (33): 9680–9703. PMID28085996. doi:10.1002/anie.201610129.
↑Rubini M, Lepthien S, Golbik R, Budisa N (xullo de 2006). "Aminotryptophan-containing barstar: structure--function tradeoff in protein design and engineering with an expanded genetic code". Biochimica et Biophysica Acta (BBA) - Proteins and Proteomics1764 (7): 1147–58. PMID16782415. doi:10.1016/j.bbapap.2006.04.012.