DNA結合ドメイン (DNA-binding domain: DBD )とは、二本鎖または一本鎖DNA を認識する少なくとも1つの構造モチーフ を構造に含むタンパク質ドメイン である。DBDは特定のDNA配列(認識配列)に対して特異的な、またはDNA一般に対して親和性を持つ[ 1] 。一部のDNA結合ドメインは、折り畳まれた構造の核酸も含む。
機能
LacリプレッサーのN末端DNA結合ドメイン(青)は、C末端調節ドメイン(赤)によって制御されている。調節ドメインはアロステリックエフェクター分子(緑)に結合する。タンパク質のアロステリック応答は、リンカー領域を介して調節ドメインからDNA結合ドメインに伝達される[ 2] 。
DNA結合ドメインは、多くの場合、異なる機能を備えた別のタンパク質ドメイン と共に大きなタンパク質 を構成する。この他のドメインは、しばしばDNA結合ドメインの活性を調節する。DNA結合ドメインの機能は構造の形成、もしくは転写制御への関与、あるいはこの両方である。
DNA構造に関与するDNA結合ドメインはDNA複製 、修復 、保存 、およびメチル化 などのDNA修飾を担う。
遺伝子発現の調節 に関与する多くのタンパク質はDNA結合ドメインを含む。例えば、転写因子 と呼ばれるタンパク質は、DNAとの結合によって転写 を調節する。ほとんどの細胞シグナル伝達カスケード の最終段階は、DNA結合タンパク質が関わる遺伝子調節である。
DNA結合ドメインは、DNA配列特異的または非特異的にDNAのヌクレオチド と相互作用するが、非特異的であってもタンパク質とDNA間の相互作用には何らかの分子相補性 がある。DNA結合ドメインは、DNAの主溝または副溝で、あるいはDNAの構成糖とリン酸によってDNAを認識する。配列特異的なDNA認識は、タンパク質の機能や目的に合わせられている。例えば、デオキシリボヌクレアーゼ の一種であるDNAse IはDNAをほぼランダムに切断するため非特異的である必要があるものの、DNAの特定の立体構造を認識し、DNAフットプリントと呼ばれる手法によるDNA認識の研究に有用な、ある程度特異的なDNA切断パターンを示す。
多くのDNA結合ドメインでは、特定の遺伝子を活性化する転写因子 や、 制限酵素 やテロメラーゼ ような特定の部位でDNAを修飾する酵素など、DNA配列を特異的に認識する必要がある。
DNA結合タンパク質の特異性は、ゲル電気泳動 、分析的超遠心分離 、 熱量測定、DNA突然変異 、タンパク質構造 の突然変異または修飾、 核磁気共鳴 、 X線結晶構造解析 、 表面プラズモン共鳴 、 電子スピン共鳴 、架橋 およびマイクロスケール熱泳動 (MST)など、多くの生化学的および生物物理学的手法を使用して研究されている。
ゲノムのDNA結合タンパク質
各ゲノムの大部分の遺伝子は、DNA結合タンパク質をエンコードしている(下表を参照)。ただし、DNA結合性を有するのは少数のタンパク質ファミリーのみである。例えば、約750個のジンクフィンガー タンパク質を含む、約20,000個のヒトタンパク質のうち2000個程度のみがDNA結合性である[ 3] 。
種類
ヘリックスターンヘリックス
もともと真正細菌で発見されたヘリックス・ターン・ヘリックス モチーフはリプレッサータンパク質によく見られ、約20アミノ酸である。真核生物では、ホメオドメイン は2つのヘリックスを含み、そのうちの1つはDNAを認識する認識ヘリックスである。これは、発達過程を調節するタンパク質によく見られる。
ジンクフィンガー
DNA(下)に結合したグルココルチコイド受容体 (上)におけるDNA結合ドメインのジンクフィンガー二量体の結晶構造(PDB : 1R4O )。亜鉛原子は灰色の球体で表され、それに配位するシステイン側鎖は棒として描かれている。
ジンクフィンガー ドメインは主に真核生物で見られ、一部は細菌でも発見されている[ 5] 。ジンクフィンガードメインは一般的に23〜28アミノ酸長であり、規則的な間隔で配置された残基(ヒスチジンまたはシステイン)で亜鉛イオンに配位結合することにより安定化し保持する。最も一般的なジンクフィンガー(Cys2His2)は、単一の亜鉛イオンを安定化し、1個の認識ヘリックスと1個のβシート で構成されており、1個の亜鉛イオンを安定化させる[ 6] 。
ロイシンジッパー
塩基性のロイシンジッパー ( bZIP )ドメインは主に真核生物で見られ、一部は細菌で見いだされる。bZIPドメインでは、7残基ごとに、ロイシン を含むαヘリックス が配置されている。あるヘリックスが他のヘリックスを見つけると、このヘリックスのロイシンはジッパーの歯のように相互作用し、2つのタンパク質を二量体化することを可能にする。DNAに結合すると、塩基性アミノ酸残基が糖リン酸骨格に結合し、ヘリックスが主溝に入り込み、遺伝子発現を調節する。
ウィングドヘリックス
ウィングドヘリックス (winged helix :WH)ドメインは、約110個のアミノ酸から成り、4個のヘリックスと1個の2ストランド2ストランドβシートを持つ。
ウィングドヘリックスターンヘリックス
ウィングドヘリックスターンヘリックス (winged helix-turn-helix:wHTH)ドメインは、通常85〜90アミノ酸長であり、1個の3ヘリックス束と4ストランドβシート(ウィング)によって形成されている。
ヘリックスループヘリックス
塩基性ヘリックスループヘリックス (basic helix-loop-helix :bHLH)ドメインは、いくつかの転写因子 において見られる、2個のαヘリックス が1個のループで繋がっている構造をしている。通常、一方のヘリックスは他方よりも小さく、ループの柔軟性により他方のヘリックスに対して折り畳まれて包み込まれることにより、二量体化がなされている。通常、DNA結合領域は大きなヘリックスにある。
HMGボックス
HMGボックス ドメインは、DNA複製 や転写 などの多くのDNA依存プロセスに関与する高移動度群タンパク質 に見られる。また、屈曲を誘発することによりDNAの柔軟性を変化させる[ 7] [ 8] 。このドメインは、ループ で区切られた3つのαヘリックス で構成される。
Wor3ドメイン
Candida albicans のWhite-Opaque Regulator 3(Wor3)にちなんで名付けられたWor3ドメインは、それ以前に発見されたほとんどのDNA結合ドメインよりも進化の歴史上近い時代に出現し、その存在は少数の菌類に限定されている[ 9] 。
OBフォールドドメイン
OBフォールドとは、オリゴヌクレオチド /オリゴ糖 結合性(o ligonucleotide/o ligosaccharide b inding)に因んで名付けられた小さな構造モチーフである。OBフォールドドメインは70〜150アミノ酸残基である[ 10] 。OBフォールドは一本鎖DNAに結合するため、OBフォールドドメインで構成されたタンパク質は一本鎖DNA結合タンパク質 である[ 10] 。
OBフォールドタンパク質は、DNA複製 、DNA組換え 、DNA修復 、転写 、翻訳 、低温ショック応答 、およびテロメア の維持に重要であることが判明している[ 11] 。
免疫グロブリンフォールド
免疫グロブリンドメイン は、大きな複数のループで接続された1個のβシートを持ち、このβシートはDNAの主溝または抗原 のいずれかを認識するのに役立つ。通常、免疫グロブリン タンパク質に見られるが、サイトカイン経路 のシグナル伝達性転写因子 にも存在する。これは、サイトカイン経路が進化の歴史上比較的新しいもので、独自の生化学システムが構築されたのではなく、既存のシステムを利用したためと推測されている。
B3ドメイン
B3 DNA結合ドメイン は、制限エンドヌクレアーゼ のEcoRII とBfiI、及び高等植物 由来の転写因子でのみ発見されており、通常100-120残基から成る。7個のベータシート と2個のアルファヘリックス が含まれており、DNA結合性擬似バレル構造を形成する。
TALエフェクター
TALエフェクターは、キサントモナス 属 の植物病原細菌に見られ、細菌の毒性や増殖を促進するために、宿主植物の遺伝子発現の調節に関与する[ 12] 。複数の33-35残基のタンデム反復配列のある中央領域が1つあり、この領域は、TALエフェクター結合部位にある単一のDNA塩基をコードする[ 13] [ 14] 。このタンデム反復配列内で、DNA塩基と直接相互作用するのは残基13のみでありこれが配列特異性を決定するが、他の残基はDNA骨格と相互作用してDNAとの結合を安定化する[ 15] 。各反復配列は一対のαヘリックスの形をとるが、反復配列で構成されたアレイ全体は右巻きのスーパーヘリックスを形成し、DNA二重らせんを包み込む。このアレイはDNA結合時に収縮することが示されており、TALエフェクターの反復配列アレイにある唯一のN末端からDNAのチミン認識を始めてDNAの収縮を行うというDNA認識メカニズムが提案されている[ 16] 。植物病原細菌のRalstonia solanacearum [ 17] 、真菌内部共生菌Burkholderia rhizoxinica [ 18] および未同定の海洋微生物2種でTALエフェクター関連タンパク質が発見されている[ 19] 。これらのグループ間において、反復配列アレイの構造とDNA結合領域の配列情報は保存されており、総じてTALE様タンパク質と呼ばれている。
ガイドRNAのための利用
Streptococcus pyogenes のCRISPR/Cas システムは、標的DNA部位との塩基対相補性を備えたガイドRNAの生物工学的操作により、真核生物の野生および人工プロモーターの活性化[ 20] と抑制の両方を可能にする[ 21] 。Cas9は、ヌクレアーゼをRNAガイドで標的DNAに誘導させるための標的DNA上の結合プラットフォームとして使用できる。ドメインCas9は、標的の調節ドメイン(活性化、抑制、またはエピジェネティックエフェクターなど)、またはゲノムエンジニアリングの汎用ツールであるエンドヌクレアーゼドメインで利用でき、その後に異なるガイドRNAで複数の遺伝子座をターゲットにできる[ 22] [ 23] 。その後、異なるガイドRNAを使用して複数の遺伝子座をターゲットにします。
脚注
外部リンク