A Conserved Domain Database ou CDD (Base de datos de Dominios Conservados) é unha base de datos de modelos de aliñamentos de secuencias múltiples ben anotados e modelos de busca en bases de datos derivados, de dominios proteicos antigos evolutivamente e proteínas completas.[1] Entre os contidos da CDD están os modelos de dominios curados manualmente do NCBI e modelos de dominios importados de varias bases de datos de fontes externas (Pfam, SMART, COG, PRK, TIGRFAMs). É característico dos dominios curados polo NCBI que usen información de estruturas en 3D para definir explicitamente as fronteiras entre dominios, aliñar bloques, emendar detalles de aliñamentos, e proporcionar unha panorámica das relacións entre secuencia, estrutura e función. Os modelos curados manualmente están organizados xerarquicamente cando describen familias de dominios que están claramente relacionados por teren un antepasado común. Para que os datos non sexan redundantes, a CDD agrupa os modelos de dominios procedentes de varias fontes en superfamilias.
Obxectivos
Os dominios poden considerarse como as unidades estruturais ou funcionais dunha proteína. Estas dúas clasificacións (estrutural e funcional) coinciden bastante a miúdo, e o que se descobre independentemente como unha unidade de pregamento dunha cadea polipeptídica, ten tamén unha función específica. Con frecuencia os dominios identifícanse como unidades recorrentes de secuencia ou estrutura, que poden existir en varios contextos. Na evolución molecular ditos dominios puideron ter sido utilizados como bloques de construción de proteínas, e puideron terse combinado de diferentes maneiras para modular a función da proteína. A CDD define os dominios conservados como unidades recorrentes na evolución molecular, cuxa extensión pode determinarse pola análise de secuencias e estruturas.
O obxectivo do proxecto de curación de dominios conservados do NCBI é proporcionar unha base de datos útil aos usuarios aos que lles interesa investigar como os patróns de conservación e diverxencia de residuos nunha familia se relacionan coas propiedades funcionais, e proporcionar ligazóns útiles para unha información máis detallada que poida axudar a comprender as relacións entre secuencias, estruturas e funcións. Para facelo, CDD Curators fornece os seguintes tipos de información para suplementar e enriquecer os aliñamentos de múltiples secuencias tradicionais que forman a base dos modelos de dominios: estruturas tridimensionais e motivos centrais conservados, características e sitios conservados, organización filoxenética, e ligazóns a fontes de literatura electrónica.
Consulta da base de datos
A colección de datos forma parte tamén do sistema de recuperación e consulta Entrez do NCBI, con ligzóns cruzadas con outros numerosos recursos. A CDD proporciona unha anotación de pegadas dactilares de dominios e sitios funcionais conservados nas secuencias proteicas. Pode obterse unha anotación de dominios precalculada para secuencias de proteínas rastrexadas polo sistema Entrez do NCBI, e a colección de modelos da CDD pode ser consultada para buscar novas secuencias de proteínas por medio do servizo CD-Search[2] ou en Batch CD-Seach[3], que permite a computación e descarga de anotcións de grandes conxuntos de consultas de proteínas.