단백질의 1차 구조(Protein Primary Structure)는 펩타이드 또는 단백질에서 아미노산의 선형 서열이다.[1] 통상적으로 단백질의 1차 구조는 N 말단에서 C 말단으로 생성된다. 단백질 생합성은 세포의 리보솜에 의해 이루어진다. 실험실에서도 펩타이드를 합성할 수 있다. 단백질 1차 구조는 직접 서열을 분석하거나 DNA 서열로부터 추론된다.
아미노산은 펩타이드 결합을 통해 중합되어 긴 골격을 형성하며, 다른 아미노산 곁사슬이 돌출되어있다. 생물학적 관점에서, 단백질은 세포의 리보솜의 번역에 의해 생성된다. 또한 일부 유기체는 비리보솜 펩타이드 합성에 의해 짧은 펩타이드를 만들 수 있는데, 이는 20개의 표준 아미노산 이외의 아미노산을 사용하며 고리화, 변형, 가교될 수있다.
펩타이드는 다양한 실험실 방법을 통해 화학적으로 합성될 수 있다. 화학적 방법은 전형적으로 생물학적 단백질 합성과 반대 순서로 펩타이드를 합성한다(C 말단에서 시작).
단백질 서열은 일련의 문자로 표시되며, N 말단에서 시작하여 C 말단까지 아미노산이 열거된다. 세 글자 약어(Three Letter Codes) 또는 한 글자 약어(One Letter Codes)를 사용하여 20개의 자연 발생 아미노산뿐만 아니라 혼합물 또는 모호한 아미노산(핵산 표기법과 유사)을 나타낼 수 있다.[1][2][3]
펩타이드는 직접 서열을 분석하거나 DNA 서열로부터 추론 될 수있다. 알려진 단백질 서열을 대조하는 큰 서열 데이터베이스가 존재한다.
일반적으로 폴리펩타이드는 비분지형 중합체이므로 이들의 차 구조는 종종 그의 골격을 따라 아미노산 서열에 의해 특정된다. 그러나 단백질은 가장 일반적으로 이황화 결합에 의해 가교 결합 될 수 있으며, 단백질의 이황화결합에 관여하는 시스테인이 필요하다. 다른 가교에는 데스모신(Desmosine)이 포함된다.
폴리펩타이드 사슬의 광학 이성질체는 라세미화를 겪을 수 있다. 순서는 변경되지 않지만 순서의 화학적 특성에 영향을 미친다. 특히 단백질에서 정상적으로 발견되는 L-아미노산은 자연적으로 이성질화 될 수있다. C α {\displaystyle \mathrm {C^{\alpha }} } 대부분의 단백질 가수 분해 효소에 의해 분해 될 수 없는 D-아미노산을 형성하는 원자가 존재한다. 또한 프롤린은 펩타이드 결합에서 안정한 트랜스 이성질체를 형성 할 수 있다.
마지막으로 단백질은 다양한 번역 후 변형을 겪을 수 있다.
폴리펩타이드의 N 말단은 다음과 같이 변형 될 수 있다.
폴리펩타이드의 C 말단은 다음과 같이 변형될 수 있다.
마지막으로 펩타이드 곁사슬은 또한 공유적으로 변형 될 수 있다.
위에서 열거된 폴리펩타이드 변형은 진핵생물의 세포 내 소기관인 소포체에서 발생하고, 리보솜에서 합성 된 후에 발생한다.
많은 다른 화학 반응(시아닐화)은 생물학적 시스템에서는 발견되지 않지만 화학자들에 의해 단백질에 적용되었다.
상기에 열거된 것 이외에, 단백질의 1차 구조의 가장 중요한 변형은(가수 분해 또는 단백질 가수 분해 효소에 의한)펩타이드 절단이다. 단백질은 종종 비활성 전구체 형태로 합성된다. 일반적으로 N 말단 또는 C 말단 세그먼트는 단백질의 활성 자리를 차단하여 그 기능을 억제한다. 단백질은 억제 펩타이드를 절단함으로써 활성화된다.
일부 단백질은 스스로를 쪼개는 힘을 가지고 있다. 전형적으로 세린의 하이드록시기(드물게 트레오닌) 또는 시스테인 잔기의 티올기는 앞선 펩타이드 결합의 카르보닐 탄소를 공격하여 사면 결합 된 중간체(히드록시옥사졸리딘, 세린/트레오닌으로 분류 됨) 또는 히드록시티아졸리딘(시스테인중간체)가 그 예이다. 아미드 형태는 일반적으로 자유에너지에 의해 선호되므로, 이 중간체는 아미드 형태로 되돌아가는 경향이 있다. 그러나 추가적인 분자 상호 작용은 아미드 형태를 덜 안정적으로 만들 수 있다. 대신에 아미노기가 방출되어 펩타이드 결합 대신에 에스터 결합(세린/트레오닌) 또는 티오에스터 결합(시스테인)이 생성된다. 이 화학 반응을 'N-O 아실기 이동'이라고 한다.
임의의 선형 사슬 이형 중합체는 단백질에 대한 용어의 사용과 유사하게 1차 구조를 가질 수 있지만, 이 사용은 단백질과 관련하여 매우 일반적인 사용과 비교하여 드물다. 광범위한 2차 구조를 갖는 RNA에서, 염기의 선형 사슬은 일반적으로 DNA에서와 같이 서열로 지칭된다. 다당류와 같은 다른 생물학적 중합체도 기본 구조는 아니지만 1차 구조를 갖는 것으로 간주 될 수 있다.
생물학적 중합체의 1차 구조는 대부분 3차원 형태(3차 구조)를 결정한다. 단백질 서열은 2차 구조의 세그먼트 또는 막 관통 영역과 같은 국소 특징을 예측하는데 사용될 수 있다. 그러나 단백질 접힘의 복잡성은 현재 그 서열만으로 단백질의 3차 구조를 예측하는 것을 금지한다. 유사한 상동성 서열의 구조(동일한 단백질 군의 구성원)를 알면 상동성 모델링에 의해 3차 구조를 매우 정확하게 예측할 수 있다. 전장 단백질 서열이 이용 가능하다면, 등전점과 같은 일반적인 생물리학적 특성 을 추정 할 수 있다.