단백질 염기서열

Protein sequencing
Beckman-Spinco 단백질-펩타이드 시퀀서 사용, 1970

단백질 배열은 단백질 또는 펩타이드의 전체 또는 일부 아미노산 배열을 결정하는 실용적인 과정이다.이는 단백질을 식별하거나 번역 후 변형을 특징짓는 역할을 할 수 있다.전형적으로 단백질의 부분 배열은 유전자개념적 번역에서 파생된 단백질 배열 데이터베이스를 참조하여 단백질을 식별하기에 충분한 정보(하나 이상의 배열 태그)를 제공한다.

단백질 배열의 두 가지 주요 직접 방법은 단백질 배열 분석기(시퀀서)를 사용한 질량 분석과 에드만 분해입니다.질량분석법은 현재 단백질 배열 및 식별에 가장 널리 사용되고 있지만 에드만 분해는 단백질의 N 말단을 특징짓는 데 유용한 도구로 남아 있다.

아미노산 조성 결정

순서 있는 배열을 찾기 전에 단백질의 무질서한 아미노산 조성을 아는 것이 바람직할 때가 많다. 왜냐하면 이 지식은 배열 과정에서 오류를 쉽게 발견하거나 애매한 결과를 구별하는 데 사용될 수 있기 때문이다.또한 특정 아미노산의 빈도에 대한 지식은 단백질의 소화를 위해 어떤 단백질 분해효소를 사용할지를 선택하기 위해 사용될 수 있다.또한 단백질에 대한 낮은 수준의 비표준 아미노산(예: 노르류신)의 잘못된 결합도 확인할 [1]수 있다.아미노산 빈도를 결정하기 위해 흔히 아미노산[2] 분석이라고 하는 일반화된 방법은 다음과 같다.

  1. 단백질의 알려진 양을 구성 아미노산으로 가수 분해한다.
  2. 어떤 방법으로든 아미노산을 분리하여 정량화한다.

가수 분해

가수분해는 6 M 염산 중의 단백질 시료를 100~110 °C로 24시간 이상 가열하여 실시한다.부피가 큰 소수성 그룹이 많은 단백질은 더 긴 가열 기간이 필요할 수 있습니다.그러나 이러한 조건은 매우 강력하여 일부 아미노산(세린, 트레오닌, 티로신, 트립토판, 글루타민시스테인)이 분해됩니다.이 문제를 피하기 위해 Physociatry Online은 별도의 샘플을 다른 시간 동안 가열하여 각 용액을 분석하고 가수 분해 시간을 0으로 추정할 것을 제안합니다.Rastall은 염소의 공격으로부터 트립토판과 티로신을 보호하기 위한 티올 시약이나 페놀, 사전 산화 시스테인 등 열화를 방지하거나 줄이기 위한 다양한 시약을 제안한다.그는 또한 아미드 가수분해 정도를 결정하기 위해 진화된 암모니아 을 측정할 것을 제안한다.

분리 및 정량

아미노산은 이온 교환 크로마토그래피에 의해 분리되고 검출을 용이하게 하기 위해 유도될 수 있다.보다 일반적으로 아미노산은 유도체화되어 역상 HPLC에 의해 분해된다.

NTRC는 술폰화 폴리스티렌을 매트릭스로 하여 아미노산을 산성용액에 첨가하고 pH가 꾸준히 증가하는 완충제를 컬럼에 통과시켜 이온교환 크로마토그래피의 예를 제공한다.아미노산은 pH가 각각의 등전점에 도달하면 용출된다.아미노산이 분리되면 각각의 양은 착색 유도체를 형성하는 시약을 첨가하여 결정된다.아미노산 양이 10nmol을 초과하면 닌히드린을 사용할 수 있으며, 프롤린과 반응하면 노란색을 띠며, 다른 아미노산과 함께 선명한 보라색을 띠게 된다.아미노산 농도는 결과 용액의 흡광도에 비례합니다.형광 유도체는 10pmol까지 매우 적은 양으로 Ortho-Phaldehyde(OPA) 또는 플루오레스카민과 같은 시약을 사용하여 형성될 수 있습니다.

컬럼 전 유도체는 Edman 시약을 사용하여 자외선에 의해 검출되는 유도체를 생성할 수 있습니다.형광 유도체를 생성하는 시약을 사용하면 감도가 높아집니다.유도체화된 아미노산은 일반적으로 C8 또는 C18 실리카 컬럼과 최적화된 용출 구배를 사용하여 역상 크로마토그래피를 받는다.용출아미노산은 시료의 각 아미노산을 정량화하기 위해 UV 또는 형광 검출기와 유도체 표준과 비교하여 피크 면적을 검출한다.

N말단아미노산분석

생어의 펩타이드 엔드 그룹 분석 방법:디니트로페닐펩타이드의 생거시약(DNFB), B 전산가수분해로 N 말단 유도체화

어떤 아미노산이 펩타이드 사슬의 N말단을 형성하는지 결정하는 것은 두 가지 이유로 유용하다. 즉, 개별 펩타이드 조각의 배열이 전체 사슬에 정렬되는 것을 돕는 것과 에드만 분해의 첫 번째 라운드는 종종 불순물에 의해 오염되기 때문에 N말단 아미노산의 정확한 결정을 제공하지 않기 때문이다.N 말단 아미노산 분석을 위한 일반화된 방법은 다음과 같습니다.

  1. 펩타이드를 시약으로 반응시켜 아미노산 말단을 선택적으로 표시시킨다.
  2. 단백질을 가수분해한다.
  3. 아미노산은 크로마토그래피로 측정하여 표준과 비교한다.

말단 아미노산에 라벨을 붙이는 데 사용할 수 있는 다양한 시약이 있습니다.그들은 모두 아민기와 반응하며, 따라서 리신과 같은 아미노산의 곁사슬에 있는 아민기와 결합할 것입니다 - 이러한 이유로 적절한 지점을 선택하기 위해 크로마토그램을 해석하는 데 있어 신중할 필요가 있습니다.보다 일반적인 시약 중 두 가지는 Sanger's 시약(1-플루오로-2,4-디니트로벤젠)과 염화 단실 유도체이다.Edman 분해 시약인 페닐이소티오시아네이트도 사용할 수 있다.여기에서 아미노산 조성의 결정과 동일한 질문이 적용된다. 단, 염색은 필요하지 않다. 시약이 착색된 유도체를 생성하며 정성적 분석만 필요하다.그래서 아미노산은 크로마토그래피 컬럼에서 추출될 필요가 없습니다. 표준과 비교해서 말이죠.고려해야 할 또 다른 고려사항은 아민기가 라벨링 시약과 반응하기 때문에 이온교환 크로마토그래피를 사용할 수 없으며 대신 박층 크로마토그래피 또는 고압 액체 크로마토그래피를 사용해야 한다는 것이다.

C말단아미노산분석

C 말단 아미노산 분석에 사용할 수 있는 방법의 수는 N 말단 분석의 사용 가능한 방법의 수보다 훨씬 적다.가장 일반적인 방법은 단백질 용액에 카르복시펩티드가수분해효소를 첨가하여 일정한 간격으로 시료를 채취하여 시간 대비 아미노산 농도의 플롯을 분석하여 말단 아미노산을 결정하는 것이다.이 방법은 폴리펩타이드 및 단백질 차단 N 말미니의 경우에 매우 유용할 것이다.C 말단 배열은 DNA 배열에서 예측된 단백질의 1차 구조를 검증하고 알려진 코돈 배열에서 유전자 생성물의 번역 후 처리를 검출하는 데 크게 도움이 될 것이다.

에드먼 열화

에드만 분해는 단백질의 질서 있는 아미노산 조성을 발견할 수 있게 해주기 때문에 단백질 배열에 있어 매우 중요한 반응이다.자동화된 에드만 시퀀서는 현재 널리 사용되고 있으며 약 50개의 아미노산 길이까지 펩타이드를 배열할 수 있습니다.에드만 분해에 의해 단백질을 배열하기 위한 반응 스킴이 뒤따르고, 그 후 몇 가지 단계를 상세하게 설명한다.

  1. 2-메르캅토에탄올같은 환원제로 단백질 중 디술피드 브릿지를 파괴한다.결합의 재형성을 방지하기 위해 요오드아세트산 등의 보호기가 필요할 수 있다.
  2. 단백질 복합체의 개별 사슬이 하나 이상 있을 경우 분리하여 정제한다.
  3. 각 사슬의 아미노산 조성을 결정한다.
  4. 각 사슬의 말단 아미노산을 결정한다.
  5. 각각의 사슬을 50개 이하의 아미노산 조각으로 자르세요.
  6. 파편을 분리하여 정화한다.
  7. 각 fragment의 순서를 확인합니다.
  8. 다른 절단 패턴으로 반복합니다.
  9. 전체 단백질의 배열을 구성합니다.

펩타이드 조각으로 소화

길이가 약 50~70인 아미노산보다 긴 펩타이드는 에드만 분해에 의해 안정적으로 배열될 수 없다.이것 때문에, 긴 단백질 사슬은 개별적으로 배열될 수 있는 작은 조각들로 분해될 필요가 있다.소화는 트립신이나 펩신 등의 엔도펩티드가수분해효소 또는 브롬화시안 등의 화학시약으로 이루어진다.서로 다른 효소는 서로 다른 분열 패턴을 제공하며, 조각들 사이의 중첩은 전체 염기서열을 구성하기 위해 사용될 수 있다.

반응

배열되는 펩타이드를 고체 표면에 흡착한다.하나의 일반적인 기질은 양이온성 폴리머인 폴리브렌으로 코팅된 유리 섬유입니다.에드만 시약인 페닐이소티오시아네이트(PITC)는 트리메틸아민 12%의 약간 염기성 완충액과 함께 흡착된 펩타이드에 첨가된다.이것은 N 말단 아미노산의 아민기와 반응한다.

말단 아미노산은 무수산을 첨가하여 선택적으로 분리할 수 있다.그 후 유도체는 이성질체를 형성하여 치환된 페닐티오히단토인을 생성하며, 이는 크로마토그래피로 씻어내고 식별할 수 있으며, 반복할 수 있다.각 단계의 효율은 약 98%로, 약 50개의 아미노산을 확실하게 측정할 수 있습니다.

Beckman-Coulter Porton LF3000G 단백질 배열 분석기

단백질 시퀀서

단백질 세컨레이터는 에드만 분해를 자동화하는 기계입니다.단백질 또는 펩타이드의 시료를 단백질 세컨레이터의 반응용기 내에 고정화하고 에드만 분해한다.각 회로는 단백질 또는 펩타이드의 N말단에서 하나의 아미노산을 방출 및 유도하고, 다음으로 방출된 아미노산 유도체를 HPLC로 동정한다.시퀀스 프로세스는 전체 측정 가능한 시퀀스가 확립될 때까지 또는 사전 결정된 사이클 수 동안 폴리펩타이드 전체에 대해 반복적으로 수행됩니다.

질량분석에 의한 식별

단백질 식별은 아미노산 배열에 기초하여 관심 단백질(POI)에 이름을 부여하는 과정이다.전형적으로, 단백질 배열의 일부만 그들의 유전자의 DNA 배열로부터 추론된 단백질 배열의 데이터베이스와 관련하여 단백질을 식별하기 위해 실험적으로 결정될 필요가 있다.추가적인 단백질 특성화에는 POI의 실제 N 말단 및 C 말단 확인, 배열 변이 결정 및 존재하는 번역 후 변이 식별이 포함될 수 있다.

단백질 분해 소화

단백질 식별을 위한 일반적인 방법이 설명된다.[4][5]

  1. POI는 일반적으로 SDS-PAGE 또는 크로마토그래피에 의해 격리됩니다.
  2. 격리된 POI는 시스테인 잔류물을 안정화시키기 위해 화학적으로 수정될 수 있다(예: S-아미도메틸화 또는 S-카르복시메틸화).
  3. POI는 특정 단백질 분해 효소와 함께 소화되어 펩타이드를 생성한다.리신 또는 아르기닌 잔기의 C 말단 측에서 선택적으로 분해되는 트립신은 가장 일반적으로 사용되는 단백질 분해효소이다.그 장점은 i) 단백질의 Lys 및 Arg 잔기의 빈도, ii) 효소의 높은 특이성, iii) 효소의 안정성, iv) 질량분석에 대한 트립틱 펩타이드의 적합성을 포함한다.
  4. 펩타이드를 탈염하여 이온화 오염물질을 제거하고 MALDI-TOF 질량분석법을 적용할 수 있다.펩타이드 질량의 직접 측정은 단백질을 식별하기에 충분한 정보를 제공할 수 있지만(펩타이드 질량 지문 채취 참조), 질량 분석계 내부의 펩타이드 추가 조각화는 종종 펩타이드 배열에 대한 정보를 얻기 위해 사용된다.또는 역상 HPLC에 의해 펩타이드를 탈염 및 분리하여 ESI원을 통해 질량분석계에 도입할 수 있다.LC-ESI-MS는 단백질 식별을 위해 MALDI-MS보다 더 많은 정보를 제공할 수 있지만 더 많은 계측기 시간을 사용합니다.
  5. 질량분석계의 종류에 따라 충돌 유도 해리(CID) 또는 사후원 붕괴(PSD)와 같은 다양한 메커니즘을 통해 펩타이드 이온의 조각화가 발생할 수 있습니다.각각의 경우, 펩타이드의 단편 이온 패턴은 그 배열에 관한 정보를 제공한다.
  6. 다음으로 추정펩타이드 이온과 그 단편 이온의 측정 질량을 포함한 정보를 개념적(실리코 내) 단백질 분해 및 단백질 배열 데이터베이스의 단편화로부터 계산된 질량 값과 일치시킨다.분석 파라미터에 따라 점수가 임계값을 초과하면 성공적인 일치가 발견됩니다.실제 단백질이 데이터베이스에 나타나지 않더라도 오류 허용 매칭은 상동 단백질과의 유사성에 기초한 단백질 추정 식별을 가능하게 한다.이 분석을 수행하기 위해 다양한 소프트웨어 패키지를 사용할 수 있습니다.
  7. 소프트웨어 패키지는 일반적으로 식별된 각 단백질의 식별(접속 코드)과 일치 점수를 보여주는 보고서를 생성하고, 여러 단백질이 식별되는 일치의 상대적 강도의 측정을 제공한다.
  8. 식별된 단백질의 배열에 대한 일치된 펩타이드 도표는 배열 커버리지(펩타이드로서 검출된 단백질의 %)를 나타내기 위해 종종 사용된다.POI가 일치하는 단백질보다 상당히 작다고 생각되는 경우, 다이어그램은 POI가 식별된 단백질의 N-말단 단편인지 또는 C-말단 단편인지를 제시할 수 있다.

De novo 시퀀싱

펩타이드의 단편화 패턴은 de novo sequencing의한 배열의 직접적인 결정을 가능하게 한다.이 배열은 단백질 배열 데이터베이스를 일치시키거나 번역 또는 화학적 변형을 조사하기 위해 사용될 수 있다.위와 같이 수행된 단백질 식별에 대한 추가 증거를 제공할 수 있습니다.

N 종단 및 C 종단

단백질 식별 시 매칭된 펩타이드는 매칭된 단백질에 대해 예측된 N-termini 또는 C-termini를 반드시 포함하는 것은 아니다.이는 N 말단 또는 C 말단 펩타이드가 MS에 의해 식별하기 어렵거나(예: 너무 짧거나 너무 길거나), 번역 후 변형되거나(예: N 말단 아세틸화) 예측과 진정으로 다르기 때문에 발생할 수 있다.번역 후 수정 또는 잘린 종단어는 데이터의 면밀한 조사(즉, de novo sequencing)로 식별할 수 있다.특이성이 다른 단백질 분해효소를 사용한 반복 소화도 유용할 수 있다.

번역 후 수정

MS 데이터와 알려진 단백질 배열에 기초한 예측의 상세한 비교는 번역 후 수정을 정의하는 데 사용될 수 있지만, 데이터 수집에 대한 표적 접근법을 사용할 수도 있다.예를 들어, 포스포펩타이드의 특이적 농축은 단백질에서 인산화 부위를 식별하는 데 도움을 줄 수 있다.ETD 또는 ECD와 같은 질량분석계에서의 펩타이드 조각화 대체 방법은 상호 보완적인 배열 정보를 제공할 수 있다.

전체 질량 결정

단백질의 전체 질량은 아미노산 잔류물의 질량과 물 분자의 질량의 합이며 번역 후 수정에 맞게 조정됩니다.단백질은 이들로부터 유래한 펩타이드보다 이온화가 잘 되지 않지만 용액 중의 단백질은 ESI-MS를 받을 수 있으며 질량은 20,000분의 1 이상의 정확도로 측정될 수 있다.이것은 종종 흰개미(따라서 단백질의 측정된 질량이 염기서열에서 예측한 것과 일치한다는 의미)를 확인하고 많은 번역 후 수정의 유무를 추론하기에 충분하다.

제한 사항

단백질 분해가 항상 POI의 전체 시퀀스를 포괄하는 쉽게 분석 가능한 펩타이드 세트를 생성하는 것은 아니다.질량분석계의 펩타이드 조각은 각 펩타이드 결합에서 분할에 해당하는 이온을 생성하지 않는 경우가 많다.따라서 각 펩타이드에 대한 추론 배열이 반드시 완전한 것은 아니다.표준 단편화 방법은 류신 잔기와 이소류신 잔기가 이성질체이기 때문에 구분하지 않는다.

Edman 분해는 단백질의 N 말단에서 진행되기 때문에 N 말단이 화학적으로 변형된 경우(예: 아세틸화 또는 파이로글루탐산 생성에 의해) 작동하지 않습니다.Edman 분해는 일반적으로 이황화물 교량의 위치를 결정하는 데 유용하지 않다.또한 눈에 띄는 결과를 얻으려면 1피코몰 이상의 펩타이드 양이 필요하므로 질량분석법보다 덜 민감하다.

DNA/RNA 염기서열에서

생물학에서 단백질은 mRNA의 코돈 배열에서 파생된 단백질 배열과 메신저 RNA(mRNA)의 번역에 의해 생산된다.mRNA 자체는 유전자의 전사에 의해 형성되며 추가로 변형될 수 있다.이러한 과정은 컴퓨터 알고리즘을 사용하여 전체 유전자 DNA 염기서열 프로젝트와 같은 DNA 염기서열의 단백질 염기서열 예측을 자동화할 수 있을 정도로 충분히 이해되고 있으며, UniProt와 같은 단백질 염기서열의 대규모 데이터베이스를 생성하게 되었다.예측된 단백질 배열은 질량분석에 의한 단백질 식별에 중요한 자원이다.

역사적으로 에드만 분해에 의해 결정된 짧은 단백질 배열(10~15잔기)은 해당 유전자 또는 상보적 DNA의 분자 클론을 분리하기 위한 프로브 또는 프라이머로 사용될 수 있는 DNA 배열로 역번역되었다.복제된 DNA의 배열이 결정되었고 단백질의 완전한 아미노산 배열을 추론하는데 사용되었다.

바이오 인포매틱스 도구

생체정보학 도구는 질량 스펙트럼 해석(De novo 펩타이드 배열 참조), 단백질 배열 비교 또는 분석(배열 분석 참조), 펩타이드 또는 단백질 배열(BLAST 참조)을 위한 데이터베이스 검색(BLOAST 참조)을 지원하기 위해 존재한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Bogosian G, Violand BN, Dorward-King EJ, Workman WE, Jung PE, Kane JF (January 1989). "Biosynthesis and incorporation into protein of norleucine by Escherichia coli". The Journal of Biological Chemistry. 264 (1): 531–9. PMID 2642478.
  2. ^ Michail A. Alterman; Peter Hunziker (2 December 2011). Amino Acid Analysis: Methods and Protocols. Humana Press. ISBN 978-1-61779-444-5.
  3. ^ Edman P, Begg G (March 1967). "A protein sequenator". European Journal of Biochemistry. 1 (1): 80–91. doi:10.1111/j.1432-1033.1967.tb00047.x. PMID 6059350.
  4. ^ Shevchenko A, Tomas H, Havlis J, Olsen JV, Mann M (2006). "In-gel digestion for mass spectrometric characterization of proteins and proteomes". Nature Protocols. 1 (6): 2856–60. doi:10.1038/nprot.2006.468. PMID 17406544.
  5. ^ Gundry RL, White MY, Murray CI, Kane LA, Fu Q, Stanley BA, Van Eyk JE (October 2009). "Preparation of proteins and peptides for mass spectrometry analysis in a bottom-up proteomics workflow". Current Protocols in Molecular Biology. Chapter 10: Unit10.25. doi:10.1002/0471142727.mb1025s88. PMC 2905857. PMID 19816929.

추가 정보

  • Steen H, Mann M (September 2004). "The ABC's (and XYZ's) of peptide sequencing". Nature Reviews Molecular Cell Biology. 5 (9): 699–711. doi:10.1038/nrm1468. PMID 15340378.