알파폴드
AlphaFold시리즈의 일부 |
인공지능 |
---|
알파폴드는 알파벳/구글 딥마인드가 개발한 인공지능(AI) 프로그램으로 단백질 [1]구조 예측을 수행한다.이 프로그램은 딥 러닝 [2]시스템으로 설계되었습니다.
알파폴드 AI 소프트웨어는 크게 두 가지 버전이 있다.알파폴드 1(2018)을 사용한 연구팀은 2018년 12월 제13회 단백질구조예측기술중요도평가(CASP) 종합순위 1위를 차지했다.이 프로그램은 특히 경기 주최자에 의해 가장 어려운 것으로 평가된 표적에 대한 가장 정확한 구조를 예측하는 데 성공했으며, 여기에는 부분적으로 유사한 염기서열을 가진 단백질에서 기존의 템플릿 구조가 없었다.
AlphaFold 2(2020)를 사용한 [3]팀은 2020년 11월 CASP 대회에 다시 배치되었습니다.그 팀은 다른 어떤 [2][4]그룹보다 훨씬 높은 정확도를 달성했다.CASP의 GDT([2][5]Global Distance Test)에서 약 3분의 2의 단백질에 대해 90을 웃돌았다.GDT는 컴퓨터 프로그램 예측 구조가 실험실에서 결정된 구조와 유사한 정도를 측정하는 테스트로 GDT 계산에 사용된 거리 컷오프 내에서 100이 완전히 일치한다.
CASP에서 AlphaFold 2의 결과는 "놀랍고"[6][7] 변혁적인 것으로 묘사되었다.일부 연구자들은 정확도가 예측치의 3분의 1을 차지할 만큼 높지 않으며 단백질 접힘 문제가 [8][9]해결된 것으로 간주되는 단백질 접힘의 메커니즘이나 규칙을 밝히지 않는다고 지적했다.그럼에도 불구하고, 기술적 성과에 대한 광범위한 존경이 있었다.
2021년 7월 15일 알파폴드 2 논문은 오픈 소스 소프트웨어 및 검색 가능한 종 [10][11][12]프로테옴 데이터베이스와 함께 사전 접근 출판물로 네이처에 발행되었다.
단백질 접힘 문제

단백질은 단백질 접힘이라고 불리는 과정에서 단백질의 3차원 구조를 형성하기 위해 자발적으로 접히는 아미노산의 사슬들로 구성됩니다.3-D 구조는 단백질의 생물학적 기능에 매우 중요하다.그러나 아미노산 배열이 어떻게 3-D 구조를 결정하는지 이해하는 것은 매우 어려우며, 이를 "단백질 접힘 문제"[13]라고 한다."단백질 접힘 문제"는 접힌 안정된 구조를 결정하는 원자간 힘의 열역학, 단백질이 극단적인 속도로 최종 접힌 상태에 도달할 수 있는 메커니즘과 경로, 그리고 단백질의 고유 구조가 아미노산 [14]배열로부터 어떻게 예측될 수 있는지를 이해하는 것을 포함한다.
단백질 구조는 현재 X선 결정학, 극저온 전자 현미경 및 핵자기 공명과 같은 기술을 통해 실험적으로 결정되며, 이는 비용과 시간이 많이 [13]소요된다.이러한 노력은 지난 60년 동안 약 17만 개의 단백질의 구조를 확인했고, 모든 [5]생명체에 걸쳐 2억 개 이상의 알려진 단백질이 있다.아미노산 배열만으로 단백질 구조를 예측할 수 있다면 과학 연구를 진전시키는 데 큰 도움이 될 것이다.하지만, 레빈탈의 역설은 단백질이 밀리초 안에 접힐 수 있지만, 진정한 자연 구조를 결정하기 위해 가능한 모든 구조를 무작위로 계산하는 데 걸리는 시간이 알려진 우주의 나이보다 길다는 것을 보여주는데, 이것은 단백질 구조를 예측하는 것을 [13]과학자들에게 큰 도전으로 만들었다.
수년간 연구자들은 단백질 구조 예측 문제를 해결하기 위해 수많은 계산 방법을 적용했지만, 그 정확도는 작은 단순 단백질 외에는 실험 기술에 가깝지 않아 그 가치를 제한했다.1994년 최고의 단백질 구조 예측을 내놓기 위해 과학계에 도전하기 위해 시작된 CASP는 [5]2016년까지 가장 어려운 단백질에 대해 100점 만점에 40점 정도만 GDT 점수를 달성할 수 있다는 것을 발견했다.알파폴드는 인공지능(AI) 딥러닝 [13]기술을 사용하여 2018 CASP에서 경쟁을 시작했다.
알고리즘.
DeepMind는 단백질 배열과 구조의 공공 저장소에서 17만 개 이상의 단백질에 대해 이 프로그램을 훈련시킨 것으로 알려져 있다.이 프로그램은 AI 알고리즘이 더 큰 문제의 일부를 식별하도록 하는 데 초점을 맞춘 딥 러닝 기술인 주의 네트워크의 형태를 사용하며, 이를 종합하여 전체적인 해결책을 [2]얻습니다.전체적인 훈련은 GPU 100~200대의 [2]처리능력에 대해 실시되었습니다.이 하드웨어에 대한 시스템 훈련에는 "몇 주"가 걸렸고, 그 후 프로그램은 각 [15]구조에 대해 수렴하는 데 "몇 일 정도"가 걸렸습니다.
AlphaFold 1, 2018년
AlphaFold 1(2018)은 2010년대 다양한 팀이 개발한 작업을 기반으로 구축되었으며, 현재 많은 다른 유기체(대부분 알려지지 않은 3D 구조)에서 사용할 수 있는 관련 DNA 배열의 대규모 데이터 뱅크를 조사하여 잔류물이 t에서 연속되지 않았음에도 상관된 것으로 보이는 다른 잔류물에서 변화를 찾으려고 시도했다.메인 체인.이러한 상관관계는 잔류물이 시퀀스에서 가깝지 않더라도 물리적으로 서로 가까울 수 있다는 것을 나타내므로 접촉 맵을 추정할 수 있다.2018년 이전의 최근 연구를 바탕으로 AlphaFold 1은 이를 확장하여 잔류물이 얼마나 근접할 수 있는지에 대한 확률 분포를 추정함으로써 접촉 지도를 가능한 거리 지도로 만들었다.또한 추론을 개발하기 위해 이전보다 더 진보된 학습 방법을 사용했다.이 확률 분포에 기초한 통계적 잠재력을 구성의 계산된 국소 자유 에너지와 결합하면, 팀은 [clarification needed][16][17]두 가지 모두에 가장 적합한 솔루션에 대한 경사 강하를 사용할 수 있었다.
보다 기술적으로, 토리시 등은 2019년에 알파폴드 버전 1의 접근 방식을 다음과 [18]같이 요약했다.
알파폴드의 중심은 2개의 64개의 아미노산 조각에서 계산된 입력 특징에 해당하는 차원 64×64×128의 표현을 처리하는 220개의 잔류 블록으로 구성된 매우 깊은 잔류 신경 네트워크로 구현된 거리 지도 예측기입니다.각 잔차 블록에는 3×3 확장 컨볼루션 층을 포함한 3개의 레이어가 있습니다. 즉, 블록은 1, 2, 4, 8 값의 확장을 순환합니다.모델에는 총 2,100만개의 파라미터가 있습니다.네트워크는 다른 소스로부터의 진화 프로파일과 공진화 기능을 포함한 1D 입력과 2D 입력의 조합을 사용합니다.AlphaFold는 거리의 매우 세밀한 히스토그램 형태의 거리 지도와 함께 초기 예측 3D 구조를 만드는 데 사용되는 각 잔류물의 δ 및 δ 각도를 예측합니다.AlphaFold의 저자들은 모델의 깊이, 크롭의 크기, 약 29,000개의 단백질로 구성된 대규모 훈련 세트, 현대의 딥 러닝 기법, 그리고 거리의 예측 히스토그램에서 얻은 풍부한 정보가 AlphaFold가 높은 접촉 지도 예측 정밀도를 달성하는 데 도움이 되었다고 결론지었다.
AlphaFold 2, 2020년

DeepMind [19][20]팀에 따르면, 프로그램의 2020년 버전(AlphaFold 2, 2020)은 2018년 CASP 13 수상작과 크게 다르다.
DeepMind 팀은 국소 물리학과 패턴 인식에서 도출된 가이드 전위를 결합한 이전 접근법이 체인을 따라 더 멀리 떨어진 잔류물 간의 상호작용에 비해 시퀀스에 가까운 잔류물 간의 상호작용을 과도하게 고려하는 경향이 있음을 확인했다.그 결과, 알파폴드 1은 실제보다 약간 더 2차 구조(알파 나선형 및 베타 시트)를 가진 모델을 선호하는 경향을 보였다.[21]
AlphaFold 1에 사용된 소프트웨어 설계에는 다수의 모듈이 포함되어 있으며, 각 모듈은 개별적으로 훈련되어 물리 기반 에너지 전위와 결합된 가이드 전위를 생성하기 위해 사용되었습니다.AlphaFold 2는 이를 단일 통합 [20][22]구조로 통합된 방식으로 교육된 패턴 인식에 기반하여 서로 다른 단일 엔드 투 엔드 모델로 결합된 하위 네트워크 시스템으로 대체했습니다.국소물리학은 황색 모델에 기초한 에너지 정제 형태로 뉴럴 네트워크 예측이 수렴된 후에 최종 정제 단계로만 적용되며 예측 구조를 [21]약간만 조정한다.
2020년 시스템의 핵심 부분은 변압기 설계에 기초한 것으로 여겨지는 두 개의 모듈로, 단백질의 아미노산 잔기와 다른 아미노산 잔기 사이의 각 관계(또는 그래프 이론 용어의 "엣지")에 대한 정보의 벡터를 점진적으로 미세화하는 데 사용된다(이러한 관계는 표시된 배열로 표시됨).각 아미노산 위치와 입력 배열의 서로 다른 배열 사이(이러한 관계는 [22]빨간색으로 표시된 배열로 표시됨).내부적으로 이러한 미세화 변환은 관련 데이터를 한데 모으고 교육 데이터에서 학습한 컨텍스트 의존적인 방식으로 이러한 관계에 대한 관련 없는 데이터('주의 메커니즘')를 걸러내는 효과가 있는 계층을 포함한다.이러한 변환이 반복되고, 한 단계씩 업데이트된 정보 출력이 다음 단계의 입력이 되며, 날카로운 잔류/잔류 정보가 잔류/순서 정보의 업데이트로 공급되고, 개선된 잔류/순서 정보가 잔류/[22]잔류 정보의 업데이트로 공급됩니다.한 보고서에 따르면 반복이 진행됨에 따라 "주의 알고리즘은 사람이 직소퍼즐을 조립하는 방법을 모방한다: 처음에는 작은 덩어리(이 경우 아미노산 덩어리)에서 조각들을 연결한 다음 더 [5]큰 덩어리 전체에서 결합하는 방법을 찾는다."
이러한 반복의 출력은 최종 구조 예측 [22]모듈에 통지합니다.이 모듈도 [23]변압기를 사용하고, 그 후 그 자체가 반복됩니다.DeepMind가 제시한 예에서, 구조 예측 모듈은 첫 번째 반복에서 표적 단백질에 대한 올바른 위상을 달성했으며, GDT_TS는 78이지만 입체 화학적 위반(90%)이 다량(즉, 비물리적 결합 각도 또는 길이)이었다.그 후의 반복으로 입체화학적 위반의 수가 감소했다.세 번째 반복에서는 예측의 GDT_TS가 90에 가까워졌고, 여덟 번째 반복에서는 입체화학적 위반의 수가 [24]0에 가까워졌다.
알파폴드 팀은 2020년 11월 알파폴드가 더 발전하고 정확도가 [19]더 향상될 수 있을 것으로 믿는다고 밝혔다.
훈련 데이터는 원래 단일 펩타이드 트레인으로 제한되었다.그러나 2021년 10월 AlphaFold-Multimer라는 이름의 업데이트는 단백질 복합체를 훈련 데이터에 포함시켰다.DeepMind는 이 업데이트가 단백질-단백질 [25]상호작용을 정확하게 예측하는 데 약 70% 성공했다고 밝혔다.
경합

진홍색 트렌드라인은 AlphaFold 1을 포함한 소수의 모델이 2018년 이전에 달성한 진보 속도에 비해 어떻게 중요한 변화를 달성했는지, 특히 예측이 가장 어려운 단백질 배열과 관련하여 보여줍니다.
(이전에는 질적 개선이 이루어졌지만, CASP GDS-TS 측정치에 영향을 주기 시작하는 것은 변경으로 인해 실험 위치의 8Ω 이내에 구조가 포함되기 때문입니다.)
주황색 추세선은 2020년까지 온라인 예측 서버가 이 성능을 학습하고 이에 필적할 수 있는 반면, 다른 최고의 그룹(녹색 곡선)은 평균적으로 이 성능을 개선할 수 있음을 보여줍니다.그러나 검정색 추세 곡선은 알파폴드2가 2020년에 이를 다시 뛰어넘은 정도를 전반적으로 보여준다.
데이터 점의 상세한 산포는 AlphaFold가 달성한 일관성 또는 변동의 정도를 나타냅니다.특이치는 이처럼 성공적인 예측을 하지 못한 소수의 시퀀스를 나타냅니다.
CASP13
2018년 12월, DeepMind의 AlphaFold는 제13회 단백질 구조 예측 기술 비판 평가(CASP)[26][27] 종합 순위에서 1위를 차지했습니다.
프로그램은 특히 경기 주최자에 의해 가장 어려운 것으로 평가된 표적에 대한 가장 정확한 구조를 성공적으로 예측하고 있었으며, 여기에는 부분적으로 유사한 시퀀스를 가진 단백질로부터 기존의 템플릿 구조가 없었다.AlphaFold는 CASP의 글로벌 디스턴스 테스트(GDT) 점수에서 58.9의 중간 점수를 얻어 이 [27][28][29]클래스의 43개 단백질 목표물 중 25개를 가장 잘 예측했으며, 이는 딥 러닝을 사용하여 [31][32]접촉 거리를 추정했던 두 [30]팀의 52.5와 52.4를 앞섰다.전체적으로, 모든 목표물에 걸쳐, 프로그램은 68.5의 [33]GDT 점수를 달성했습니다.
2020년 1월, 알파폴드 1의 구현과 설명 코드는 GitHub에 [34][13]오픈 소스로 공개되었지만, 그 웹사이트의 "Read Me" 파일에 언급된 바와 같이: "이 코드는 임의의 단백질 배열의 구조를 예측하는 데 사용될 수 없습니다.CASP13 데이터 세트 상에서만 구조를 예측하기 위해 사용할 수 있습니다(아래 링크).기능 생성 코드는 내부 인프라스트럭처 및 외부 툴과 밀접하게 관련되어 있기 때문에 오픈 소스는 할 수 없습니다."따라서 기본적으로 퇴적된 코드는 일반적인 용도로는 적합하지 않고 CASP13 단백질에만 적합하다.이 회사는 2021년 3월 5일 현재 코드를 공개할 계획을 발표하지 않았다.
CASP14
2020년 11월에는 DeepMind의 새로운 버전인 알파폴드2가 CASP14를 [15][35]수상했다.전체적으로 알파폴드2는 97개 대상 [6]중 88개를 가장 잘 예측했다.
정확도의 경쟁이 선호하는 세계적인 거리 시험(GDT)측정에서, 프로그램, 그것의 예측 이상의 절반보다 92.4%로more-or-less에 알맞은 place,[36][37]그들의 원자가 정확도를 수준 실험 techniq과 견줄 만 하도록 보고 되고를 위해 점수가 생긴다는 92.4(100점 만점)의 평균 성과를 얻었다.ues처럼엑스레이 [19][7][33]결정학2018년 알파폴드 1은 두 가지 [6]예측에서 이 정도 정확도에 도달했을 뿐이다.2020년 대회의 예측 중 88%는 GDT_TS 점수가 80점 이상이었다.가장 난이도로 분류된 목표 그룹에서 알파폴드 2는 중간 점수 87점을 달성했습니다.
최악의 적합 특이치의 성능에 의해 지배되는 경향이 있는 단백질 골격 사슬의 알파 탄소 원자의 배치의 RMS-D(root-mean-square deviation)로 측정한 결과, 알파폴드 2의 예측 중 88%는 중복된 [6]C-alpha 원자 세트에 대해 4Ω 미만의 RMS 편차를 보였다.76%의 예측이 3Ω보다 우수했고 46%는 2Ω보다 우수한 C-alpha 원자 RMS 정확도를 달성했으며, 중복되는 CA [6]원자 세트에 대한 예측의 중앙값 편차는 2.1Ω이었다.[6]알파폴드 2는 또한 표면 사이드 체인을 모델링하는 데 있어 "정말 정말 놀라운" 정확도를 달성했습니다.
추가적으로 AlphaFold-2를 검증하기 위해 회의 주최자는 특히 어렵다고 판단하고 결정할 수 없었던 구조에 대해 4개의 주요 실험 그룹에 접근했다.4가지 경우 모두 AlphaFold 2에 의해 생성된 3차원 모델은 분자 치환에 의해 이러한 단백질의 구조를 결정하기에 충분히 정확했다.여기에는 10년 동안 [5]실험자들에 의해 연구된 작은 막 단백질인 표적 T1100(Af1503)이 포함되었다.
알파폴드2가 예측에 가장 적게 성공한 3개의 구조 중 2개는 수용액에서 직접 단백질 구조를 정의하는 단백질 NMR 방법으로 얻어진 반면 알파폴드는 대부분 결정의 단백질 구조에 대해 훈련되었다.세 번째는 본질적으로 동일한 도메인의 52개의 동일한 복사본으로 구성된 다중 도메인 복합체로 존재하며, AlphaFold가 고려하도록 프로그래밍되지 않은 상황입니다.하나의 매우 큰 단백질과 NMR에 의해 결정된 두 구조를 제외한 단일 도메인을 가진 모든 표적에 대해 알파폴드 2는 80 이상의 GDT_TS 점수를 달성했다.
응답
AlphaFold 2는 CASP의 Global Distance Test(GDT; 글로벌 거리 테스트)에서 90점 이상을 획득하여 컴퓨터[5] 생물학에서 중요한 성과로 간주되며 수십 년 동안 지속되어 [7]온 생물학에 대한 큰 도전으로 발전한 것으로 평가되고 있습니다.노벨상 수상자이자 구조생물학자인 벤키 라마크리슈난은 이 결과를 "단백질 접힘 문제에 대한 놀라운 진전"[5]이라면서 "이 같은 현상은 이 분야의 많은 사람들이 예측하기 전에 수십 년 전에 일어났다"고 덧붙였다.생물학 [15]연구를 근본적으로 바꿀 수 있는 여러 가지 방법을 보는 것은 흥미로울 것입니다."
CASP와 DeepMind의 [38][15]보도자료에 의해 추진된 알파폴드2의 성공은 언론의 광범위한 [39]관심을 받았다.뿐만 아니라 전문가 과학 언론에 Nature,[7]Science,[5]테크놀로지 Review,[2]과 뉴 Scientist,[40][41]과 같은 뉴스, 이야기가 널리 중요한 국가적인 newspapers,[42][43][44][45]뿐만 아니라 일반 news-services과 Fortune,[46][20]더 Economist,[19]Bloomberg,[33]공작 Spiegel,[47]a 같은 주간 관련 간행물로 덮여 있었어스펙 테이터는.[48]런던 타임즈는 이 기사를 1면 사진 1면에 실렸으며, 두 페이지의 내부 취재와 한 편의 [49][50]사설을 더 실었다.구성 아미노산 서열을 기반으로 단백질 구조를 정확하게 예측할 수 있는 능력이 생명과학 분야에서 진보된 약물 발견을 가속화하고 질병을 [7][51]더 잘 이해할 수 있도록 하는 등 다양한 이점을 가져올 것으로 기대된다는 것이 자주 제기되는 주제였다.MIT Technology Review는 이 사건에 대해 쓰면서 AI가 "50년 [2]된 생물학이라는 거대한 도전을 해결했다"고 언급했다.같은 기사는 이어 AI 알고리즘이 "단백질의 형태를 [2]원자 폭 이내로 예측할 수 있다"고 언급했다.
Der Spiegel에 의해 요약된 바와 같이, 이 커버리지에 대한 예약은 두 가지 주요 영역에 집중되어 있습니다. "아직 해야 할 일이 많습니다."와 "우리는 그들이 어떻게 하는지조차 모릅니다."[52]
프로젝트 리더인 John [53]Jumper가 CASP 회의 둘째 날(12월 1일)에 AlphaFold 2에 대해 30분간 프레젠테이션을 했지만, "매우 수준 높고 아이디어와 암시가 많으며,[54][unreliable source?] 거의 세부 사항이 결여되어 있다"는 평가를 받고 있습니다.CASP14에서 발표되는 다른 연구 그룹과 달리 DeepMind의 발표는 기록되지 않았으며 공개적으로 이용할 수 없다.DeepMind는 CASP 콘퍼런스의 의사록에[when?] 알파폴드2를 설명하는 과학논문을 게재할 예정이지만 발표 내용을 넘어설지는 미지수다.
연구자 알폰소 발렌시아는 엘 파이스에게 다음과 같이 말했습니다.이러한 진보가 우리에게 남긴 가장 중요한 것은 이 문제에 해결책이 있다는 것과 해결할 수 있다는 것을 아는 것입니다.우리는 결과만 알고 있다.구글은 이 소프트웨어를 제공하지 않습니다.[45]과학에 직접적으로 도움이 되지 않기 때문에 이것은 성취의 좌절스러운 부분입니다."그럼에도 불구하고, 구글과 DeepMind가 출시하는 만큼 다른 팀들이 유사한 AI 시스템을 개발하는 데 도움을 줄 수 있는데, 이는 "간접적인"[45] 이점이다.2019년 말에 DeepMind는 오픈 소스로서 알파폴드의 첫 번째 버전의 코드 대부분을 공개하였다. 그러나 훨씬 더 급진적인 알파폴드 2에 대한 작업이 잘 진행되었을 때만.또한 AlphaFold 2 구조 예측을 온라인 블랙박스 구독 서비스로 제공하는 방법도 있습니다.단일 시퀀스에 대한 컨버전스에는 대략 10,000달러 상당의 대규모 [55]컴퓨팅 시간이 필요할 것으로 추정되고 있습니다.그러나 이는 시스템의 내부 상태에 대한 연구자들의 접근, 알파폴드 2의 성공을 야기하는 요소를 보다 질적으로 알 수 있는 기회, 더 가볍고 효율적이면서도 여전히 그러한 결과를 얻을 수 있는 새로운 알고리즘의 가능성을 방해할 것이다.DeepMind에 의한 투명성 결여에 대한 두려움은 개방된 단백질 데이터 뱅크와 개방된 DNA 염기서열 저장소에 대한 50년간의 막대한 공공 투자와 대조되어 왔다.이것이 없었다면 알파폴드 2를 훈련하는 데이터는 [56][57][58]존재하지 않았을 것이다.
2021년 6월 18일, Demis Hassabis는 트위터에 다음과 같이 트윗했다.#AlphaFold의 흥미로운 진척에 대해 간략히 업데이트!오픈 소스 코드와 함께 알파폴드에 대한 폭넓은 무료 액세스를 과학계에 제공하는 모든 방법(현재 검토 중)을 철저히 연구해 왔습니다.더 빨리![59]
그러나 알파폴드 2에 의해 만들어진 구조 예측이 다른 단백질과 다른 [60]분자와의 복합체에 결합되는 단백질을 어느 정도까지 지탱할지는 아직 명확하지 않다.이는 AlphaFold가 참가했던 CASP 경쟁사의 일부가 아니며 내부적으로 예상한 우발적인 사건도 아닙니다.알파폴드2가 예측한 구조가 다른 복제품이나 다른 구조와 강한 상호작용을 하는 단백질인 경우, 알파폴드2의 예측은 덜 정제되고 덜 신뢰할 수 있는 경향이 있었다.세포에서 가장 중요한 생물학적 기계의 많은 부분이 그러한 복합체를 구성하거나 다른 분자와 접촉할 때 단백질 구조가 어떻게 변형되는지와 관련이 있기 때문에, 이것은 계속해서 상당한 실험적인 [60]관심의 초점이 될 영역이다.
알파폴드 2가 예측하기 위해 학습하는 내부 패턴에 대해 아직 거의 알려지지 않은 상황에서, 구조 [8][60]데이터베이스에서 알려진 기존 단백질 구조에서 이러한 접힘이 잘 표현되지 않는다면 프로그램이 새로운 접힘을 식별하는 능력이 어느 정도까지 손상될 수 있는지는 아직 명확하지 않다.또한 이러한 데이터베이스의 단백질 구조, 압도적으로 X선으로 결정될 수 있는 단백질의 정도가 아직 결정화되지 않은 전형적인 단백질의 대표인지는 잘 알려져 있지 않다.그리고 결정의 동결 단백질 구조가 생체 내 세포에서 발견되는 동적 구조를 어떻게 대표하는지 또한 불분명하다.단백질 NMR 방법으로 얻은 구조에 대한 알파폴드 2의 어려움은 좋은 신호가 아닐 수 있다.
약물 발견을 위한 도구로서의 그것의 가능성에 대해, Stephen Curry는 알파폴드 2의 구조의 분해능은 매우 좋을 수 있지만, 결합 부위가 모델링되는 정확성은 훨씬 더 높아야 한다고 지적한다: 전형적으로 분자 도킹 연구에서는 0.3Ω의 여유 내에서 원자 위치가 정확해야 하지만, 예측된 단백질 구조는모든 원자에 대해 RMSD는 기껏해야 0.9Ω이다.따라서 AlphaFold 2의 구조는 이러한 [8][60]상황에서 제한적인 도움이 될 수 있습니다.게다가, 사이언스 칼럼니스트 데릭 로에 따르면, 소분자 결합에 대한 예측은 여전히 매우 좋지 않기 때문에, 약물 표적에 대한 컴퓨터 예측은 단순히 기업 약물 발견의 "백본" 역할을 대신할 위치에 있지 않다. 따라서 "단백질 구조 결정"은 단순히 약물 검출의 속도 제한 단계가 아니다.일반적으로 적혈구이다.[61]또한 단백질의 구조를 가지고도 단백질의 기능, 기능, 기능, 그리고 보다 넓은 생물학적 과정에 어떻게 들어맞는지를 이해하는 것은 여전히 매우 [62]어려울 수 있다는 것이 지적되었다.그럼에도 불구하고, 단백질 구조에 대한 더 나은 지식이 개인의 질병 메커니즘에 대한 더 나은 이해와 궁극적으로는 더 나은 약물 표적에 대한 더 나은 이해로 이어질 수 있다면, 궁극적으로 그것은 [63]개선으로 이어질 수 있다.
또한 AlphaFold는 단백질만을 대상으로 설계된 염기서열을 처리하기 때문에 다른 관련 생체분자는 고려되지 않습니다.부재 금속, 공동 인자와 가장 눈에 띄게 알파폴드 모델의 단백질 글리코실화와 같은 공동 및 사후 번역 수정의 영향에 대해, Elisa Fadda(아일랜드 메이노스 대학교)와 Jon Agirre(영국 요크 대학교)는 과학자들이 UniKB-실종과 같은 데이터베이스를 확인할 필요성을 강조했다.ese는 접이식뿐만 아니라 단백질 [64]기능에서도 중요한 역할을 할 수 있다.그러나 저자들은 많은 AlphaFold 모델이 사후 예측 [64]수정을 도입할 수 있을 만큼 정확하다고 강조했다.
마지막으로, 일부에서는 단백질 예측 문제에 대한 완벽한 답변이라도 단백질 접힘 문제에 대한 의문을 남길 수 있다고 지적했습니다. 즉, 접힘 과정이 실제로 어떻게 발생하는지를 자세히 이해하는 것(그리고 [65]때때로 잘못 접힐 수도 있습니다.
그러나 이러한 경고에도 불구하고, AlphaFold 2는 기술적 진보와 지적 [66][67]성과로 설명되었습니다.
단백질 구조 데이터베이스
내용 | |
---|---|
데이터형 발동. | 단백질 구조 예측 |
유기체 | 모든 UniProt 프로테옴 |
연락 | |
연구소 | EMBL-EBI |
주요 인용문 | [10] |
접근 | |
웹 사이트 | https://www.alphafold.ebi.ac.uk/ |
다운로드 URL | 네. |
도구들 | |
웹 | 네. |
여러가지 종류의 | |
면허증. | CC-BY 4.0 |
큐레이션 정책 | 자동의 |
AlphaFold 단백질 구조 데이터베이스는 AlphaFold와 EMBL-EBI의 공동 노력으로 2021년 7월 22일에 시작되었습니다.출시 당시 데이터베이스는 365,000개 이상의 단백질에 달하는 인간과 20개 모델 유기체의 거의 완전한 UniProt 단백질 구조의 알파폴드 예측 모델을 포함하고 있다.데이터베이스는 16개 미만 또는 2700개 이상의 아미노산 [68]잔기를 가진 단백질을 포함하지 않지만, 인간의 경우 전체 배치 [69]파일에서 사용할 수 있다.AlphaFold는 수집에 더 많은 시퀀스를 추가할 계획이었으며, 초기 목표는 1억 개 이상의 단백질로 구성된 UniRef90 세트의 대부분을 포함하는 것이었다.2022년 5월 15일 현재 992,316개의 예측을 이용할 [70]수 있다.
2021년 7월,[72] UniProt-KB 및[71] InterPro는 AlphaFold 예측을 표시하도록 업데이트되었습니다.
2022년 7월 28일, 연구팀은 지구상의 [73]거의 모든 알려진 단백질을 포괄하는 100만 종에서 약 2억 개의 단백질 구조를 데이터베이스에 업로드했다.
제한 사항
AlphaFold DB는 CASP14 버전과 유사한 단량 모델을 사용합니다.그 결과, 다음과 같은 많은 제한이 예상됩니다.[74]
- DB 모델은 단백질 복합체의 형태로 중요한 맥락을 놓치고 단량체만 예측합니다.AlphaFold Multimer 모델은 오픈 소스로 별도로 게시되지만 사전 실행 모델은 사용할 수 없습니다.
- 모델은 낮은 신뢰 점수를 통해 정보를 전달하지만 본질적으로 무질서한 단백질에 대해서는 신뢰할 수 없다.
- 모델이 돌연변이 분석에 대해 검증되지 않았습니다.
- 이 모델은 제어 없이 다중 배열을 가진 단백질의 한 배열을 출력할 수 있다.
- 이 모델은 주요 펩타이드 사슬만 예측하며, 누락된 공동 인자, 금속 및 동시 및 변환 후 수정의 구조는 예측하지 않는다.이것은 생물학적으로 관련된 많은 시스템에 [64]큰 문제가 될 수 있다: 인간 프로테옴의 구조 중 50%에서 70%는 공유 결합 글리칸 [75]없이 불완전하다.한편, 모델은 이러한 수정이 적용된 PDB 모델에서 훈련되기 때문에 예측 구조는 "이온 또는 보조 인자가 있을 [74]때 예상되는 구조와 자주 일치"한다.
적용들
사스-CoV-2
알파폴드는 COVID-19의 원인 물질인 SARS-CoV-2의 단백질 구조를 예측하는 데 사용되었다.이러한 단백질의 구조는 2020년 [76][7]초에 실험 검출을 보류하고 있었다.결과는 더 큰 연구 커뮤니티에 발표되기 전에 영국의 프란시스 크릭 연구소의 과학자들에 의해 조사되었다.연구팀은 또 국제 오픈 액세스 데이터베이스인 단백질 데이터 뱅크에 공유된 실험적으로 확인된 사스-CoV-2 스파이크 단백질에 대한 정확한 예측을 확인한 뒤 연구된 단백질 [77]분자의 컴퓨터 구조를 공개했다.연구팀은 비록 이러한 단백질 구조가 지속적인 치료 연구의 대상이 아닐지라도, SARS-CoV-2 [77]바이러스에 대한 지역 사회의 이해를 증진시킬 것이라고 인정했다.구체적으로, ORF3a 단백질의 구조에 대한 알파폴드2의 예측은 캘리포니아 대학 버클리 연구진이 극저온 전자 현미경을 사용하여 결정한 구조와 매우 유사했다.이 특정 단백질은 바이러스가 일단 복제되면 숙주 세포에서 탈출하는 것을 돕는다고 믿어진다.이 단백질은 또한 [78]감염에 대한 염증 반응을 유발하는 역할을 한다고 믿어진다.
출판물
알파폴드 조사
- Andrew W. Senior et al.(2019년 12월), "제13차 단백질 구조 예측 임계 평가(CASP13)", 단백질: 구조, 기능, 생물정보학 87(12) 1141–1148 doi:10.1002/prot.25834
- Andrew W. Senior et al. (2020년 1월 15일), "딥러닝의 잠재력을 이용한 단백질 구조 예측 개선", Nature 577 706–710 doi:10.1038/s41586-019-1923-7
- John Jumper et al. (2020년 12월), "딥러닝을 이용한 고정밀 단백질 구조 예측", 단백질 구조 예측을 위한 기법의 14번째 중요 평가(추상서), 22-24페이지
- John Jumper et al. (2020년 12월), "AlphaFold 2"프레젠테이션은 CASP 14에서 실시됩니다.
파생 연구
- Yang, Jianyi; Anishchenko, Ivan; Park, Hahnbeom; Peng, Zhenling; Ovchinnikov, Sergey; Baker, David (21 January 2020). "Improved protein structure prediction using predicted inter-residue orientations". Proceedings of the National Academy of Sciences of the United States of America. 117 (3): 1496–1503. bioRxiv 10.1101/846279. doi:10.1073/pnas.1914677117. PMC 6983395. PMID 31896580.
- Billings, Wendy M.; Hedelius, Bryce; Millecam, Todd; Wingate, David; Corte, Dennis Della (2019-11-04). "ProSPr: Democratized Implementation of Alphafold Protein Distance Prediction Network". p. 830273. bioRxiv 10.1101/830273.S2CID 209578310
- Baek, Minkyung; DiMaio, Frank; Anishchenko, Ivan; Dauparas, Justas; Ovchinnikov, Sergey; Lee, Gyu Rie; Wang, Jue; Cong, Qian; Kinch, Lisa N.; Schaeffer, R. Dustin; Millán, Claudia; Park, Hahnbeom; Adams, Carson; Glassman, Caleb R.; DeGiovanni, Andy; Pereira, Jose H.; Rodrigues, Andria V.; van Dijk, Alberdina A.; Ebrecht, Ana C.; Opperman, Diederik J.; Sagmeister, Theo; Buhlheller, Christoph; Pavkov-Keller, Tea; Rathinaswamy, Manoj K.; Dalwadi, Udit; Yip, Calvin K.; Burke, John E.; Garcia, K. Christopher; Grishin, Nick V.; Adams, Paul D.; Read, Randy J.; Baker, David (15 July 2021). "Accurate prediction of protein structures and interactions using a three-track neural network". Science. 373 (6557): 871–876. Bibcode:2021Sci...373..871B. doi:10.1126/science.abj8754. PMC 7612213. PMID 34282049.
「 」를 참조해 주세요.
레퍼런스
- ^ "AlphaFold". Deepmind. Retrieved 30 November 2020.
- ^ a b c d e f g h "DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology". MIT Technology Review. Retrieved 2020-11-30.
- ^ Shead, Sam (2020-11-30). "DeepMind solves 50-year-old 'grand challenge' with protein folding A.I." CNBC. Retrieved 2020-11-30.
- ^ Stoddart, Charlotte (1 March 2022). "Structural biology: How proteins got their close-up". Knowable Magazine. doi:10.1146/knowable-022822-1. Retrieved 25 March 2022.
- ^ a b c d e f g h 로버트 F.서비스, '게임의 판도가 바뀌었다. AI, 단백질 구조 해결 성공, 사이언스, 2020년 11월 30일
- ^ a b c d e f Mohammed AlQuaisi씨, CASP14 스코어가 방금 공개되었습니다.트위터, 2020년 11월 30일.
- ^ a b c d e f Callaway, Ewen (2020-11-30). "'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures". Nature. 588 (7837): 203–204. Bibcode:2020Natur.588..203C. doi:10.1038/d41586-020-03348-4. PMID 33257889.
- ^ a b c Stephen Curry, 아니요, Deep Mind는 단백질 접힘 문제를 해결하지 못했습니다, 상호 공간(블로그), 2020년 12월 2일
- ^ Balls, Phillip (9 December 2020). "Behind the screens of AlphaFold". Chemistry World.
- ^ a b Jumper, John; Evans, Richard; Pritzel, Alexander; Green, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ; Žídek, Augustin; Potapenko, Anna; Bridgland, Alex; Meyer, Clemens; Kohl, Simon A A; Ballard, Andrew J; Cowie, Andrew; Romera-Paredes, Bernardino; Nikolov, Stanislav; Jain, Rishub; Adler, Jonas; Back, Trevor; Petersen, Stig; Reiman, David; Clancy, Ellen; Zielinski, Michal; Steinegger, Martin; Pacholska, Michalina; Berghammer, Tamas; Bodenstein, Sebastian; Silver, David; Vinyals, Oriol; Senior, Andrew W; Kavukcuoglu, Koray; Kohli, Pushmeet; Hassabis, Demis (2021-07-15). "Highly accurate protein structure prediction with AlphaFold". Nature. 596 (7873): 583–589. Bibcode:2021Natur.596..583J. doi:10.1038/s41586-021-03819-2. PMC 8371605. PMID 34265844.
- ^ "GitHub - deepmind/alphafold: Open source code for AlphaFold". GitHub. Retrieved 2021-07-24.
- ^ "AlphaFold Protein Structure Database". alphafold.ebi.ac.uk. Retrieved 2021-07-24.
- ^ a b c d e "AlphaFold: Using AI for scientific discovery". Deepmind. Retrieved 2020-11-30.
- ^ Ken A. Dill, S. Banu Ozkan, M. Scott Shell, and Thomas R. Weikl (2008). "The Protein Folding Problem". Annual Review of Biophysics. 37: 289–316. doi:10.1146/annurev.biophys.37.092707.153558. PMC 2443096. PMID 18573083.
{{cite journal}}
: CS1 maint: 작성자 파라미터 사용(링크) - ^ a b c d e "AlphaFold: a solution to a 50-year-old grand challenge in biology". Deepmind. Retrieved 30 November 2020.
- ^ 모하메드 알쿠라이시(2019년 5월), CASP13의 알파폴드, 생물정보학, 35(22), 4862-4865 doi:10.1093/생물정보학/btz422.Mohammed AlQuaisi (2018년 12월 9일), AlphaFold @ CASP13 "What asken?" (블로그 투고)도 참조하십시오.
모하메드 알쿠라이시(2020년 1월 15일), 단백질 구조 예측의 분수령, Nature577, 627–628 doi:10.1038/d41586-019-03951-0 - ^ AlphaFold: 단백질 구조 예측을 위한 기계학습, Foldit, 2020년 1월 31일
- ^ Torrisi, Mirko et al. (2020년 1월 22일), 단백질 구조 예측의 딥 러닝 방법.계산 및 구조 생명공학 저널 vol. 18 1301–1310. doi:10.1016/j.csbj.2019.12.011 (CC-BY-4.0)
- ^ a b c d "DeepMind is answering one of biology's biggest challenges". The Economist. 2020-11-30. ISSN 0013-0613. Retrieved 2020-11-30.
- ^ a b c Jeremy Kahn, Deep Mind의 단백질 접힘 A.I.에서 얻은 교훈, Fortune, 2020년 12월 1일
- ^ a b John Jumper et al., 컨퍼런스 추상(2020년 12월)
- ^ a b c d 블록 다이어그램을 참조하십시오.또한 John Jumper 등(2020년 12월 1일), AlphaFold 2 프레젠테이션, 슬라이드 10
- ^ 구조 모듈은 "3d 등가변압기 아키텍처"를 사용하도록 명시되어 있습니다(John Jumper et al. (2020년 12월 1일), AlphaFold 2 프레젠테이션, 슬라이드 12).
SE(3)-등가성을 갖는 변압기 네트워크에 대한 하나의 설계는 Fabian Fuchs et alSE(3)-Transformers: 3D Roto-Translation Equivariant Attention Networks, NeurolIPS 2020; 웹사이트에서 제안되었습니다.이것이 알파폴드에 사용된 것과 얼마나 유사할지는 알려지지 않았다.
자세한 내용은 AlQuaraisi의 블로그 게시물 또는 Fabian Fuchs의 게시물을 참조하십시오. - ^ John Jumper et al. (2020년 12월 1일), AlphaFold 2 프레젠테이션, 슬라이드 12~20
- ^ Callaway, Ewen (13 April 2022). "What's next for AlphaFold and the AI protein-folding revolution". Nature. 604 (7905): 234–238. doi:10.1038/d41586-022-00997-5. PMID 35418629. S2CID 248156195. Retrieved 15 April 2022.
- ^ 그룹 성과는 2018년 12월 합산 z-model 기준 CASP 13일 (AlphaFold = Team 043 : A7D)
- ^ a b Sample, Ian (2 December 2018). "Google's DeepMind predicts 3D shapes of proteins". The Guardian. Retrieved 30 November 2020.
- ^ "AlphaFold: Using AI for scientific discovery". Deepmind. Retrieved 30 November 2020.
- ^ Singh, Arunima (2020). "Deep learning 3D structures". Nature Methods. 17 (3): 249. doi:10.1038/s41592-020-0779-y. ISSN 1548-7105. PMID 32132733. S2CID 212403708.
- ^ 043 A7D, 322 Zhang 및 089 MULTICOM의 CASP 13 데이터 테이블을 참조해 주세요.
- ^ Wei Jheng et al, CASP13의 심층 학습 접촉 지도 안내 단백질 구조 예측, 단백질: 구조, 기능 및 생물정보학, 87(12) 1149–1164 doi:10.1002/prot.25792 및 슬라이드
- ^ Hou, Jie; Wu, Tianqi; Cao, Renzhi; Cheng, Jianlin (2019-04-25). "Protein tertiary structure modeling driven by deep learning and contact distance prediction in CASP13". Proteins: Structure, Function, and Bioinformatics. Wiley. 87 (12): 1165–1178. bioRxiv 10.1101/552422. doi:10.1002/prot.25697. ISSN 0887-3585. PMC 6800999. PMID 30985027.
- ^ a b c "DeepMind Breakthrough Helps to Solve How Diseases Invade Cells". Bloomberg.com. 2020-11-30. Retrieved 2020-11-30.
- ^ "deepmind/deepmind-research". GitHub. Retrieved 2020-11-30.
- ^ "DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology". MIT Technology Review. Retrieved 30 November 2020.
- ^ 사용된 GDT_TS 측정의 경우 예측 내의 각 원자는 실험 위치의 8Ω(0.80nm) 이내에 있으면 4분의 1포인트, 4Ω 내에 있으면 0.5포인트, 2Ω 내에 있으면 4분의 3포인트, 1Ω 내에 있으면 전체 포인트를 획득합니다.
- ^ GDT_TS 점수 92.5를 얻으려면 수학적으로 구조의 70% 이상이 1Ω 이내로 정확해야 하며 85% 이상이 2Ω 이내로 정확해야 합니다.
- ^ CASP 조직위원회, 2020년 11월 30일, 50년간 지속된 과학 과제에 대한 인공지능 솔루션은 의학 연구를 '혁명'시킬 수 있다.
- ^ Brigitte Nerlich, 단백질 접기 및 과학 커뮤니케이션: 과대 광고와 겸손 사이에서, 노팅엄 대학 블로그, 2020년 12월 4일
- ^ DeepMind의 AI 생물학자 Michael Le Page가 생명의 기계의 비밀을 해독할 수 있다, New Scientist, 2020년 11월 30일
- ^ DeepMind의 최신 AI의 예측은 의학에 혁명을 일으킬 수 있다, New Scientist, 2020년 12월 2일
- ^ 케이드 메츠, 런던 AI. NYTES, 2020년 11월 30일 약물 발견을 가속화할 수 있는 획기적인 연구실 주장
- ^ Ian Sample, DeepMind AI가 단백질 접힘의 50년 문제를 해결, The Guardian, 2020년 11월 30일
- ^ 리지 로버츠, 구글 AI 연구진이 50년 된 생물학적 도전에 도전하는 '원스 인 어 제너레이션'데일리 텔레그래프, 2020년 11월 30일
- ^ a b c Nuno Dominguez, La inteligencia an uno de los problemas mass importantes de la biologia (인공지능은 생물학에서 가장 중요한 문제 중 하나를 제거한다), El Pais, 2020년 12월 2일
- ^ Jeremy Kahn, 주요한 과학적 비약적 발전으로, A.I.는 단백질의 정확한 형태를 예측합니다, Fortune, 2020년 11월 30일.
- ^ Julia Merlot, Forscher hoff auf Durchbruch für die Medikamentenforschung (연구진은 약물 연구의 돌파구를 희망합니다), Der Spiegel, 2020년 12월 2일
- ^ 비산 알 라지카니, 생물학적 미스터리의 해결 The Spective, 2020년 12월 1일
- ^ Tom Whipple, "Deepmind computer solves new puzzle: life", The Times, 2020년 12월 1일자, 1면 이미지, 트위터를 통한.
- ^ 톰 위플, 딥마인드는 단백질 문제에 대한 해답으로 생물학의 '성배'를 찾는다, 더 타임스(온라인), 2020년 11월 30일.
모든 과학 편집자 톰 위플은 그 소식이 전해진 날 타임즈에 그 주제에 대한 여섯 개의 기사를 썼다.( ( ( ) 。 - ^ Tim Hubbard, 생명의 비밀, 파트 2: 단백질 접힘 문제의 해결책. medium.com, 2020년 11월 30일.
- ^ Christian Stöcker, Google greft nach dem Leben selbst(구글은 생명을 위해 노력하고 있다), Der Spiegel, 2020년 12월 6일
- ^ John Jumper et al. (2020년 12월 1일), AlphaFold 2.프레젠테이션은 CASP 14에서 실시됩니다.
- ^ AlQuraishi, Mohammed (2020-12-08). "AlphaFold2 @ CASP14: "It feels like one's child has left home." The Method". Some Thoughts on a Mysterious Universe. Archived from the original on 2020-12-08. Retrieved 2020-12-15.
- ^ Carlos Outeiral, CASP14: Google DeepMind의 AlphaFold 2가 실제로 달성한 것과 단백질 접힘, 생물학, 생물정보학, 옥스퍼드 단백질 정보학 그룹에서의 의미(12월 3일)
- ^ Aled Edwards, AlphaFold2 성공 사례: medium.com을 통해 2020년 12월 5일 한 마을을 방문했습니다.
- ^ David Briggs, 구글의 알파폴드2가 정말 단백질 접힘 문제를 해결했다면, 그들은 그들의 작업을 보여줄 필요가 있다, The Substitic, 2020년 12월 4일
- ^ DeepMind의 두뇌에 대한 가디언 뷰: 다가올 일의 형태, The Guardian, 2020년 12월 6일
- ^ Demis Hassabis, "#AlphaFold의 흥미로운 진척에 대한 브리프 업데이트!" (트윗) 2021년 6월 18일 트위터를 통해
- ^ a b c d Tom Ireland, Alpha Fold는 생명과학 연구를 어떻게 바꿀 것인가?생물학자, 2020년 12월 4일
- ^ Derek Lowe, 파이프라인에서: Science Translation Medicine, What is Critical and What Not Not Not, 2019년 9월 25일
- ^ Philip Ball, AlphaFold 스크린 뒤에, 화학 세계, 2020년 12월 9일.트윗도 참조, 12월 1일
- ^ Derek Lowe, 파이프라인에서: The Big Problems, Science Translation Medicine, 2020년 12월 1일
- ^ a b c Bagdonas, Haroldas; Fogarty, Carl A.; Fadda, Elisa; Agirre, Jon (2021-10-29). "The case for post-predictional modifications in the AlphaFold Protein Structure Database". Nature Structural & Molecular Biology. 28 (11): 869–870. doi:10.1038/s41594-021-00680-9. ISSN 1545-9985. PMID 34716446. S2CID 240228913.
- ^ 예: Greg Bowman, 단백질 접힘 및 관련 문제는 AlphaFold의 진보에도 불구하고 해결되지 않은 채로 있습니다, Folding@home 블로그, 2020년 12월 8일
- ^ 크리스티나 사에즈, 엘 울티모 어반스 펀더멘털 데 라 비올리아 세 바사 엔 라 인베스티바시온 데 우니엔티피코 에스파놀, 라 뱅가디아, 2020년 12월 2일(알폰소 발렌시아 전체도)
- ^ Zero Gravitas and Jacky Liang, DeepMind의 AlphaFold 2 – Skynet, 오늘 (블로그), 스탠포드, 2020년 12월 9일
- ^ "AlphaFold Protein Structure Database". alphafold.ebi.ac.uk. Retrieved 2021-07-29.
- ^ "AlphaFold Protein Structure Database". alphafold.ebi.ac.uk. Retrieved 27 July 2021.
- ^ "AlphaFold Protein Structure Database". www.alphafold.ebi.ac.uk.
- ^ InterPro. "Alphafold Structure Predictions Available In Interpro". proteinswebteam.github.io. Retrieved 2021-07-29.
- ^ "Putting the power of AlphaFold into the world's hands". Deepmind.
- ^ Callaway, Ewen (2022-07-28). "'The entire protein universe': AI predicts shape of nearly every known protein". Nature. doi:10.1038/d41586-022-02083-2. PMID 35902752.
{{cite journal}}
:확인.pmid=
값(도움말) - ^ a b "What use cases does AlphaFold not support?". AlphaFold Protein Structure Database.
- ^ An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (2009-10-01). "Determination of glycosylation sites and site-specific heterogeneity in glycoproteins". Current Opinion in Chemical Biology. Analytical Techniques/Mechanisms. 13 (4): 421–426. doi:10.1016/j.cbpa.2009.07.022. ISSN 1367-5931. PMC 2749913. PMID 19700364.
- ^ "AI Can Help Scientists Find a Covid-19 Vaccine". Wired. ISSN 1059-1028. Retrieved 2020-12-01.
- ^ a b "Computational predictions of protein structures associated with COVID-19". Deepmind. Retrieved 2020-12-01.
- ^ "How DeepMind's new protein-folding A.I. is already helping to combat the coronavirus pandemic". Fortune. Retrieved 2020-12-01.
추가 정보
- Carlos Outeiral, CASP14: Google DeepMind의 AlphaFold 2가 실제로 달성한 것과 단백질 접힘, 생물학, 생물정보학, 옥스퍼드 단백질 정보학 그룹에서의 의미(12월 3일)
- 모하메드 알쿠라이시, 알파폴드2 @ CASP14: "아이가 집을 떠난 것 같다." (블로그), 2020년 12월 8일
- Mohammed AlQuaisi, The AlphaFold2 Method Paper: 좋은 아이디어의 샘(블로그), 2021년 7월 25일
외부 링크
알파폴드 1
- Senior, Andrew (August 23, 2019). "AlphaFold: improved protein structure prediction using potentials from deep learning". Institute for Protein Design – via YouTube.
- GitHub의 CASP13에서 사용되는 AlphaFold 코드
- 오픈소스 커뮤니티 구현– GitHub에서의 ProSPR
알파폴드 2
- AlphaFold v2.1 코드 및 GitHub 모델 링크
- 유럽생물정보학연구소의 인간 프로테옴 및 기타 20개 주요 유기체에 대한 단백질 구조 예측에 대한 개방적 접근
- CASP 14 웹사이트
- 알파폴드: YouTube를 통해 DeepMind라는 과학적 돌파구를 만드는 것.
- ColabFold()Mirdita, Milot; Schütze, Konstantin; Moriwaki, Yoshitaka; Heo, Lim; Ovchinnikov, Sergey; Steinegger, Martin (2022-05-30). "ColabFold: Making protein folding accessible to all". Nature Methods. 19 (6): 679–682. doi:10.1038/s41592-022-01488-1. PMC 9184281. PMID 35637307. 버전 - 동질성 예측 및 복합체용
- AlphaFold 단백질 구조 데이터베이스 웹사이트