SAMPL 챌린지
SAMPL Challenge![]() |
![]() | 이 기사의 주요 기고자는 그 주제와 밀접한 관련이 있는 것으로 보인다. (2022년 3월) |
SAMPL(단백질 및 리간드 모델링 통계적 평가)은 합리적인 약물 설계에서 표준 예측 도구로서 연산 기법을 발전시키는 것을 목적으로 하는 지역사회 전체의 맹목적인 도전이다.[1][2][3][4][5]단백질, 숙주-게스트 복합체, 약물과 같은 작은 분자를 포함한 다양한 크기와 수준의 복잡성을 가진 생물학적으로 관련된 광범위한 시스템이 SAMPL의 최신 모델링 방법과 힘 필드를 시험하기 위해 선택되었다. 결합 친화력 및 수화 자유 에너지와 같은 새로운 실험 데이터는 미립자로부터 보류되었다.방법의 진정한 예측력이 드러날 수 있도록 예측 제출 마감일까지 바지가장 최근의 SAMPL5 챌린지는 호스트-게스트 시스템의 결합 친화력과 물과 사이클로헥산 사이의 약물 유사 분자의 분포 계수라는 두 가지 예측 범주를 포함한다.[6][7]2008년부터 SAMPL 챌린지 시리즈는 컴퓨터 보조 약물 설계(CADD)[8][9][10] 분야에 종사하는 과학자들의 관심을 끌었다.현재의 SAMPL 조직자에는 존 조데라, 마이클 K가 있다. 길슨, 데이비드 모블리, 그리고 마이클 셔츠.[11]
프로젝트 유의성
SAMPL 챌린지는 계산 방법론과 힘 분야에 대한 사전 검증과 엄격한 비교를 제공함으로써 정량적이고 정확한 약물 발견 도구 개발의 진전을 가속화하고자 한다.컴퓨터 보조 약물 설계 방법은 고성능 컴퓨팅 기능의 급속한 성장과 함께 시간이 지남에 따라 상당히 개선되었다.하지만 제약업계에서는 정확성이 떨어져 적용 가능성이 여전히 매우 제한적이다.대규모의 사전 검증이 결여된 경우, 방법은 기존의 실험 데이터를 과도하게 적합시키는 데 어려움을 겪는 경향이 있다.이를 극복하기 위해 SAMPL 과제를 블라인드 테스트로 구성했는데, 매번 새로운 데이터셋을 학술 또는 산업 연구소에서 세심하게 설계·수집하고, 예측 제출 마감 직후 측정치를 공개한다.그런 다음 연구자들은 제출된 추정치와 고품질, 예상 실험 데이터를 비교할 수 있다.중요한 강조점은 학습된 교훈에 있으며, 향후 과제 참여자들이 이전 과제를 기반으로 한 개선 모델링의 혜택을 누릴 수 있도록 한다.
SAMPL은 역사적으로 호스트-게스트 시스템과 약물 같은 작은 분자의 특성에 초점을 맞추었다.이러한 단순한 모델 시스템은 단백질 시스템보다 시뮬레이션할 계산 자원이 상당히 적게 필요하므로 더 빨리 수렴한다.신중한 설계를 통해, 이러한 모델 시스템은 하나의 특정 또는 시뮬레이션 과제의 하위 집합에 초점을 맞추는 데 사용될 수 있다.[further explanation needed][12]과거 몇 가지 SAMPL 호스트-게스트, 수화 자유 에너지 및 로그 D 과제는 일반화된 힘 영역의 한계를 드러냈고,[13][14] 용제 모델의 개발을 촉진했으며,[15][16] 양성 상태와 염분을 적절히 처리하는 것의 중요성을 강조했다.[17][18]
참여
SAMPL 도전에 대해서는 등록 및 참여가 무료다.SAMPL7을 시작으로, SAMPL 웹사이트에 챌린지 참여 데이터가 게시되었고,[19] 구체적인 챌린지 GitHub 페이지에도 게시되었다.그 후 지침, 입력 파일 및 결과가 GitHub를 통해 제공되었다(이전 도전은 주로 SAMPL4-5의 경우 D3R을 통해, 그리고 이전 SAMPL의 경우 다른 수단을 통해 콘텐츠 제공).참가자들은 익명 또는 연구 제휴를 통해 D3R 웹사이트를 통해 복수의 예측을 제출할 수 있도록 하였다.SAMPL2 챌린지 이후 모든 참가자를 초청하여 SAMPL 워크숍에 참석시키고 원고를 제출하여 결과를 설명한다.동료 검토 과정을 거친 후, 제출된 모든 데이터를 요약한 개요 논문과 함께 결과 논문은 컴퓨터 보조 분자 설계 저널의 특별 호에 게재되었다.[20]
자금조달
SAMPL 프로젝트는 모델링 노력에 가장 필요한 분야의 발전을 촉진하기 위해 향후 SAMPL 과제를 설계할 수 있도록 2018년 9월부터 2022년 8월까지 NIH(Grant GM124270-01A1)의 자금 지원을 받았다.[9][10]데이비드 모블리(UC 어바인)가 공동 조사자인 존 D와 함께 이 같은 노력을 주도하고 있다.조데라(MSKCC), 브루스 C. 깁스(툴레인), 라일 아이작스(마리랜드).현재는 NIH가 후원하는 약품설계자료원과 제휴하여 과제와 워크숍을 운영하고 있으나, 두 프로젝트에 대한 자금후원이 연계되지 않아 시간이 지날수록 변경될 가능성이 높다.
자금후원은 또한 SAMPL의 범위를 넓히는 것을 허용했다; SAMPL6를 통해 SAMPL의 역할은 주로 물리적 특성에 초점을 맞춘 것으로 보여졌고, D3R은 단백질-라이건드 과제를 처리했다.그러나, 자금조달된 노력은 잠재적으로 적합한 단백질-리간드 시스템을 포함하여 모델링의 개선을 촉진할 시스템을 포함하도록 초점을 넓혔다.이는 여전히 D3R과 대조되는 것으로, SAMPL 과제는 특정 모델링 과제에 초점을 맞추도록 특별히 설계되었다.
역사
초기 SAMPL 과제
첫 번째 SAMPL 연습인 SAMPL0(2008)[21]은 17개의 작은 분자의 자유 에너지 용도에 대한 예측에 초점을 맞췄다.스탠포드 대학의 연구팀과 OpenEye Scientific Software의 과학자들은 이 계산을 수행했다.비공식 형식에도 불구하고, SAMPL0은 다음과 같은 SAMPL 과제의 토대를 마련하였다.
SAMPL1(2009)[22]과 SAMPL2 과제(2010)[1]는 OpenEye에 의해 조직되어 약물과 같은 작은 분자의 자유 에너지 예측에 계속 초점을 맞추었다.또한 구속력 있는 친근감, 구속력 있는 자세, 토토머 비율을 예측하기 위한 시도도 이루어졌다.두 가지 도전은 모두 컴퓨터 공학자와 학계 및 산업계의 연구자들로부터 상당한 참여를 이끌어냈다.
SAMPL3 및 SAMPL4
호스트-게스트 결합 친화성에 대한 블라인드 데이터 세트는 SAMPL3(2011~2012년)에 처음으로 도입되었으며,[3] 소형 분자에 대한 용해 자유 에너지 및 500개의 파편 유사 타이로신 억제제에 대한 결합 친화도 데이터가 추가되었다.세 개의 숙주 분자는 모두 쿠쿠르비투릴 계열의 것이었다.SAMPL3 챌린지는 전 세계 23개 연구단체로부터 103건의 제출을 받았다.[2]
이전의 세 번의 SAMPL 이벤트와는 달리, SAMPL4 연습(2013-2014)[4][5]은 OpenEye의 물류 지원을 받아 학술 연구자들에 의해 조정되었다.SAMPL4의 데이터셋은 호스트-게스트 시스템과 HIV 통합효소 억제제에 대한 결합 친화성과 작은 분자의 수화 없는 에너지로 구성되었다.숙주 분자에는 쿠쿠르빗[7]uril (CB7)과 옥타아시드가 포함되어 있었다.SAMPL4 수화 도전에는 19개 그룹으로부터 49건의 제출이 있었다.호스트-게스트 챌린지의 참가도 SAMPL3에 비해 크게 증가했다.워크숍은 2013년 9월 스탠포드 대학에서 열렸다.
샘플5
단백질 리그와 도전은 SAMPL5(2015~2016년)[6][7]의 SAMPL로부터 분리되어 신약 설계 데이터 자원(D3R)의 그랜드 챌린지로 배포되었다.[23]SAMPL5는 참가자가 3개의 호스트-게스트 시스템, 즉 주기적 CB7 파생상품과 옥타-아시드 계열의 호스트 2세트의 결합 친화성을 예측하도록 허용했다.참가자들에게 엔탈피 결박 예측서를 제출하도록 권유하기도 했다.밀도 기능 이론(DFT), 분자 역학, 도킹, 메타다이나믹스를 포함한 광범위한 연산 방법이 시험되었다.분포계수 예측은 처음으로 도입되어, 53개의 작은 분자 집합에 대해 18개의 연구자 그룹이나 과학자들로부터 총 76개의 제출을 받았다.워크숍은 D3R 워크숍의 일환으로 2016년 3월 샌디에이고 캘리포니아 대학교에서 열렸다.호스트-게스트 도전에서 최고 성능의 방법들은 실험 데이터에 대한 고무적이지만 불완전한 상관관계를 낳았고, 실험에 비해 크고 체계적인 이동을 수반했다.[24][25]
샘플6
SAMPL6 시험 시스템에는 쿠쿠빗[8]uril, 옥타-acid, 테트라엔도-메틸-옥타-acid, 그리고 일련의 조각 같은 작은 분자가 포함된다.SAMPL6의 호스트-게스트, 일치 샘플링 및 pKa 예측 과제는 이제 종결되었다.SAMPL6 워크숍은 2018년 2월 Scripps[26] 해양학 연구소에서 D3R 워크숍과 공동으로 진행되었으며, 컴퓨터 보조 분자 설계 저널의 SAMPL 특별호에서 많은 결과를 보고했다.SAMPL6 Part II 챌린지는 작은 옥탄올-물 파티션 계수 예측에 초점을 맞추고 2019년 5월 16일 가상 워크샵과 2019년 8월 샌디에이고에서 D3R/SAMPL 공동 워크샵이 이어졌다.JCAMD의 특별 발행물이나 특별 섹션은 결과를 보고할 계획이다.[needs update]SAMPL6 입력 및 결과는 SAMPL6 GitHub 저장소를 통해 이용할 수 있다.
샘플7
SAMPL7은 다시 호스트 게스트 과제와 물리적 자산 과제를 포함했다.PHIPA 파편에 대한 단백질-리거 및 결합 도전이 포함되었다.숙주-게스트 결합은 옥타-아시드와 엑소-옥타-아시드에 결합하는 몇 개의 작은 분자, 일련의 사이클로덱스트린 파생 모델에 두 개의 화합물을 결합하는 것, 그리고 트리머트립이라고 알려진 클립 같은 게스트에 일련의 작은 분자를 결합하는 것에 초점을 맞췄다.SAMPL7 가상 워크샵이 열렸으며 온라인에서 이용할 수 있다.SAMPL7 물리적 특성 도전은 현재 진행 중이다.2020년 가을 EuroSAMPL 직접 작업장의 계획이 COVID-19에 의해 탈선되어 작업장이 가상으로 진행되고 있다.SAMPL7 입력 및 (챌린지 구성요소가 완료되면 결과)는 SAMPL6 GitHub 저장소를 통해 이용할 수 있다.
샘플8
SAMPL8에는 SAMPL8 GitHub 저장소에 자세히 설명된 바와 같이 CB8에 대한 남용 약물의 결합에 관한 호스트 게스트 구성요소 및 GDCC(Geeb Deep Cavity Cavitands)에 대한 일련의 작은 분자가 포함되었다.추가적인 pKa 및 logD 도전은 일련의 약물 유사 분자에 대한 pK 및 logD 예측에 초점을 맞췄다.
샘플9
SAMPL9는 라일 아이작스 그룹의 호스트에 대한 SAMPL9 호스트-게스트 챌린지가 현재 진행 중이라는 점을 제외하고 계획 단계에 있다.자세한 내용은 SAMPL9 GitHub 저장소에서 확인할 수 있다.
SAMPL 특수 문제
SAMPL 간행물
SAMPL 관련 간행물의 비교적 완전한 목록은 SAMPL 주최자에 의해 유지되고 있으며, 150개 이상의 관련 논문이 발행되었다.
미래의 과제
SAMPL은 logP 및 logD 값, pKa 예측, 호스트-게스트 바인딩 및 기타 특성을 포함한 물리적 속성 예측과 더불어 단백질-리간드 성분을 포함하도록 확장하는 데 초점을 맞출 예정이다.[9]일부 데이터는 SAMPL 공동조사단(초데라, 깁스, 아이작스)이 직접 수집할 계획이지만, 산업 제휴 및 인턴십도 제안한다.[9]
참고 항목
참조
- ^ a b Geballe, Matthew T.; Skillman, A. Geoffrey; Nicholls, Anthony; Guthrie, J. Peter; Taylor, Peter J. (2010-05-09). "The SAMPL2 blind prediction challenge: introduction and overview". Journal of Computer-Aided Molecular Design. 24 (4): 259–279. Bibcode:2010JCAMD..24..259G. doi:10.1007/s10822-010-9350-8. ISSN 0920-654X. PMID 20455007. S2CID 12363968.
- ^ a b Skillman, A. Geoffrey (2012-05-24). "SAMPL3: blinded prediction of host–guest binding affinities, hydration free energies, and trypsin inhibitors". Journal of Computer-Aided Molecular Design. 26 (5): 473–474. Bibcode:2012JCAMD..26..473S. doi:10.1007/s10822-012-9580-z. ISSN 0920-654X. PMID 22622621. S2CID 8335429.
- ^ a b Muddana, Hari S.; Varnado, C. Daniel; Bielawski, Christopher W.; Urbach, Adam R.; Isaacs, Lyle; Geballe, Matthew T.; Gilson, Michael K. (2012-02-25). "Blind prediction of host–guest binding affinities: a new SAMPL3 challenge". Journal of Computer-Aided Molecular Design. 26 (5): 475–487. Bibcode:2012JCAMD..26..475M. doi:10.1007/s10822-012-9554-1. ISSN 0920-654X. PMC 3383923. PMID 22366955.
- ^ a b Muddana, Hari S.; Fenley, Andrew T.; Mobley, David L.; Gilson, Michael K. (2014-03-06). "The SAMPL4 host–guest blind prediction challenge: an overview". Journal of Computer-Aided Molecular Design. 28 (4): 305–317. Bibcode:2014JCAMD..28..305M. doi:10.1007/s10822-014-9735-1. ISSN 0920-654X. PMC 4053502. PMID 24599514.
- ^ a b Mobley, David L.; Wymer, Karisa L.; Lim, Nathan M.; Guthrie, J. Peter (2014-03-11). "Blind prediction of solvation free energies from the SAMPL4 challenge". Journal of Computer-Aided Molecular Design. 28 (3): 135–150. Bibcode:2014JCAMD..28..135M. doi:10.1007/s10822-014-9718-2. ISSN 0920-654X. PMC 4006301. PMID 24615156.
- ^ a b Yin, Jian; Henriksen, Niel M.; Slochower, David R.; Shirts, Michael R.; Chiu, Michael W.; Mobley, David L.; Gilson, Michael K. (2016-09-22). "Overview of the SAMPL5 host–guest challenge: Are we doing better?". Journal of Computer-Aided Molecular Design. 31 (1): 1–19. doi:10.1007/s10822-016-9974-4. ISSN 0920-654X. PMC 5241188. PMID 27658802.
- ^ a b Bannan, Caitlin C.; Burley, Kalistyn H.; Chiu, Michael; Shirts, Michael R.; Gilson, Michael K.; Mobley, David L. (2016-09-27). "Blind prediction of cyclohexane–water distribution coefficients from the SAMPL5 challenge". Journal of Computer-Aided Molecular Design. 30 (11): 927–944. Bibcode:2016JCAMD..30..927B. doi:10.1007/s10822-016-9954-8. ISSN 0920-654X. PMC 5209301. PMID 27677750.
- ^ L, Mobley, David; D, Chodera, John; K, Gilson, Michael (2017-06-21). "Results of the 2017 Roadmap survey of the Statistical Assessment of Modeling of Proteins and Ligands (SAMPL) challenge community". EScholarship.
- ^ a b c d Mobley, David L.; Chodera, John D.; Isaacs, Lyle; Gibb, Bruce C. (2016). "Advancing predictive modeling through focused development of model systems to drive new modeling innovations". Zenodo. doi:10.5281/zenodo.163963.
- ^ a b Mobley, David L. (2016-10-05). "Advancing predictive modeling through focused development of model systems to drive new modeling innovations". eScholarship.
- ^ "D3R SAMPL".
- ^ Mobley, David L.; Gilson, Michael K. (2016-12-08). "Predicting binding free energies: Frontiers and benchmarks". bioRxiv 10.1101/074625.
- ^ Muddana, Hari S.; Gilson, Michael K. (2012-01-25). "Prediction of SAMPL3 host–guest binding affinities: evaluating the accuracy of generalized force-fields". Journal of Computer-Aided Molecular Design. 26 (5): 517–525. Bibcode:2012JCAMD..26..517M. doi:10.1007/s10822-012-9544-3. ISSN 0920-654X. PMC 3383906. PMID 22274835.
- ^ Mobley, David L.; Liu, Shaui; Cerutti, David S.; Swope, William C.; Rice, Julia E. (2011-12-24). "Alchemical prediction of hydration free energies for SAMPL". Journal of Computer-Aided Molecular Design. 26 (5): 551–562. doi:10.1007/s10822-011-9528-8. ISSN 0920-654X. PMC 3583515. PMID 22198475.
- ^ Pal, Rajat Kumar; Haider, Kamran; Kaur, Divya; Flynn, William; Xia, Junchao; Levy, Ronald M.; Taran, Tetiana; Wickstrom, Lauren; Kurtzman, Tom; Gallicchio, Emilio (2016-09-30). "A combined treatment of hydration and dynamical effects for the modeling of host–guest binding thermodynamics: the SAMPL5 blinded challenge". Journal of Computer-Aided Molecular Design. 31 (1): 29–44. doi:10.1007/s10822-016-9956-6. ISSN 0920-654X. PMC 5477994. PMID 27696239.
- ^ Brini, Emiliano; Paranahewage, S. Shanaka; Fennell, Christopher J.; Dill, Ken A. (2016-09-08). "Adapting the semi-explicit assembly solvation model for estimating water-cyclohexane partitioning with the SAMPL5 molecules". Journal of Computer-Aided Molecular Design. 30 (11): 1067–1077. Bibcode:2016JCAMD..30.1067B. doi:10.1007/s10822-016-9961-9. ISSN 0920-654X. PMC 5261860. PMID 27632227.
- ^ Sure, Rebecca; Antony, Jens; Grimme, Stefan (2014-03-27). "Blind Prediction of Binding Affinities for Charged Supramolecular Host–Guest Systems: Achievements and Shortcomings of DFT-D3". The Journal of Physical Chemistry B. 118 (12): 3431–3440. doi:10.1021/jp411616b. ISSN 1520-6106. PMID 24588346.
- ^ Klamt, Andreas; Eckert, Frank; Reinisch, Jens; Wichmann, Karin (2016-07-26). "Prediction of cyclohexane-water distribution coefficients with COSMO-RS on the SAMPL5 data set". Journal of Computer-Aided Molecular Design. 30 (11): 959–967. Bibcode:2016JCAMD..30..959K. doi:10.1007/s10822-016-9927-y. ISSN 0920-654X. PMID 27460058. S2CID 33238269.
- ^ "SAMPL Challenges". samplchallenges.github.io. Retrieved 2020-07-03.
- ^ "Journal of Computer-Aided Molecular Design - All Volumes & Issues - Springer". link.springer.com. Retrieved 2017-01-12.
- ^ Nicholls, Anthony; Mobley, David L.; Guthrie, J. Peter; Chodera, John D.; Bayly, Christopher I.; Cooper, Matthew D.; Pande, Vijay S. (2008-02-01). "Predicting Small-Molecule Solvation Free Energies: An Informal Blind Test for Computational Chemistry". Journal of Medicinal Chemistry. 51 (4): 769–779. doi:10.1021/jm070549+. ISSN 0022-2623. PMID 18215013. S2CID 35414610.
- ^ Guthrie, J. Peter (2009-04-09). "A Blind Challenge for Computational Solvation Free Energies: Introduction and Overview". The Journal of Physical Chemistry B. 113 (14): 4501–4507. doi:10.1021/jp806724u. ISSN 1520-6106. PMID 19338360.
- ^ Gathiaka, Symon; Liu, Shuai; Chiu, Michael; Yang, Huanwang; Stuckey, Jeanne A.; Kang, You Na; Delproposto, Jim; Kubish, Ginger; Dunbar, James B. (2016-09-30). "D3R grand challenge 2015: Evaluation of protein–ligand pose and affinity predictions". Journal of Computer-Aided Molecular Design. 30 (9): 651–668. Bibcode:2016JCAMD..30..651G. doi:10.1007/s10822-016-9946-8. ISSN 0920-654X. PMC 5562487. PMID 27696240.
- ^ Yin, Jian; Henriksen, Niel M.; Slochower, David R.; Gilson, Michael K. (2016-09-16). "The SAMPL5 host–guest challenge: computing binding free energies and enthalpies from explicit solvent simulations by the attach-pull-release (APR) method". Journal of Computer-Aided Molecular Design. 31 (1): 133–145. doi:10.1007/s10822-016-9970-8. ISSN 0920-654X. PMC 5241238. PMID 27638809.
- ^ Bosisio, Stefano; Mey, Antonia S. J. S.; Michel, Julien (2016-08-08). "Blinded predictions of host–guest standard free energies of binding in the SAMPL5 challenge" (PDF). Journal of Computer-Aided Molecular Design. 31 (1): 61–70. doi:10.1007/s10822-016-9933-0. ISSN 0920-654X. PMID 27503495. S2CID 31110594.
- ^ "D3R 2018 Workshop". D3R. 2018-02-22. Retrieved 2022-03-27.