멘델의 무작위화

Mendelian randomization

역학에서 멘델리안 무작위화(일반적으로 MR로 약칭)는 결과에 대한 노출의 인과적 영향을 조사하기 위해 유전자의 측정된 변동을 사용하는 방법이다. 주요 가정(아래 참조)에서 설계는 역인자와 교란 요인을 모두 감소시키며, 역학 연구의 결과 해석을 실질적으로 방해하거나 잘못 유도하는 경우가 많다.

Gregor Mendel
그레고르 멘델 멘델리안 무작위화라는 용어는 부모에서 자손에게 유전적 변형을 무작위로 할당하는 것이 그 방법의 기본이기 때문에 붙여진 말이다.

연구 설계는 1986년에[1] 처음 제안되었고, 이후 그레이와 휘틀리가[2] 전통적인 무작위화된 통제 시험(즉 인과관계 확립을 위한 역학에서 "금본 표준")을 수행하지 않고 투입 인과 변수의 효과에 대한 편향되지 않은 추정치를 얻기 위한 방법이라고 기술하였다. 이 작가들은 멘델리안 무작위화라는 말도 만들었다. 멘델의 무작위화 방법의 설명, 적용, 해석 및 정교화는 이후 브리스톨 대학의 그의 그룹이자 세계적인 협력자인 조지 데이비 스미스에 의해 개척되었다.

동기

역학의 주요 목표 중 하나는 건강 결과와 질병, 특히 공중 보건 관련 요인의 수정 가능한 원인을 식별하는 것이다. 특정 특성(예: 개입, 치료 또는 정책 변경을 통한)을 수정하는 것이 모집단 내에서 유익한 효과를 전달하는지 여부를 확인하기 위해, 이 특성이 관심의 결과를 유발한다는 확실한 증거가 필요하다. 그러나 많은 관찰 역학 연구 설계는 인과관계와 상관관계를 식별하는 능력에 제한되어 있다. 특히 특정 특성이 관심의 결과를 야기하는지, 단순히 그 결과와 관련이 있는지(그러나 유발하지 않는지) 또는 결과 자체의 결과인지에 대한 것이다. 오직 전자만이 질병의 부담을 줄이기 위해 그 특성을 수정하는 것이 목적인 공중 보건 환경 내에서 유익할 것이다. 모집단 표본 내의 특성들 간의 관계를 이해하는 것을 목표로 하는 역학 연구 설계가 많이 있는데, 각각은 인과적 증거 제공 측면에서 공유되고 고유한 장점과 한계를 가지고 있으며, "금 표준"은 무작위화된 통제 시험이다.

서로 다른 설계를 가진 여러 연구들에 걸쳐 일관된 인과적 증거의 잘 알려진 성공적인 입증은 흡연과 폐암, 그리고 혈압과 뇌졸중 사이의 확인된 인과관계를 포함한다. 그러나, 특정 결과에 대한 인과 위험 인자로 가정된 노출이 인과관계가 아닌 잘 수행된 무작위 통제 시행에 의해 나중에 보여질 때도 주목할 만한 실패가 있었다. 예를 들어 이전에는 호르몬 대체요법심혈관 질환을 예방할 수 있다고 생각했지만, 지금은 그런 이점이 없고 건강에까지 악영향을 미칠 수 있는 것으로 알려져 있다.[3] 또 다른 주목할 만한 예는 셀레늄과 전립선암이다. 일부 관찰 연구는 순환하는 셀레늄 수치(보통 다양한 식품과 식이요법 보조제를 통해 획득)와 전립선암의 낮은 위험 사이의 연관성을 발견했다. 그러나 셀레늄과 비타민E 암 예방 임상시험(SELECT)은 식이 셀레늄 보충제가 실제로 전립선암과 전립선암의 위험을 증가시켰고 제2형 당뇨병 위험 증가에 추가적인 오프타깃 효과를 보였다는 증거를 보여주었다.[4]

관찰 역학 연구와 무작위 통제 시험 사이의 그러한 불일치는 많은 관찰 역학 설계에서 사회적, 행동적 또는 생리학적 교란 요인의 함수일 가능성이 높으며, 이러한 요인은 특히 정확하고 통제하기 어렵다. 더욱이 무작위화된 통제 실험은 대개 비용이 많이 들고, 시간이 많이 걸리며, 많은 역학 조사 결과가 임상 실험에서 윤리적으로 복제될 수 없다.

멘델의 무작위화 정의 및 가정

멘델리안 무작위화(MR)는 근본적으로 계량학에서 나오는 기악 변수 방법이다. 이 방법은 관찰 데이터에서 관심 있는 결과에 대한 노출의 인과관계를 추정하기 위한 피폭에 대한 "프록시" 또는 "계기"로서 투입 피폭과 강하게 연관된 세균선 유전적 변동의 특성(일반적으로 단일 뉴클레오티드 폴리모르시즘 또는 SNP의 형태)을 사용한다. 사용되는 유전적 변화는 노출 패턴에 대한 잘 이해된 영향(예: 담배를 많이 피우는 성향) 또는 수정 가능한 노출에 의해 생성된 영향을 모방하는 효과(예: 혈중 콜레스테롤[1] 증가)를 가질 것이다. 중요한 것은 유전자형이 관심 노출에 미치는 영향을 통해 질병 상태에 간접적으로만 영향을 미쳐야 한다는 것이다.[5]

전통적으로 멘델의 무작위화 프레임워크와 그 핵심 가정을 나타내는 데 사용된 지시된 악순환 그래프.

유전형은 감수분열 동안 부모로부터 자손에게 전달될 때 무작위로 할당되므로, 모집단 수준에서 피폭과 관련된 유전적 변동에 의해 정의된 개인 그룹은 일반적으로 관찰 역학 연구를 괴롭히는 교란 요인과 크게 관련이 없어야 한다. 생식선 유전적 변화(즉 유전될 수 있는 것)는 또한 임시로 수정되고 어떤 결과나 질병의 시작에 의해 수정되지 않아 역인자를 배제한다. 또한, 현대의 유전자형화 기술의 개선을 고려할 때, 측정 오류와 체계적 오분류는 종종 유전자 데이터로 인해 낮다. 이런 점에서 멘델리안 무작위화는 "자연의 무작위화된 통제 실험"과 유사하다고 생각할 수 있다.

멘델의 무작위화에는 세 가지 핵심 기악 변수 가정이 필요하다.[6] 즉:

  1. 피폭의 도구로 사용되는 유전적 변종은 피폭과 관련이 있다. 이것은 "관련성" 가정이라고 알려져 있다.
  2. 유전적 변종과 관심의 결과에 대한 일반적인 원인(즉 교란 요인)은 없다. 이것은 "독립성" 또는 "교환성" 가정이라고 알려져 있다.
  3. 유전적 변종과 결과 사이에는 노출을 통한 것 외에는 독립적인 경로가 없다. 이것은 "제외적 제한" 또는 "수평적 흉측근" 가정이라고 알려져 있다.

첫 번째 핵심 가정이 검증되도록 하기 위해 멘델의 무작위화는 유전적 변동과 관심 노출 사이의 특성화된 연관성을 요구한다. 이러한 연구들은 대개 유전체 관련 연구들에서 소싱되지만 후보 유전자 연구가 될 수도 있다. 두 번째 가정은 모집단 하부구조(예: 유전자형과 결과 사이의 연관성을 유도하는 지리적 요인), 유전자형과 관련 없는 짝짓기 선택(즉, 무작위 짝짓기 또는 범미시아) 및 왕조적 영향(즉, 부모의 표현형에서 부모의 유전자형을 직접 표현하는 경우)이 없는 것에 의존한다. 자손의 표현형식에 영향을 미치다.

통계분석

멘델리안 무작위화는 대개 관심 노출의 도구로 작용하는 유전적 변형이 있는 기악 변수 추정을 통해 적용된다.[7] 이는 단일 데이터 집합의 개인에 대한 유전자 변형, 노출 및 관심 결과에 대한 데이터를 사용하거나, 별도의 데이터 집합의 유전자 변종과 피폭 사이의 연관성과 유전자 변종과 결과 사이의 연관성에 대한 요약 데이터를 사용하여 구현할 수 있다. 이 방법은 또한 비만이 소득에 미치는 영향과 다른 노동시장 결과를 연구하는 경제 연구에도 사용되었다.[8]

단일 데이터 집합을 사용하는 경우 적용되는 추정 방법은 2단계 최소 제곱과 같은 다른 기수 변수 추정에서 자주 사용되는 방법이다.[9] 여러 유전적 변형이 노출과 연관되어 있는 경우 그것들은 개별적으로 계기로 사용하거나 단일 계기로 사용되는 알레르 점수를 생성하기 위해 결합될 수 있다.

요약 데이터를 이용한 분석은 게놈 전체 연관성 연구의 데이터를 적용하는 경우가 많다. 이 경우 유전적 변종과 피폭 사이의 연관성은 피폭에 대한 게놈 전체 연관성 연구에 의해 생성된 요약 결과에서 취해진다. 동일한 유전적 변종과 결과 사이의 연관성은 그 결과에 대한 게놈 전체 연관성 연구에 의해 생성된 요약 결과로부터 얻어진다. 이 두 가지 요약 결과는 MR 추정치를 얻기 위해 사용된다. 정의 사용:

effect of genetic variant on the exposure . estimated effect of genetic variant g on the outcome , 추정된 이 효과의 표준 오차. R Y{\Y에 대한 X 의 인과 영향에 대한 MR 추정치

단일 유전자 변종에서 MR 추정치는 Wald 비율에서 얻을 수 있다.

다중 유전자 변형을 사용할 경우, 각 유전자 변형에 대한 개별 비율은 추정의 불확실성에 의해 가중되는 역분산 가중치를 사용하여 결합된다.[10] 이를 통해 IVW 추정치는 다음과 같이 계산할 수 있다.

또는 유전적 변종-결과 연관성을 사용하고 유전적 변종-노출 연관성을 피폭으로 사용한 선형 회귀 분석에서도 동일한 추정치를 얻을 수 있다. 이 선형 회귀 분석은 유전적 변수 결과 연관성의 불확실성에 의해 가중되며 상수를 포함하지 않는다.

이러한 방법은 핵심 기악 변수 가정 하에서 결과에 대한 노출의 인과적 효과에 대한 신뢰성 있는 추정치만 제공한다. 세 번째 가정, 즉 어떤 종류의 수평적 플리오트로피에서 신뢰할 수 있는 결과를 제공하는 강력한 대안적 방법을 사용할 수 있다.[11] 또한 왕조 효과와 같은 두 번째 IV 가정 위반에서 발생하는 일부 편향은 형제자매나 부모 및 그 자손이 포함된 데이터를 사용하여 극복할 수 있다.[12]

역사

멘델의 무작위화 방법은 그레고르 멘델의 유전적 유산에 관한 원저로부터 파생된 두 가지 원리에 의존한다. 그것의 기반은 멘델의 법칙 즉 1) 이질균세포의 동일한 수의 균세포에서 두 알로모르프를 완전히 분리하는 분리법칙과 2) 서로 독립적으로 분리하는 분리형 알로모르프 쌍이 1906년 로버트 히스락(Robert Heath Lock)에 의해 처음 출판된 것이다. 멘델리안 무작위화의 또 다른 시조자는 비실험적 데이터에서 인과적 추론을 하는 데 사용되는 인과관계도의 한 형태인 경로 분석을 도입한 세월 라이트다. 방법은 인과적인 앵커에 의존하고 있으며, 그의 대부분의 예에 있는 앵커들은 MR.의 기초가 되는 멘델의 유산에 의해 제공되었다. MR의 논리의 또 다른 요소는 기악 유전자인데, 이 개념은 토마스 헨리 헌트에 의해 소개되었다. 이것은 유전적 과정에 대한 추론을 하기 위해 유전자의 생리학을 이해할 필요가 없어졌기 때문에 중요하다. 그 시기부터 문헌에는 수정 가능한 위험요인에 대한 추론을 하기 위해 분자유전학을 이용한 연구의 예가 포함되어 있는데, 이것이 MR.의 본질이다 1979년 N-아세틸전달효소 표현형을 닻으로 삼아 흡연과 아민 등 다양한 노출에 대한 추론을 이끌어낸 게리 로어와 동료들의 연구결과가 있다.방광암 위험요인으로서의 염료 [13] 또 다른 예는 낮은 혈중 콜레스테롤 수치와 암 위험 증가 사이의 관찰된 관계를 연구하기 위해 아폴리포프로틴 E alle을 기악 변수 닻으로 사용한 연구 설계를 주창했던 마르틴 카탄의 작품이다.[14] 사실, "멘델리안 무작위화"라는 용어는 1991년 리처드 그레이와 키스 휘틀리에 의해 다소 다른 맥락에서 인쇄에 처음 사용되었다; 기악 변수 추정을 허용하는 방법에서 사용되었지만 유전자형이 아닌 멘델리안 상속에 의존하는 접근법과 관련이 있다.[15] 2003년 논문에서 샤 에브라힘과 조지 데이비 스미스는 기악변수 분석에서 인과관계를 이해하기 위해 세균라인 유전적 변형을 사용하는 방법을 다시 설명하기 위해 이 용어를 사용하고 있으며, 현재 널리 사용되고 있으며 그 의미를 귀속시키고 있는 것이 바로 이 방법론이다.[16] 멘델리안 무작위화 방법은 현재 인과적 역학에서 널리 채택되고 있으며, 과학 문헌에 보고된 MR 연구의 수는 2003년 논문 이후 매년 증가하고 있다. 2021년에는 Mendelian 무작위화 연구의 독자와 검토자가 출판 연구의 타당성과 효용성을 평가할 수 있도록 지원하기 위해 STROBE-MR 가이드라인이 발표되었다.[17]

참조

  1. ^ a b Katan MB (March 1986). "Apolipoprotein E isoforms, serum cholesterol, and cancer". Lancet. 1 (8479): 507–8. doi:10.1016/s0140-6736(86)92972-7. PMID 2869248. S2CID 38327985.
  2. ^ Gray R, Wheatley K (1991). "How to avoid bias when comparing bone marrow transplantation with chemotherapy". Bone Marrow Transplantation. 7 Suppl 3: 9–12. PMID 1855097.
  3. ^ Rossouw JE, Anderson GL, Prentice RL, LaCroix AZ, Kooperberg C, Stefanick ML, et al. (July 2002). "Risks and benefits of estrogen plus progestin in healthy postmenopausal women: principal results From the Women's Health Initiative randomized controlled trial". JAMA. 288 (3): 321–33. doi:10.1001/jama.288.3.321. PMID 12117397.
  4. ^ Klein EA, Thompson IM, Tangen CM, Crowley JJ, Lucia MS, Goodman PJ, et al. (October 2011). "Vitamin E and the risk of prostate cancer: the Selenium and Vitamin E Cancer Prevention Trial (SELECT)". JAMA. 306 (14): 1549–56. doi:10.1001/jama.2011.1437. PMC 4169010. PMID 21990298.
  5. ^ Holmes MV, Ala-Korpela M, Smith GD (October 2017). "Mendelian randomization in cardiometabolic disease: challenges in evaluating causality". Nature Reviews. Cardiology. 14 (10): 577–590. doi:10.1038/nrcardio.2017.78. PMC 5600813. PMID 28569269.
  6. ^ Wade, Kaitlin (2021). "MR Dictionary". MR Dictionary.{{cite web}}: CS1 maint : url-status (링크)
  7. ^ Didelez, Vanessa; Sheehan, Nuala (August 2007). "Mendelian randomization as an instrumental variable approach to causal inference". Statistical Methods in Medical Research. 16 (4): 309–330. doi:10.1177/0962280206077743. ISSN 0962-2802. S2CID 6236517.
  8. ^ Böckerman P, Cawley J, Viinikainen J, Lehtimäki T, Rovio S, Seppälä I, et al. (January 2019). "The effect of weight on labor market outcomes: An application of genetic instrumental variables". Health Economics. 28 (1): 65–77. doi:10.1002/hec.3828. PMC 6585973. PMID 30240095.
  9. ^ Wooldridge, Jeffrey M. (2010). Econometric analysis of cross section and panel data (2nd ed.). Cambridge, Mass.: MIT Press. ISBN 978-0-262-23258-6. OCLC 627701062.
  10. ^ Burgess, Stephen; Butterworth, Adam; Thompson, Simon G. (2013). "Mendelian Randomization Analysis With Multiple Genetic Variants Using Summarized Data". Genetic Epidemiology. 37 (7): 658–665. doi:10.1002/gepi.21758. ISSN 0741-0395. PMC 4377079. PMID 24114802.
  11. ^ Hemani, Gibran; Bowden, Jack; Davey Smith, George (2018-08-01). "Evaluating the potential role of pleiotropy in Mendelian randomization studies". Human Molecular Genetics. 27 (R2): R195–R208. doi:10.1093/hmg/ddy163. ISSN 0964-6906. PMC 6061876. PMID 29771313.
  12. ^ Brumpton, Ben; Sanderson, Eleanor; Heilbron, Karl; Hartwig, Fernando Pires; Harrison, Sean; Vie, Gunnhild Åberge; Cho, Yoonsu; Howe, Laura D.; Hughes, Amanda; Boomsma, Dorret I.; Havdahl, Alexandra (2020). "Avoiding dynastic, assortative mating, and population stratification biases in Mendelian randomization through within-family analyses". Nature Communications. 11 (1): 3519. Bibcode:2020NatCo..11.3519B. doi:10.1038/s41467-020-17117-4. ISSN 2041-1723. PMC 7360778. PMID 32665587.
  13. ^ Lower, G. M.; Nilsson, T.; Nelson, C. E.; Wolf, H.; Gamsky, T. E.; Bryan, G. T. (1979). "N-Acetyltransferase phenotype and risk in urinary bladder cancer: approaches in molecular epidemiology. Preliminary results in Sweden and Denmark". Environmental Health Perspectives. 29: 71–79. doi:10.1289/ehp.792971. ISSN 0091-6765. PMC 1637362. PMID 510245.
  14. ^ Katan, MartijnB. (1986). "Apoupoprotein e Isoforms, Serum Cholesterol, and Cancer". The Lancet. 327 (8479): 507–508. doi:10.1016/S0140-6736(86)92972-7. S2CID 38327985.
  15. ^ Gray, R.; Wheatley, K. (1991). "How to avoid bias when comparing bone marrow transplantation with chemotherapy". Bone Marrow Transplantation. 7 Suppl 3: 9–12. ISSN 0268-3369. PMID 1855097.
  16. ^ Smith, George Davey; Ebrahim, Shah (2003). "'Mendelian randomization': can genetic epidemiology contribute to understanding environmental determinants of disease?". International Journal of Epidemiology. 32 (1): 1–22. doi:10.1093/ije/dyg070. ISSN 0300-5771. PMID 12689998.
  17. ^ Skrivankova, Veronika W.; Richmond, Rebecca C.; Woolf, Benjamin A. R.; Davies, Neil M.; Swanson, Sonja A.; VanderWeele, Tyler J.; Timpson, Nicholas J.; Higgins, Julian P. T.; Dimou, Niki; Langenberg, Claudia; Loder, Elizabeth W. (2021-10-26). "Strengthening the reporting of observational studies in epidemiology using mendelian randomisation (STROBE-MR): explanation and elaboration". BMJ. 375: n2233. doi:10.1136/bmj.n2233. ISSN 1756-1833. PMC 8546498. PMID 34702754.

추가 읽기

외부 링크