멀티팩터 차원 축소

Multifactor dimensionality reduction

멀티팩터 차원 축소(MDR)종속 변수 또는 [2][3][4][5][6][7][8]클래스 변수에 영향을 미치기 위해 상호작용하는 속성 또는 독립 변수의 조합을 검출하고 특성화하기 위한 통계적 접근법입니다.[1]MDR은 이진 결과에 영향을 미치는 이산 변수 간의 비가법적 상호작용을 식별하도록 특별히 설계되었으며 로지스틱 회귀 분석과 같은 전통적인 통계 방법에 대한 비모수적이고 모델이 없는 대안으로 간주됩니다.

MDR 방식의 기본은 2개 이상의 변수 또는 Atribut을 1개의 [9]Atribut으로 변환하는 건설적인 유도 알고리즘 또는 기능 엔지니어링 알고리즘입니다.새 속성을 구성하는 이 프로세스는 데이터의 표현 공간을 변경합니다.[10]최종 목표는 데이터의 원래 표현보다 클래스 변수의 예측이 개선되도록 속성 간의 비선형 또는 비가산적 상호작용을 쉽게 검출할 수 있는 표현을 만들거나 발견하는 것이다.

예시

배타적 OR(XOR) 기능을 사용하는 다음과 같은 간단한 예를 생각해 보십시오.XOR은 선형으로 분리할 수 없는 함수의 예로서 데이터 마이닝 및 기계 학습에서 일반적으로 사용되는 논리 연산자입니다.아래 표는 속성(X1 및 X2)과 클래스 변수(Y) 간의 관계가 XOR 함수에 의해 Y = X1 XOR X2로 정의되는 단순한 데이터 집합을 나타냅니다.

표 1.

X1 X2 Y
0 0 0
0 1 1
1 0 1
1 1 0

기계학습 알고리즘은 X1과 X2에 관한 정보를 사용하여 Y를 정확하게 예측하기 위해 XOR 함수를 검출하거나 근사해야 합니다.대안 전략은 먼저 예측 모델링을 용이하게 하기 위해 건설적 유도를 사용하여 데이터의 표현을 변경하는 것입니다.MDR 알고리즘은 데이터(X1 및 X2)의 표현을 다음과 같이 변경합니다.MDR은 2개의 Atribute를 선택하는 것으로 시작합니다.이 간단한 예에서는 X1과 X2가 선택됩니다.X1 및 X2의 각 값의 조합을 조사하고 Y=1 및/또는 Y=0의 횟수를 카운트한다.이 간단한 예에서는 X1=0과 X2=0의 조합에 대해 Y=1이 0번 발생하고 Y=0이 1번 발생합니다.MDR에서는 이들 카운트의 비율이 계산되어 고정 임계값과 비교됩니다.여기서 카운트 비율은 0/1로 고정 임계값 1보다 작습니다.0/1 < 1 이므로, 새로운 어트리뷰트(Z)를 0 으로 부호화합니다.비율이 1보다 크면 Z를 1로 인코딩합니다.이 프로세스는 X1과 X2의 모든 값의 고유한 조합에 대해 반복됩니다.표 2는 데이터의 새로운 변혁을 나타내고 있습니다.

표 2

Z Y
0 0
1 1
1 1
0 0

머신러닝 알고리즘은 이제 적절한 예측 함수를 찾기 위해 할 일이 훨씬 적어졌습니다.실제로 이 매우 간단한 예제에서 Y = Z 함수의 분류 정확도는 1입니다.MDR과 같은 건설적인 유도 방법의 좋은 특징은 데이터의 새로운 표현을 분석하기 위해 모든 데이터 마이닝 또는 기계 학습 방법을 사용할 수 있다는 것입니다.의사결정 트리, 신경 네트워크 또는 순진한 베이즈 분류기는 균형 잡힌 정확도[11][12] 및 상호 정보와 [13]같은 모델 품질의 측정과 함께 사용될 수 있다.

MDR을 사용한 머신 러닝

위의 그림과 같이 MDR의 기본 구성 유도 알고리즘은 매우 단순합니다.그러나 실제 데이터에서 마이닝 패턴을 구현하려면 계산이 복잡할 수 있습니다.모든 기계 학습 알고리즘과 마찬가지로 과적합에 대한 우려가 항상 있습니다.즉, 기계 학습 알고리즘은 완전히 랜덤한 데이터에서 패턴을 찾는 데 능숙합니다.보고된 패턴이 중요한 신호인지 단순한 우연인지 판단하는 것은 어려운 경우가 많습니다.한 가지 접근방식은 교차 [14][15][16][17]검증과 같은 방법을 사용하여 독립 데이터 세트에 대한 모델의 일반화 가능성을 추정하는 것이다.랜덤 데이터를 설명하는 모형은 일반적으로 일반화되지 않습니다.또 다른 접근법은 데이터의 랜덤 순열을 많이 생성하여 오버핏 기회가 주어졌을 때 데이터 마이닝 알고리즘이 무엇을 발견하는지 확인하는 것입니다.치환 검정을 사용하면 결과에 [18][19][20][21]대한 경험적 p-값을 생성할 수 있습니다.독립된 데이터의 복제는 MDR 모델에 대한 증거를 제공할 수도 있지만 데이터 [22][23]세트의 차이에 민감할 수 있습니다.이러한 접근방식은 모두 MDR 모델의 선택과 평가에 도움이 되는 것으로 나타났습니다.기계 학습 연습에서 중요한 단계는 해석입니다.MDR에는 엔트로피[9][24] 분석 및 경로 [25][26]분석을 포함한 몇 가지 접근방식이 사용되었습니다.유전자-유전자 상호작용을 모델링하기 위해 MDR을 사용하기 위한 팁과 접근법이 [7][27]검토되었다.

MDR의 확장

MDR에는 수많은 확장기능이 도입되어 있습니다.여기에는 패밀리 기반 방법,[28][29][30] 퍼지 방법,[31] 공변량 조정,[32] 승산비,[33] 위험 점수,[34] 생존 방법,[35][36] 강력한 방법,[37] 정량적 [38][39]특성에 대한 방법 등이 포함된다.

MDR의 응용 프로그램

MDR 대부분 심방 fibrillation,[40][41]autism,[42]방광 cancer,[43][44][45]유방 cancer,[46]심혈관 disease,[14]hypertension,[47][48][49]obesity,[50][51]췌장 cancer,[52]전립선 cancer[53][54][55]과 tubercu 같은 일반적인 인간 질병의 유전 연구에서gene-gene 상호 작용이나 상위 검출에 적용되어 왔다.losis.[56]약리학적 [57][58][59]결과의 유전자 분석과 같은 다른 생물의학적 문제에도 적용되어 왔다.가장 중요한 과제는 MDR을 GWAS([60]Genome Wide Association Studies)와 같은 빅데이터로 확장하는 것입니다.몇 가지 접근법이 사용되었습니다.1가지 접근방식은 MDR 분석 [61]전에 기능을 필터링하는 것입니다.이는 [62]BioFilter와 같은 도구를 통해 생물학적 지식을 사용하여 수행할 수 있습니다.ReliefF와 [63]같은 계산 도구를 사용하여 수행할 수도 있습니다.또 다른 접근법은 유전자 프로그래밍과 같은 확률적 검색 알고리즘을 사용하여 특징 [64]조합의 검색 공간을 탐색하는 것이다.또 다른 접근방식은 고성능 [65][66][67]컴퓨팅을 사용한 무차별 검색입니다.

실장

「 」를 참조해 주세요.

레퍼런스

  1. ^ McKinney, Brett A.; Reif, David M.; Ritchie, Marylyn D.; Moore, Jason H. (1 January 2006). "Machine learning for detecting gene-gene interactions: a review". Applied Bioinformatics. 5 (2): 77–88. doi:10.2165/00822942-200605020-00002. ISSN 1175-5636. PMC 3244050. PMID 16722772.
  2. ^ Ritchie, Marylyn D.; Hahn, Lance W.; Roodi, Nady; Bailey, L. Renee; Dupont, William D.; Parl, Fritz F.; Moore, Jason H. (1 July 2001). "Multifactor-Dimensionality Reduction Reveals High-Order Interactions among Estrogen-Metabolism Genes in Sporadic Breast Cancer". The American Journal of Human Genetics. 69 (1): 138–147. doi:10.1086/321276. ISSN 0002-9297. PMC 1226028. PMID 11404819.
  3. ^ Ritchie, Marylyn D.; Hahn, Lance W.; Moore, Jason H. (1 February 2003). "Power of multifactor dimensionality reduction for detecting gene-gene interactions in the presence of genotyping error, missing data, phenocopy, and genetic heterogeneity". Genetic Epidemiology. 24 (2): 150–157. doi:10.1002/gepi.10218. ISSN 1098-2272. PMID 12548676. S2CID 6335612.
  4. ^ Hahn, L. W.; Ritchie, M. D.; Moore, J. H. (12 February 2003). "Multifactor dimensionality reduction software for detecting gene-gene and gene-environment interactions". Bioinformatics. 19 (3): 376–382. doi:10.1093/bioinformatics/btf869. ISSN 1367-4803. PMID 12584123.
  5. ^ W., Hahn, Lance; H., Moore, Jason (1 January 2004). "Ideal Discrimination of Discrete Clinical Endpoints Using Multilocus Genotypes". In Silico Biology. 4 (2). ISSN 1386-6338.
  6. ^ Moore, Jason H. (1 November 2004). "Computational analysis of gene-gene interactions using multifactor dimensionality reduction". Expert Review of Molecular Diagnostics. 4 (6): 795–803. doi:10.1586/14737159.4.6.795. ISSN 1473-7159. PMID 15525222. S2CID 26324399.
  7. ^ a b Moore, JasonH.; Andrews, PeterC. (1 January 2015). Moore, Jason H.; Williams, Scott M. (eds.). Epistasis. Methods in Molecular Biology. Vol. 1253. Springer New York. pp. 301–314. doi:10.1007/978-1-4939-2155-3_16. ISBN 9781493921546. PMID 25403539.
  8. ^ Moore, Jason H. (1 January 2010). Detecting, characterizing, and interpreting nonlinear gene-gene interactions using multifactor dimensionality reduction. Advances in Genetics. Vol. 72. pp. 101–116. doi:10.1016/B978-0-12-380862-2.00005-9. ISBN 9780123808622. ISSN 0065-2660. PMID 21029850.
  9. ^ a b Moore, Jason H.; Gilbert, Joshua C.; Tsai, Chia-Ti; Chiang, Fu-Tien; Holden, Todd; Barney, Nate; White, Bill C. (21 July 2006). "A flexible computational framework for detecting, characterizing, and interpreting statistical patterns of epistasis in genetic studies of human disease susceptibility". Journal of Theoretical Biology. 241 (2): 252–261. doi:10.1016/j.jtbi.2005.11.036. PMID 16457852.
  10. ^ Michalski, R (February 1983). "A theory and methodology of inductive learning". Artificial Intelligence. 20 (2): 111–161. doi:10.1016/0004-3702(83)90016-4.
  11. ^ Velez, Digna R.; White, Bill C.; Motsinger, Alison A.; Bush, William S.; Ritchie, Marylyn D.; Williams, Scott M.; Moore, Jason H. (1 May 2007). "A balanced accuracy function for epistasis modeling in imbalanced datasets using multifactor dimensionality reduction". Genetic Epidemiology. 31 (4): 306–315. doi:10.1002/gepi.20211. ISSN 0741-0395. PMID 17323372. S2CID 28156181.
  12. ^ Namkung, Junghyun; Kim, Kyunga; Yi, Sungon; Chung, Wonil; Kwon, Min-Seok; Park, Taesung (1 February 2009). "New evaluation measures for multifactor dimensionality reduction classifiers in gene-gene interaction analysis". Bioinformatics. 25 (3): 338–345. doi:10.1093/bioinformatics/btn629. ISSN 1367-4811. PMID 19164302.
  13. ^ Bush, William S.; Edwards, Todd L.; Dudek, Scott M.; McKinney, Brett A.; Ritchie, Marylyn D. (1 January 2008). "Alternative contingency table measures improve the power and detection of multifactor dimensionality reduction". BMC Bioinformatics. 9: 238. doi:10.1186/1471-2105-9-238. ISSN 1471-2105. PMC 2412877. PMID 18485205.
  14. ^ a b Coffey, Christopher S.; Hebert, Patricia R.; Ritchie, Marylyn D.; Krumholz, Harlan M.; Gaziano, J. Michael; Ridker, Paul M.; Brown, Nancy J.; Vaughan, Douglas E.; Moore, Jason H. (1 January 2004). "An application of conditional logistic regression and multifactor dimensionality reduction for detecting gene-gene Interactions on risk of myocardial infarction: The importance of model validation". BMC Bioinformatics. 5: 49. doi:10.1186/1471-2105-5-49. ISSN 1471-2105. PMC 419697. PMID 15119966.
  15. ^ Motsinger, Alison A.; Ritchie, Marylyn D. (1 September 2006). "The effect of reduction in cross-validation intervals on the performance of multifactor dimensionality reduction". Genetic Epidemiology. 30 (6): 546–555. doi:10.1002/gepi.20166. ISSN 1098-2272. PMID 16800004. S2CID 20573232.
  16. ^ Gory, Jeffrey J.; Sweeney, Holly C.; Reif, David M.; Motsinger-Reif, Alison A. (5 November 2012). "A comparison of internal model validation methods for multifactor dimensionality reduction in the case of genetic heterogeneity". BMC Research Notes. 5: 623. doi:10.1186/1756-0500-5-623. ISSN 1756-0500. PMC 3599301. PMID 23126544.
  17. ^ Winham, Stacey J.; Slater, Andrew J.; Motsinger-Reif, Alison A. (22 July 2010). "A comparison of internal validation techniques for multifactor dimensionality reduction". BMC Bioinformatics. 11: 394. doi:10.1186/1471-2105-11-394. ISSN 1471-2105. PMC 2920275. PMID 20650002.
  18. ^ Pattin, Kristine A.; White, Bill C.; Barney, Nate; Gui, Jiang; Nelson, Heather H.; Kelsey, Karl T.; Andrew, Angeline S.; Karagas, Margaret R.; Moore, Jason H. (1 January 2009). "A computationally efficient hypothesis testing method for epistasis analysis using multifactor dimensionality reduction". Genetic Epidemiology. 33 (1): 87–94. doi:10.1002/gepi.20360. ISSN 1098-2272. PMC 2700860. PMID 18671250.
  19. ^ Greene, Casey S.; Himmelstein, Daniel S.; Nelson, Heather H.; Kelsey, Karl T.; Williams, Scott M.; Andrew, Angeline S.; Karagas, Margaret R.; Moore, Jason H. (1 October 2009). Biocomputing 2010. Pacific Symposium on Biocomputing. Pacific Symposium on Biocomputing. WORLD SCIENTIFIC. pp. 327–336. doi:10.1142/9789814295291_0035. ISBN 9789814299473. PMC 2916690. PMID 19908385.
  20. ^ Dai, Hongying; Bhandary, Madhusudan; Becker, Mara; Leeder, J. Steven; Gaedigk, Roger; Motsinger-Reif, Alison A. (22 May 2012). "Global tests of P-values for multifactor dimensionality reduction models in selection of optimal number of target genes". BioData Mining. 5 (1): 3. doi:10.1186/1756-0381-5-3. ISSN 1756-0381. PMC 3508622. PMID 22616673.
  21. ^ Motsinger-Reif, Alison A. (30 December 2008). "The effect of alternative permutation testing strategies on the performance of multifactor dimensionality reduction". BMC Research Notes. 1: 139. doi:10.1186/1756-0500-1-139. ISSN 1756-0500. PMC 2631601. PMID 19116021.
  22. ^ Greene, Casey S.; Penrod, Nadia M.; Williams, Scott M.; Moore, Jason H. (2 June 2009). "Failure to Replicate a Genetic Association May Provide Important Clues About Genetic Architecture". PLOS ONE. 4 (6): e5639. Bibcode:2009PLoSO...4.5639G. doi:10.1371/journal.pone.0005639. ISSN 1932-6203. PMC 2685469. PMID 19503614.
  23. ^ Piette, Elizabeth R.; Moore, Jason H. (19 April 2017). Improving the Reproducibility of Genetic Association Results Using Genotype Resampling Methods. Applications of Evolutionary Computation. Lecture Notes in Computer Science. Vol. 10199. pp. 96–108. doi:10.1007/978-3-319-55849-3_7. ISBN 978-3-319-55848-6.
  24. ^ Moore, Jason H.; Hu, Ting (1 January 2015). Epistasis analysis using information theory. Methods in Molecular Biology. Vol. 1253. pp. 257–268. doi:10.1007/978-1-4939-2155-3_13. ISBN 978-1-4939-2154-6. ISSN 1940-6029. PMID 25403536.
  25. ^ Kim, Nora Chung; Andrews, Peter C.; Asselbergs, Folkert W.; Frost, H. Robert; Williams, Scott M.; Harris, Brent T.; Read, Cynthia; Askland, Kathleen D.; Moore, Jason H. (28 July 2012). "Gene ontology analysis of pairwise genetic associations in two genome-wide studies of sporadic ALS". BioData Mining. 5 (1): 9. doi:10.1186/1756-0381-5-9. ISSN 1756-0381. PMC 3463436. PMID 22839596.
  26. ^ Cheng, Samantha; Andrew, Angeline S.; Andrews, Peter C.; Moore, Jason H. (1 January 2016). "Complex systems analysis of bladder cancer susceptibility reveals a role for decarboxylase activity in two genome-wide association studies". BioData Mining. 9: 40. doi:10.1186/s13040-016-0119-z. PMC 5154053. PMID 27999618.
  27. ^ Gola, Damian; Mahachie John, Jestinah M.; van Steen, Kristel; König, Inke R. (1 March 2016). "A roadmap to multifactor dimensionality reduction methods". Briefings in Bioinformatics. 17 (2): 293–308. doi:10.1093/bib/bbv038. ISSN 1477-4054. PMC 4793893. PMID 26108231.
  28. ^ Martin, E. R.; Ritchie, M. D.; Hahn, L.; Kang, S.; Moore, J. H. (1 February 2006). "A novel method to identify gene-gene effects in nuclear families: the MDR-PDT". Genetic Epidemiology. 30 (2): 111–123. doi:10.1002/gepi.20128. ISSN 0741-0395. PMID 16374833. S2CID 25772215.
  29. ^ Lou, Xiang-Yang; Chen, Guo-Bo; Yan, Lei; Ma, Jennie Z.; Mangold, Jamie E.; Zhu, Jun; Elston, Robert C.; Li, Ming D. (1 October 2008). "A combinatorial approach to detecting gene-gene and gene-environment interactions in family studies". American Journal of Human Genetics. 83 (4): 457–467. doi:10.1016/j.ajhg.2008.09.001. ISSN 1537-6605. PMC 2561932. PMID 18834969.
  30. ^ Cattaert, Tom; Urrea, Víctor; Naj, Adam C.; De Lobel, Lizzy; De Wit, Vanessa; Fu, Mao; Mahachie John, Jestinah M.; Shen, Haiqing; Calle, M. Luz (22 April 2010). "FAM-MDR: a flexible family-based multifactor dimensionality reduction technique to detect epistasis using related individuals". PLOS ONE. 5 (4): e10304. Bibcode:2010PLoSO...510304C. doi:10.1371/journal.pone.0010304. ISSN 1932-6203. PMC 2858665. PMID 20421984.
  31. ^ Leem, Sangseob; Park, Taesung (14 March 2017). "An empirical fuzzy multifactor dimensionality reduction method for detecting gene-gene interactions". BMC Genomics. 18 (Suppl 2): 115. doi:10.1186/s12864-017-3496-x. ISSN 1471-2164. PMC 5374597. PMID 28361694.
  32. ^ Gui, Jiang; Andrew, Angeline S.; Andrews, Peter; Nelson, Heather M.; Kelsey, Karl T.; Karagas, Margaret R.; Moore, Jason H. (1 January 2010). "A simple and computationally efficient sampling approach to covariate adjustment for multifactor dimensionality reduction analysis of epistasis". Human Heredity. 70 (3): 219–225. doi:10.1159/000319175. ISSN 1423-0062. PMC 2982850. PMID 20924193.
  33. ^ Chung, Yujin; Lee, Seung Yeoun; Elston, Robert C.; Park, Taesung (1 January 2007). "Odds ratio based multifactor-dimensionality reduction method for detecting gene-gene interactions". Bioinformatics. 23 (1): 71–76. doi:10.1093/bioinformatics/btl557. ISSN 1367-4811. PMID 17092990.
  34. ^ Dai, Hongying; Charnigo, Richard J.; Becker, Mara L.; Leeder, J. Steven; Motsinger-Reif, Alison A. (8 January 2013). "Risk score modeling of multiple gene to gene interactions using aggregated-multifactor dimensionality reduction". BioData Mining. 6 (1): 1. doi:10.1186/1756-0381-6-1. PMC 3560267. PMID 23294634.
  35. ^ Gui, Jiang; Moore, Jason H.; Kelsey, Karl T.; Marsit, Carmen J.; Karagas, Margaret R.; Andrew, Angeline S. (1 January 2011). "A novel survival multifactor dimensionality reduction method for detecting gene-gene interactions with application to bladder cancer prognosis". Human Genetics. 129 (1): 101–110. doi:10.1007/s00439-010-0905-5. ISSN 1432-1203. PMC 3255326. PMID 20981448.
  36. ^ Lee, Seungyeoun; Son, Donghee; Yu, Wenbao; Park, Taesung (1 December 2016). "Gene-Gene Interaction Analysis for the Accelerated Failure Time Model Using a Unified Model-Based Multifactor Dimensionality Reduction Method". Genomics & Informatics. 14 (4): 166–172. doi:10.5808/GI.2016.14.4.166. ISSN 1598-866X. PMC 5287120. PMID 28154507.
  37. ^ Gui, Jiang; Andrew, Angeline S.; Andrews, Peter; Nelson, Heather M.; Kelsey, Karl T.; Karagas, Margaret R.; Moore, Jason H. (1 January 2011). "A robust multifactor dimensionality reduction method for detecting gene-gene interactions with application to the genetic analysis of bladder cancer susceptibility". Annals of Human Genetics. 75 (1): 20–28. doi:10.1111/j.1469-1809.2010.00624.x. ISSN 1469-1809. PMC 3057873. PMID 21091664.
  38. ^ Gui, Jiang; Moore, Jason H.; Williams, Scott M.; Andrews, Peter; Hillege, Hans L.; van der Harst, Pim; Navis, Gerjan; Van Gilst, Wiek H.; Asselbergs, Folkert W. (1 January 2013). "A Simple and Computationally Efficient Approach to Multifactor Dimensionality Reduction Analysis of Gene-Gene Interactions for Quantitative Traits". PLOS ONE. 8 (6): e66545. Bibcode:2013PLoSO...866545G. doi:10.1371/journal.pone.0066545. ISSN 1932-6203. PMC 3689797. PMID 23805232.
  39. ^ Lou, Xiang-Yang; Chen, Guo-Bo; Yan, Lei; Ma, Jennie Z.; Zhu, Jun; Elston, Robert C.; Li, Ming D. (1 June 2007). "A generalized combinatorial approach for detecting gene-by-gene and gene-by-environment interactions with application to nicotine dependence". American Journal of Human Genetics. 80 (6): 1125–1137. doi:10.1086/518312. ISSN 0002-9297. PMC 1867100. PMID 17503330.
  40. ^ Tsai, Chia-Ti; Lai, Ling-Ping; Lin, Jiunn-Lee; Chiang, Fu-Tien; Hwang, Juey-Jen; Ritchie, Marylyn D.; Moore, Jason H.; Hsu, Kuan-Lih; Tseng, Chuen-Den (6 April 2004). "Renin-Angiotensin System Gene Polymorphisms and Atrial Fibrillation". Circulation. 109 (13): 1640–1646. doi:10.1161/01.CIR.0000124487.36586.26. ISSN 0009-7322. PMID 15023884.
  41. ^ Asselbergs, Folkert W.; Moore, Jason H.; van den Berg, Maarten P.; Rimm, Eric B.; de Boer, Rudolf A.; Dullaart, Robin P.; Navis, Gerjan; van Gilst, Wiek H. (1 January 2006). "A role for CETP TaqIB polymorphism in determining susceptibility to atrial fibrillation: a nested case control study". BMC Medical Genetics. 7: 39. doi:10.1186/1471-2350-7-39. ISSN 1471-2350. PMC 1462991. PMID 16623947.
  42. ^ Ma, D.Q.; Whitehead, P.L.; Menold, M.M.; Martin, E.R.; Ashley-Koch, A.E.; Mei, H.; Ritchie, M.D.; DeLong, G.R.; Abramson, R.K. (1 September 2005). "Identification of Significant Association and Gene-Gene Interaction of GABA Receptor Subunit Genes in Autism". The American Journal of Human Genetics. 77 (3): 377–388. doi:10.1086/433195. ISSN 0002-9297. PMC 1226204. PMID 16080114.
  43. ^ Andrew, Angeline S.; Nelson, Heather H.; Kelsey, Karl T.; Moore, Jason H.; Meng, Alexis C.; Casella, Daniel P.; Tosteson, Tor D.; Schned, Alan R.; Karagas, Margaret R. (1 May 2006). "Concordance of multiple analytical approaches demonstrates a complex relationship between DNA repair gene SNPs, smoking and bladder cancer susceptibility". Carcinogenesis. 27 (5): 1030–1037. doi:10.1093/carcin/bgi284. ISSN 0143-3334. PMID 16311243.
  44. ^ Andrew, Angeline S.; Karagas, Margaret R.; Nelson, Heather H.; Guarrera, Simonetta; Polidoro, Silvia; Gamberini, Sara; Sacerdote, Carlotta; Moore, Jason H.; Kelsey, Karl T. (1 January 2008). "DNA Repair Polymorphisms Modify Bladder Cancer Risk: A Multi-factor Analytic Strategy". Human Heredity. 65 (2): 105–118. doi:10.1159/000108942. ISSN 0001-5652. PMC 2857629. PMID 17898541.
  45. ^ Andrew, Angeline S.; Hu, Ting; Gu, Jian; Gui, Jiang; Ye, Yuanqing; Marsit, Carmen J.; Kelsey, Karl T.; Schned, Alan R.; Tanyos, Sam A. (1 January 2012). "HSD3B and gene-gene interactions in a pathway-based analysis of genetic susceptibility to bladder cancer". PLOS ONE. 7 (12): e51301. Bibcode:2012PLoSO...751301A. doi:10.1371/journal.pone.0051301. ISSN 1932-6203. PMC 3526593. PMID 23284679.
  46. ^ Cao, Jingjing; Luo, Chenglin; Yan, Rui; Peng, Rui; Wang, Kaijuan; Wang, Peng; Ye, Hua; Song, Chunhua (1 December 2016). "rs15869 at miRNA binding site in BRCA2 is associated with breast cancer susceptibility". Medical Oncology. 33 (12): 135. doi:10.1007/s12032-016-0849-2. ISSN 1357-0560. PMID 27807724. S2CID 26042128.
  47. ^ Williams, Scott M.; Ritchie, Marylyn D.; III, John A. Phillips; Dawson, Elliot; Prince, Melissa; Dzhura, Elvira; Willis, Alecia; Semenya, Amma; Summar, Marshall (1 January 2004). "Multilocus Analysis of Hypertension: A Hierarchical Approach". Human Heredity. 57 (1): 28–38. doi:10.1159/000077387. ISSN 0001-5652. PMID 15133310. S2CID 21079485.
  48. ^ Sanada, Hironobu; Yatabe, Junichi; Midorikawa, Sanae; Hashimoto, Shigeatsu; Watanabe, Tsuyoshi; Moore, Jason H.; Ritchie, Marylyn D.; Williams, Scott M.; Pezzullo, John C. (1 March 2006). "Single-Nucleotide Polymorphisms for Diagnosis of Salt-Sensitive Hypertension". Clinical Chemistry. 52 (3): 352–360. doi:10.1373/clinchem.2005.059139. ISSN 0009-9147. PMID 16439609.
  49. ^ Moore, Jason H.; Williams, Scott M. (1 January 2002). "New strategies for identifying gene-gene interactions in hypertension". Annals of Medicine. 34 (2): 88–95. doi:10.1080/07853890252953473. ISSN 0785-3890. PMID 12108579. S2CID 25398042.
  50. ^ De, Rishika; Verma, Shefali S.; Holzinger, Emily; Hall, Molly; Burt, Amber; Carrell, David S.; Crosslin, David R.; Jarvik, Gail P.; Kuivaniemi, Helena (1 February 2017). "Identifying gene-gene interactions that are highly associated with four quantitative lipid traits across multiple cohorts" (PDF). Human Genetics. 136 (2): 165–178. doi:10.1007/s00439-016-1738-7. ISSN 1432-1203. PMID 27848076. S2CID 24702049.
  51. ^ De, Rishika; Verma, Shefali S.; Drenos, Fotios; Holzinger, Emily R.; Holmes, Michael V.; Hall, Molly A.; Crosslin, David R.; Carrell, David S.; Hakonarson, Hakon (1 January 2015). "Identifying gene-gene interactions that are highly associated with Body Mass Index using Quantitative Multifactor Dimensionality Reduction (QMDR)". BioData Mining. 8: 41. doi:10.1186/s13040-015-0074-0. PMC 4678717. PMID 26674805.
  52. ^ Duell, Eric J.; Bracci, Paige M.; Moore, Jason H.; Burk, Robert D.; Kelsey, Karl T.; Holly, Elizabeth A. (1 June 2008). "Detecting pathway-based gene-gene and gene-environment interactions in pancreatic cancer". Cancer Epidemiology, Biomarkers & Prevention. 17 (6): 1470–1479. doi:10.1158/1055-9965.EPI-07-2797. ISSN 1055-9965. PMC 4410856. PMID 18559563.
  53. ^ Xu, Jianfeng; Lowey, James; Wiklund, Fredrik; Sun, Jielin; Lindmark, Fredrik; Hsu, Fang-Chi; Dimitrov, Latchezar; Chang, Baoli; Turner, Aubrey R. (1 November 2005). "The Interaction of Four Genes in the Inflammation Pathway Significantly Predicts Prostate Cancer Risk". Cancer Epidemiology, Biomarkers & Prevention. 14 (11): 2563–2568. doi:10.1158/1055-9965.EPI-05-0356. ISSN 1055-9965. PMID 16284379.
  54. ^ Lavender, Nicole A.; Rogers, Erica N.; Yeyeodu, Susan; Rudd, James; Hu, Ting; Zhang, Jie; Brock, Guy N.; Kimbro, Kevin S.; Moore, Jason H. (30 April 2012). "Interaction among apoptosis-associated sequence variants and joint effects on aggressive prostate cancer". BMC Medical Genomics. 5: 11. doi:10.1186/1755-8794-5-11. ISSN 1755-8794. PMC 3355002. PMID 22546513.
  55. ^ Lavender, Nicole A.; Benford, Marnita L.; VanCleave, Tiva T.; Brock, Guy N.; Kittles, Rick A.; Moore, Jason H.; Hein, David W.; Kidd, La Creis R. (16 November 2009). "Examination of polymorphic glutathione S-transferase (GST) genes, tobacco smoking and prostate cancer risk among men of African descent: a case-control study". BMC Cancer. 9: 397. doi:10.1186/1471-2407-9-397. ISSN 1471-2407. PMC 2783040. PMID 19917083.
  56. ^ Collins, Ryan L.; Hu, Ting; Wejse, Christian; Sirugo, Giorgio; Williams, Scott M.; Moore, Jason H. (18 February 2013). "Multifactor dimensionality reduction reveals a three-locus epistatic interaction associated with susceptibility to pulmonary tuberculosis". BioData Mining. 6 (1): 4. doi:10.1186/1756-0381-6-4. PMC 3618340. PMID 23418869.
  57. ^ Wilke, Russell A.; Reif, David M.; Moore, Jason H. (1 November 2005). "Combinatorial Pharmacogenetics". Nature Reviews Drug Discovery. 4 (11): 911–918. doi:10.1038/nrd1874. ISSN 1474-1776. PMID 16264434. S2CID 11643026.
  58. ^ Motsinger, Alison A.; Ritchie, Marylyn D.; Shafer, Robert W.; Robbins, Gregory K.; Morse, Gene D.; Labbe, Line; Wilkinson, Grant R.; Clifford, David B.; D'Aquila, Richard T. (1 November 2006). "Multilocus genetic interactions and response to efavirenz-containing regimens: an adult AIDS clinical trials group study". Pharmacogenetics and Genomics. 16 (11): 837–845. doi:10.1097/01.fpc.0000230413.97596.fa. ISSN 1744-6872. PMID 17047492. S2CID 26266170.
  59. ^ Ritchie, Marylyn D.; Motsinger, Alison A. (1 December 2005). "Multifactor dimensionality reduction for detecting gene-gene and gene-environment interactions in pharmacogenomics studies". Pharmacogenomics. 6 (8): 823–834. doi:10.2217/14622416.6.8.823. ISSN 1462-2416. PMID 16296945. S2CID 10348021.
  60. ^ Moore, Jason H.; Asselbergs, Folkert W.; Williams, Scott M. (15 February 2010). "Bioinformatics challenges for genome-wide association studies". Bioinformatics. 26 (4): 445–455. doi:10.1093/bioinformatics/btp713. ISSN 1367-4811. PMC 2820680. PMID 20053841.
  61. ^ Sun, Xiangqing; Lu, Qing; Mukherjee, Shubhabrata; Mukheerjee, Shubhabrata; Crane, Paul K.; Elston, Robert; Ritchie, Marylyn D. (1 January 2014). "Analysis pipeline for the epistasis search – statistical versus biological filtering". Frontiers in Genetics. 5: 106. doi:10.3389/fgene.2014.00106. PMC 4012196. PMID 24817878.
  62. ^ Pendergrass, Sarah A.; Frase, Alex; Wallace, John; Wolfe, Daniel; Katiyar, Neerja; Moore, Carrie; Ritchie, Marylyn D. (30 December 2013). "Genomic analyses with biofilter 2.0: knowledge driven filtering, annotation, and model development". BioData Mining. 6 (1): 25. doi:10.1186/1756-0381-6-25. PMC 3917600. PMID 24378202.
  63. ^ Moore, Jason H. (1 January 2015). "Epistasis analysis using ReliefF". Epistasis. Methods in Molecular Biology. Vol. 1253. pp. 315–325. doi:10.1007/978-1-4939-2155-3_17. ISBN 978-1-4939-2154-6. ISSN 1940-6029. PMID 25403540.
  64. ^ Moore, Jason H.; White, Bill C. (1 January 2007). Riolo, Rick; Soule, Terence; Worzel, Bill (eds.). Genetic Programming Theory and Practice IV. Genetic and Evolutionary Computation. Springer US. pp. 11–28. doi:10.1007/978-0-387-49650-4_2. ISBN 9780387333755. S2CID 55188394.
  65. ^ Greene, Casey S.; Sinnott-Armstrong, Nicholas A.; Himmelstein, Daniel S.; Park, Paul J.; Moore, Jason H.; Harris, Brent T. (1 March 2010). "Multifactor dimensionality reduction for graphics processing units enables genome-wide testing of epistasis in sporadic ALS". Bioinformatics. 26 (5): 694–695. doi:10.1093/bioinformatics/btq009. ISSN 1367-4811. PMC 2828117. PMID 20081222.
  66. ^ Bush, William S.; Dudek, Scott M.; Ritchie, Marylyn D. (1 September 2006). "Parallel multifactor dimensionality reduction: a tool for the large-scale analysis of gene-gene interactions". Bioinformatics. 22 (17): 2173–2174. doi:10.1093/bioinformatics/btl347. ISSN 1367-4811. PMC 4939609. PMID 16809395.
  67. ^ Sinnott-Armstrong, Nicholas A.; Greene, Casey S.; Cancare, Fabio; Moore, Jason H. (24 July 2009). "Accelerating epistasis analysis in human genetics with consumer graphics hardware". BMC Research Notes. 2: 149. doi:10.1186/1756-0500-2-149. ISSN 1756-0500. PMC 2732631. PMID 19630950.
  68. ^ Winham, Stacey J.; Motsinger-Reif, Alison A. (16 August 2011). "An R package implementation of multifactor dimensionality reduction". BioData Mining. 4 (1): 24. doi:10.1186/1756-0381-4-24. ISSN 1756-0381. PMC 3177775. PMID 21846375.
  69. ^ Calle, M. Luz; Urrea, Víctor; Malats, Núria; Van Steen, Kristel (1 September 2010). "mbmdr: an R package for exploring gene-gene interactions associated with binary or quantitative traits". Bioinformatics. 26 (17): 2198–2199. doi:10.1093/bioinformatics/btq352. ISSN 1367-4811. PMID 20595460.

추가 정보

  • Michalski, R.S., "지식 안내 컴퓨터 인덕션으로서의 패턴 인식", 컴퓨터 사이언스 리포트 학과 No. 927, 일리노이 대학교, Urbana, 1978년 6월