관련망 위상에 기초한 노이즈 제거 알고리즘
Denoising Algorithm based on Relevance network Topology![]() | 이 문서의 주제는 위키백과의 일반적인 저명성 지침을 충족하지 못할 수 있습니다. 찾기: " 토폴로지 기반 제거 – 뉴스 책, (2014년 12월 (이 메시지를 하는 방법 및 ) |
관련성 네트워크 토폴로지 기반 노이즈 제거 알고리즘(DART)은 노이즈 제거 [1]단계에 따라 유전자 발현 매트릭스의 경로에 대한 활동 점수를 추정하는 비지도 알고리듬입니다.DART에서는 가중치가 제거된 [1]네트워크의 노드 정도를 반영하는 가중 평균이 사용됩니다.노이즈 제거 단계는 데이터 세트와 일치하지 않는 이전 정보를 제거합니다.이 전략은 다른 생물학적 시스템 또는 [1]맥락에서 학습된 이전 모델을 기반으로 경로 활동에 대한 감독되지 않은 예측을 크게 개선합니다.
유전자 세트 농축 분석 방법과 같은 기존의 방법은 [2]추론을 시도합니다.그러나, 그것은 구조화된 유전자 목록을 구성하지 않았습니다. SPIA(Signaling Pathway Impact Analysis)[3]는 표현형 정보를 사용하여 두 표현형 사이의 경로 활성을 평가하는 방법입니다.그러나 개별 [3]샘플을 구별하는 데 사용될 수 있는 경로 유전자 하위 집합을 식별하지는 않습니다.CORG는 관련 유전자 부분 집합을 식별하는 데 사용됩니다.이것은 감독된 방법으로, 독립적인 데이터[1] 세트를 분석할 때 DART만큼 성능이 좋지 않습니다.
분자 경로 활성을 이해하는 것은 위험 평가, 임상 진단 및 치료에 매우 중요합니다.복잡한 게놈 데이터의 메타 분석은 종종 빅 데이터에서 유용한 정보를 추출하고 교란 요인을 제거하고 보다 합리적인 해석을 제공하는 것과 같은 어려움과 관련이 있습니다.더 나은 유전자 발현 예측을 제공하기 위해 관련 경로의 식별을 강조하기 위해 다양한 접근법이 취해졌습니다.
방법
전략.
- 경로에 관여하는 모든 유전자의 네트워크 구축
- 이전 규제 정보의 일관성 평가
- 일관성 없는 사전 정보 제거 - 노이즈 제거 단계
- 경로 활동 추정
Pearson 상관 관계는 처음에 전사 수준의 조절 유전자와 유전자 발현 데이터 세트 사이에서 계산되었습니다.그런 다음 상관 계수는 피셔의 변환을 거쳤습니다.
여기서ij c는 유전자 i와 j 사이의 상관 계수이고, 여기서ij γ는 귀무 가설에서 평균이 0이고 표준 편차 1/√n_s-3이며, ns는 종양 표본의 수입니다.p-값의 임계값은 0.0001로 설정되었습니다.유의한 상관 관계가 있는 유전자 쌍은 네트워크에서 관련성이 있는 것으로 간주됩니다.근처에 있는 유전자도 고려되는 활동 점수를 예측하려면:
여기서 ki는 유전자의 이웃 수이고, zi는 정규화된 z-점수이고, σi는 이진 변수입니다(즉, 1은 활성화 시 상향 조정됨을 의미하고 -1은 하향 조정됨을 의미함).이 단계는 활성화 수준을 추정하는 것입니다. 여기서 SWAV는 활동 점수입니다.그런 다음 경로 활성화 수준을 추정하기 위해 선형 회귀 모델이 적용되었습니다.따라서 tij와 pij는 관련된 t-통계량 및 p-값을 나타내며 p<0.05는 유의성을 나타냅니다.검증 데이터 세트 D의 일관성을 평가하기 위해 성능 측정값 Vij는 다음과 같이 표시됩니다.
여기서 S는 다음과 같이 정의됩니다.
() { ≤. > {\ S})= 0}> 0 S는 주어진 경로 쌍의 임계값 함수입니다.그리고 어디서
σ는ij 상관의 방향성을 알려주는 점수로, 반대 예측이 -1의 값으로 패널화됩니다. t는ij 경로 간 상관의 t-통계량입니다.성능 측도 Vij는 경로 간 상관 관계, 상관 방향 및 상관 관계의 크기에 대한 가중치의 중요성을 설명합니다.가설에서의 분포를 비교하기 위해 두 꼬리 쌍의 Wilcoxon 검정이 수행됩니다.장점 및 제한 사항: DART는 경로 데이터베이스의 사전 정보에서 경로 활동을 추론하는 데 향상된 성능과 높은 정확도를 제공합니다.DART를 실행하기 위해서는 기존의 정보와 대용량 데이터베이스가 필요합니다.다시 말해, DART는 처음부터 잘 확립된 사전 유전자 발현 데이터가 필요하며, 그런 다음 일관성 평가를 진행하고 관련 없는 정보를 노이즈 제거할 수 있습니다.
어플
DART는 암 유전체학에서 성공적으로 적용되고 사용되는 알고리즘입니다.DART 알고리듬은 유방암 및 폐암 유전자 발현 데이터 [1]세트에서 경로 활성 및 섭동 서명 활성을 추정하는 강력한 방법인 것으로 나타났습니다.유방조영술(Mammography)과 같은 영상 특성은 암 종양 진단에서 중요한 역할을 합니다.연구에 따르면 유방조영밀도가 증가한 여성은 유방암에 [4]걸릴 위험이 더 높습니다.에스트로겐 수용체 알파 유전자 1은 에스트로겐에 의해 활성화되는 에스트로겐 수용체 알파를 암호화합니다.ESR1의 다형성은 유방 밀도의 다른 수준의 차이를 통해 유방암 위험과 관련이 있습니다. DART는 ESR1 신호와 MMD 사이의 역 상관관계를 성공적으로 예측했습니다.시뮬레이션 및 실제 다차원 암 게놈 데이터에 사용할 수 있습니다.경로 활성화에 대한 보다 신뢰할 수 있는 예측을 제공하여 연관 연구에 도움이 될 것입니다.
레퍼런스
- ^ a b c d e Jiao, yan; Katherine Lawler (19 October 2011). "DART: Denoising Algorithm based on Relevance network Topology improves molecular pathway activity inference". BMC Bioinformatics. 12: 403. doi:10.1186/1471-2105-12-403. PMC 3228554. PMID 22011170.
- ^ Subramanian, Tamayo; Mukherjee, Ebert BL (Sep 30, 2005). "Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles". PNAS. 102 (43): 15545–50. doi:10.1073/pnas.0506580102. PMC 1239896. PMID 16199517.
- ^ a b Tarca AL, Draghici; Khatri P; Hassan SS (2009). "A novel signaling pathway impact analysis". Bioinformatics. 25 (1): 75–82. doi:10.1093/bioinformatics/btn577. PMC 2732297. PMID 18990722.
- ^ Li J, Eriksson L; Humphreys K; Czene K (2010). "Genetic variation in the estrogen metabolic pathway and mammographic density as an intermediate phenotype of breast cancer". Breast Cancer Res. 12 (2): R19. doi:10.1186/bcr2488. PMC 2879563. PMID 20214802.