읽기 프레임 열기
Open reading frame분자생물학에서 ORF(Open Reading Frame)는 시작 코돈과 정지 코돈 사이의 DNA 배열 범위로 정의됩니다.보통, 이것은 6개의 가능한 읽기 프레임 중 하나만 열리는 원핵 DNA 배열의 연구 영역 내에서 고려된다. (그러나 "읽기"는 DNA의 전사 및 번역에서의 리보솜과의 후속 상호작용에 의해 생성된 RNA를 의미한다.)이러한 ORF는[1] 시작 코돈(RNA의 경우 일반적으로 AUG)을 포함할 수 있으며 정의에 따라 정지 코돈(RNA의 [2]경우 일반적으로 UAA, UAG UGA)을 초과할 수 없습니다.이 시작 코돈(꼭 첫 번째 코돈은 아님)은 변환을 시작할 수 있는 위치를 나타냅니다.문자 변환 종료 사이트는 변환 정지 코돈 너머 ORF 뒤에 있습니다.만약 전사가 정지 코돈 전에 중단된다면,[3] 번역 중에 불완전한 단백질이 만들어질 것이다.
복수의 엑손이 있는 진핵생물 유전자는 인트론을 제거한 후 전사 후에 엑손이 결합되어 단백질 번역을 위한 최종 mRNA를 생성한다.따라서 유전자 발견의 맥락에서 ORF의 시작-정지 정의는 유전체 DNA가 아닌 스플라이스 mRNA에만 적용된다. 왜냐하면 인트론은 정지 코돈을 포함할 수 있고/또는 판독 프레임 간의 이동을 일으킬 수 있기 때문이다.또 다른 정의에서는 ORF는 길이가 3으로 나누어지고 정지 [1][4]코돈으로 둘러싸인 시퀀스라고 합니다.이 보다 일반적인 정의는 얻어진 시퀀스에 시작 또는 정지 코돈이 존재하지 않을 수 있는 전사체학 및 메타게노믹스의 맥락에서 유용할 수 있다.그러한 ORF는 완전한 유전자가 아니라 유전자의 일부에 해당된다.
생물학적 의의
ORF(Open Reading Frame)의 일반적인 사용 중 하나는 유전자 예측을 보조하는 하나의 증거입니다.긴 ORF는 다른 증거와 함께 DNA 배열에서 단백질 [5]코드화 후보 영역 또는 기능적 RNA 코드화 영역을 초기에 식별하기 위해 종종 사용된다.ORF가 존재한다고 해서 영역이 항상 변환되는 것은 아닙니다.예를 들어, 각 뉴클레오티드의 동일한 비율을 가진 무작위로 생성된 DNA 배열에서, 21 [5]코돈마다 한 번씩 정지 코돈이 예상된다.원핵생물을 위한 간단한 유전자 예측 알고리즘은 시작 코돈에 이어 전형적인 단백질을 인코딩하기에 충분히 긴 열린 판독 프레임을 찾을 수 있습니다. 여기서 그 영역의 코돈 사용은 주어진 유기체의 코딩 [5]영역에 대한 주파수 특성과 일치합니다.따라서 일부 저자는 ORF의 길이가 최소여야 한다고 말한다(예: 100 코돈[6] 또는 150 코돈).[5]길게 열린 판독 프레임 자체로는 [5]유전자가 존재한다는 결정적인 증거가 되지 못한다.
쇼트 ORF(sORF)(ncRNA와 mRNA 모두로부터) 단백질 코드 유전자의 고전적인 특성이 결여된 일부 짧은 ORF(sORF)는 기능성 [7]펩타이드를 생성할 수 있다.포유류 mRNA의 약 50%의 5'-UTR은 업스트림 ORF 또는 uORF라고도 불리는 하나 또는 여러 개의 sORF를 [8]포함하는 것으로 알려져 있다.그러나 이전 연구에서 조사된 척추동물 mRNA의 10% 미만이 주요 ORF 앞에 AUG 코돈을 포함했다.흥미롭게도, uORF는 원생종과 [9]관련 단백질의 3분의 2에서 발견되었다.실험적으로 발견된 sORF의 번역 개시 부위의 64~75%는 인간과 생쥐의 게놈에 보존되며,[10] 이러한 요소들이 기능을 가지고 있음을 나타낼 수 있다.그러나, sORF는 종종 mRNA의 작은 형태에서만 발견될 수 있고 선택을 피할 수 있다. 시작 부위의 높은 보존은 관련 유전자의 촉진제 내부의 위치와 관련이 있을 수 있다.예를 들어,[11] 이것은 SLAMF1 유전자의 특징이다.
6프레임 변환
DNA는 세 개의 뉴클레오티드(코돈)로 이루어진 그룹으로 해석되기 때문에, DNA 가닥은 세 개의 뚜렷한 읽기 [12]프레임을 가지고 있다.DNA 분자의 이중 나선은 두 개의 반평행 가닥을 가지고 있습니다. 두 가닥이 각각 세 개의 판독 프레임을 가지고 있으면 여섯 개의 프레임 [12]변환이 가능합니다.
소프트웨어
파인더
ORF Finder(Open Reading Frame [13]Finder)는 사용자의 시퀀스 또는 데이터베이스에 이미 있는 시퀀스에서 선택 가능한 최소 크기의 열려 있는 모든 읽기 프레임을 찾는 그래픽 분석 도구입니다.이 도구는 표준 또는 대체 유전자 코드를 사용하여 열려 있는 모든 판독 프레임을 식별합니다.추출된 아미노산 배열을 다양한 형식으로 저장하고 BLAST(Basic Local Alignment Search Tool) 서버를 사용하여 배열 데이터베이스에 대해 검색할 수 있습니다.ORF Finder는 완전하고 정확한 시퀀스 제출을 준비하는 데 도움이 됩니다.Sequin 시퀀스 제출 소프트웨어(시퀀스 분석기)와 함께 제공됩니다.
조사관
ORF Investigator는[14] 코딩 및 비코딩 시퀀스에 대한 정보를 제공할 뿐만 아니라 다양한 유전자/DNA 영역 시퀀스의 쌍방향 글로벌 정렬을 수행할 수 있는 프로그램입니다.이 도구는 해당 아미노산 배열에 대한 ORF를 효율적으로 찾아 단일 문자 아미노산 코드로 변환하고 배열 내 위치를 제공합니다.염기서열 사이의 쌍방향 전역 정렬은 단일 뉴클레오티드 다형을 포함한 다른 돌연변이를 검출하는 것을 편리하게 한다.니들맨분쉬 알고리즘은 유전자 정렬에 사용됩니다.ORF Investigator는 휴대용 Perl 프로그래밍 언어로 작성되므로 모든 일반 운영 체제 사용자가 사용할 수 있습니다.
예측 변수
OrfPredictor는[15] Expressed Sequence Tag(EST; 익스프레스드시퀀스 태그) 유래 시퀀스로 단백질 코드 영역을 식별하기 위해 설계된 웹 서버입니다.BLASTX에 히트한 쿼리 시퀀스에 대해 프로그램은 BLASTX 얼라인먼트에서 식별된 번역 판독 프레임에 근거해 부호화 영역을 예측하고, 그렇지 않으면 쿼리 시퀀스의 고유 신호에 근거해 가장 가능성이 높은 부호화 영역을 예측한다.출력은 FASTA 형식의 예측된 펩타이드 배열이며, 쿼리 ID, 번역 판독 프레임 및 코드 영역이 시작되고 끝나는 뉴클레오티드 위치를 포함하는 정의 라인입니다.OrfPredictor는 특히 대규모 EST 프로젝트의 경우 EST 파생 시퀀스의 주석을 용이하게 합니다.
ORF Predictor는 위에서 설명한 두 가지 다른 ORF 정의를 조합하여 사용합니다.시작 코돈에서 시작하여 종료 코돈에서 끝나는 스트레칭을 검색합니다.추가 기준으로서 5' 미번역 영역(UTR 또는 NTR, 비번역 영역)[16]에서 정지 코돈을 탐색한다.
ORFik
ORFik은 열린 판독 프레임을 찾고 ORF [17]정당화를 위한 차세대 시퀀싱 기술을 사용하기 위한 바이오컨덕터의 R 패키지입니다.
오피피
orfipy는 매우 빠르고 유연한 방법으로 ORF를 추출하기 위해 [18]Python/Cython으로 작성된 도구입니다.orfipy는 플레인 또는 gziped FASTA 및 FASTQ 시퀀스와 연동하여 ORF 검색을 미세 조정하기 위한 몇 가지 옵션을 제공합니다.시작 및 정지 코돈 지정, 부분 ORF 보고서 작성, 커스텀 변환 테이블 사용 등이 있습니다.결과는 공간 효율적인 BED 형식을 포함하여 여러 형식으로 저장할 수 있습니다.de-novo transcriptome [19]어셈블리와 같이 여러 개의 작은 FASTA 시퀀스를 포함하는 데이터의 경우 orfipy가 특히 더 빠릅니다.
「 」를 참조해 주세요.
- 부호화 영역
- 추정 유전자
- Sequerome – 각 BLAST 레코드를 NCBI ORF에 연결하는 시퀀스 프로파일링 도구로서 BLAST 보고서의 완전한 ORF 분석을 가능하게 합니다.
레퍼런스
- ^ a b Sieber P, Platzer M, Schuster S (March 2018). "The Definition of Open Reading Frame Revisited". Trends in Genetics. 34 (3): 167–170. doi:10.1016/j.tig.2017.12.009. PMID 29366605.
- ^ Brody LC (2021-08-25). "Stop Codon". National Human Genome Research Institute. National Institutes of Health. Retrieved 2021-08-25.
{{cite web}}
: CS1 maint :url-status (링크) - ^ Slonczewski J, Foster JW (2009). Microbiology: An Evolving Science. New York: W.W. Norton & Co. ISBN 978-0-393-97857-5. OCLC 185042615.
- ^ Claverie JM (1997). "Computational methods for the identification of genes in vertebrate genomic sequences". Human Molecular Genetics. 6 (10): 1735–44. doi:10.1093/hmg/6.10.1735. PMID 9300666.
- ^ a b c d e Deonier R, Tavaré S, Waterman M (2005). Computational Genome Analysis: an introduction. Springer-Verlag. p. 25. ISBN 978-0-387-98785-9.
- ^ Claverie JM, Poirot O, Lopez F (1997). "The difficulty of identifying genes in anonymous vertebrate sequences". Computers & Chemistry. 21 (4): 203–14. doi:10.1016/s0097-8485(96)00039-3. PMID 9415985.
- ^ Zanet J, Benrabah E, Li T, Pélissier-Monier A, Chanut-Delalande H, Ronsin B, et al. (September 2015). "Pri sORF peptides induce selective proteasome-mediated protein processing". Science. 349 (6254): 1356–1358. Bibcode:2015Sci...349.1356Z. doi:10.1126/science.aac5677. PMID 26383956. S2CID 206639549.
- ^ Wethmar K, Barbosa-Silva A, Andrade-Navarro MA, Leutz A (January 2014). "uORFdb--a comprehensive literature database on eukaryotic uORF biology". Nucleic Acids Research. 42 (Database issue): D60–D67. doi:10.1093/nar/gkt952. PMC 3964959. PMID 24163100.
- ^ Geballe, A. P.; Morris, D. R. (April 1994). "Initiation codons within 5'-leaders of mRNAs as regulators of translation". Trends in Biochemical Sciences. 19 (4): 159–164. doi:10.1016/0968-0004(94)90277-1. ISSN 0968-0004. PMID 8016865.
- ^ Lee S, Liu B, Lee S, Huang SX, Shen B, Qian SB (September 2012). "Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution". Proceedings of the National Academy of Sciences of the United States of America. 109 (37): E2424–E2432. doi:10.1073/pnas.1207846109. PMC 3443142. PMID 22927429.
- ^ Schwartz AM, Putlyaeva LV, Covich M, Klepikova AV, Akulich KA, Vorontsov IE, et al. (October 2016). "Early B-cell factor 1 (EBF1) is critical for transcriptional control of SLAMF1 gene in human B cells". Biochimica et Biophysica Acta (BBA) - Gene Regulatory Mechanisms. 1859 (10): 1259–1268. doi:10.1016/j.bbagrm.2016.07.004. PMID 27424222.
- ^ a b Pearson WR, Wood T, Zhang Z, Miller W (November 1997). "Comparison of DNA sequences with protein sequences". Genomics. 46 (1): 24–36. doi:10.1006/geno.1997.4995. PMID 9403055. S2CID 6413018.
- ^ "ORFfinder". www.ncbi.nlm.nih.gov.
- ^ Dhar DV, Kumar MS (2012). "ORF Investigator: A New ORF finding tool combining Pairwise Global Gene Alignment". Research Journal of Recent Sciences. 1 (11): 32–35.
- ^ "OrfPredictor". bioinformatics.ysu.edu. Archived from the original on 2015-12-22. Retrieved 2015-12-17.
- ^ Carrington JC, Freed DD (April 1990). "Cap-independent enhancement of translation by a plant potyvirus 5' nontranslated region". Journal of Virology. 64 (4): 1590–7. doi:10.1128/JVI.64.4.1590-1597.1990. PMC 249294. PMID 2319646.
- ^ Kornel Labun, Haakon Tjeldnes (2018). "ORFik - Open reading frames in genomics". bioconductor.org. doi:10.18129/B9.bioc.ORFik.
- ^ Singh U, Wurtele ES (February 2021). "orfipy: a fast and flexible tool for extracting ORFs". Bioinformatics. 37 (18): 3019–3020. doi:10.1093/bioinformatics/btab090. ISSN 1367-4803. PMC 8479652. PMID 33576786.
- ^ Singh U (2021-02-13), urmi-21/orfipy, retrieved 2021-02-13
외부 링크
- 변환 및 오픈 판독 프레임
- hORFeome V5.1 - CCSB Human ORFeome Collection용 웹 기반 인터랙티브 도구
- ORF Marker - ORF 예측 및 분석을 위한 무료 고속 멀티 플랫폼 데스크톱 GUI 도구
- StarORF - ORF를 예측 및 분석하여 역보완 시퀀스를 얻기 위한 멀티플랫폼 Java 기반의 GUI 도구
- ORFPredictor Archived 2015-12-22 at the Wayback Machine - EST 또는 cDNA 시퀀스의 ORF 예측 및 번역을 위해 설계된 웹 서버