아이나바

INAVA
아이나바
식별자
에일리어스INAVA, 1번 염색체 오픈 판독범위 106, C1orf106, 선천성 면역활성화제
외부 IDOMIM : 618051 MGI : 1921579 HomoloGene : 10103 GenCard : INAVA
맞춤법
종.인간마우스
엔트레즈
앙상블
유니프로트
RefSeq(mRNA)

NM_001142569
NM_018265
NM_001367289
NM_001367290

NM_028872

RefSeq(단백질)

NP_001136041
NP_060735
NP_001354218
NP_001354219

NP_083148
NP_001392081
NP_001392082
NP_001392083

장소(UCSC)Chr 1: 200.89 ~200.92 MbChr 1: 136.14 ~136.16 Mb
PubMed 검색[3][4]
위키데이터
인간 보기/편집마우스 표시/편집

때때로 가상의 단백질 LOC55765로 언급되는 INAV는 알려지지 않은 기능을 가진 단백질로 사람에게서 INAVA [5]유전자에 의해 암호화된다.덜 흔한 유전자 별칭으로는 FLJ10901과 MGC125608이 있다.

위치

1번 염색체에서의 C1orf106 위치

사람의 경우 INAVA는 1번 염색체의 긴 팔의 위치 1q32.1에 위치한다.플러스 [5]스트랜드로 200,891,499 ~200,915,736(24.238KB)의 범위입니다.

유전자 근방

유전자 근방

INAV는 G단백질결합수용체 25(상류)와 예측된 하류의 의사유전자인 마에스트로열상반복패밀리멤버 3(MROH3P)에 의해 측면에 배치된다.리보솜 단백질 L34 의사유전자 6(RPL34P6)은 더욱 상류, 키네신 패밀리 멤버 21B는 더욱 [5]하류이다.

주최자

추정 전사인자 결합 부위가 있는 예측 C1orf106 프로모터 영역

INAVA에는 7개의 예측 프로모터가 있으며, 실험 증거에 따르면 가장 일반적인 isoform 1과 isoform 2는 서로 [6]다른 프로모터를 사용하여 전사된다.Genomatix를 통해 사용할 수 있는 도구인 MatInspector는 잠재적 프로모터 영역 내의 전사 인자 결합 부위를 예측하는 데 사용되었습니다.isoform 1에 대한 예상 프로모터를 대상으로 하는 것으로 예측되는 전사 인자는 다양한 조직 범위에서 발현된다.가장 흔한 발현조직은 비뇨기계, 신경계, 골수이다.이는 신장 및 [7]골수에서 많이 발현되는 INAVA 단백질의 발현 데이터와 일치한다.예측된 프로모터 영역의 다이어그램과 강조 표시된 전사 인자 결합 부위가 오른쪽에 표시됩니다.아이소폼2의 프로모터 영역에 결합할 것으로 예상되는 인자는 서로 다르며, 상위 20개의 예측인자 중 12개는 심혈관계의 혈구 및/또는 조직에 발현된다.

표현

C1orf106은 광범위한 조직에서 발현된다.GEO 프로파일의 식 데이터는 다음과 같습니다.가장 발현도가 높은 사이트가 표에 나열되어 있습니다.태반, 전립선, 고환, 폐, 침샘, 수지상 세포에서 발현이 보통이다.그것은 뇌, 대부분의 면역 세포, 부신, 자궁, 심장, 지방 [7]세포에서 낮다.GEO 프로파일에서 발견된 다양한 실험의 발현 데이터에 따르면 INAVA 발현은 폐, 난소, 대장, 유방 등 여러 암에서 상향 조절된다.

GEO 프로파일의 C1orf106 식 데이터
티슈 백분위수 순위
B림프구 90
기관 89
피부. 88
인간 기관지 상피 세포 88
대장선암 87
신장 87
85
췌장 84
부록 82
골수 80

mRNA

Isoforms

INAV 유전자로부터 9개의 추정 아이소폼이 생성되며, 그 중 7개는 단백질을 [8]코드하는 것으로 예측된다.아래 그림과 같이 Isoform 1과 2가 가장 일반적인 Isoform입니다.

가장 일반적인 C1orf106 isoforms

가장 긴 Isoform 1은 표준 Isoform으로 받아들여진다.그것은 10개의 엑손들을 포함하고 있는데, 이것은 공급원에 따라 677개의 아미노산 길이의 단백질을 암호화한다.일부 출처들은 42개의 뉴클레오티드 하류에 있는 시작 코돈의 사용으로 인해 단백질이 663개의 아미노산밖에 되지 않는다고 보고한다.NCBI에 따르면, 이 등소 형태는 [5]계산적으로만 예측되었다.이는 다운스트림 시작 코돈을 둘러싼 Kozak 시퀀스가 아래 표에 나타난 것과 같이 합의된 Kozak 시퀀스와 더 유사하기 때문일 수 있습니다.Softberry는 예측된 Isoform의 [9]염기서열을 얻기 위해 사용되었다.Isoform 2는 N-terminus가 잘렸기 때문에 더 짧습니다.두 아이소폼 모두 대체 폴리아데닐화 [8]부위가 있다.

Surrounding sequence of start codons compared to Kozak consensus sequence

miRNA조절

예측된 miRNA 표적 시퀀스

miRNA-24는 잠재적으로 INAVA mRNA를 표적화할 수 있는 마이크로RNA로 확인되었다.[10]5' 미번역 영역에 위치한 결합 부위가 표시됩니다.

단백질

일반 속성

C1of106단백질(아이소폼1)

아래 그림으로 나타낸 Isoform 1에는 DUF3338 도메인과 2개의 저복잡도 영역 및 프롤린이 풍부한 영역이 포함되어 있습니다.단백질은 아르기닌과 프롤린이 풍부하며 아스파라긴과 소수성 아미노산, 특히 페닐알라닌과 이소류신의 [11]평균량보다 낮다.등전점은 9.58이고, 수정되지 않은 단백질의 분자량은 72.9 kdal이다.[12]단백질은 N-말단 신호 펩타이드를 가질 것으로 예측되지 않지만, 예측 핵 국재 신호(NLS)와 류신이 풍부한 핵 수출 [13][14][15]신호가 있다.

변경 사항

INAVA는 고도로 인산화 [16][17]될 것으로 예상된다.PROSITE에 의해 예측된 포스포일화 부위는 아래 표에 나와 있습니다.그림에는, NETPhos 의 예측이 나타나 있습니다.각 선은 예측된 인산화 부위를 가리키고 세린(S), 트레오닌(T) 또는 티로신(Y) 중 하나를 나타내는 문자에 연결됩니다.

Phosphorylation sites predicted by PROSITE
NETPhos에 의해 예측된 인산화 부위.글자는 세린(S), 트레오닌(T) 또는 티로신(Y)에 해당합니다.

구조.

코일 코일은 잔류물 130~160 및 200~[18]260에서 확장될 것으로 예측됩니다.2차 조성은 약 60% 랜덤 코일, 30% 알파 헬리클 및 10% 베타 [19]시트로 예측되었습니다.

상호 작용

INAVA 단백질이 상호작용하는 단백질은 잘 특징지어지지 않는다.텍스트 마이닝 증거에 따르면 INAVA는 DNAJC5G, SLC7A13, PIEZO2, [20]MUC19와 상호작용할 수 있다.효모 두 개의 하이브리드 스크린에서 얻은 실험 증거는 INAVA 단백질이 어댑터 [21]단백질인 14-3-3 단백질 시그마와 상호작용한다는 것을 시사한다.

호몰로지

INAVA는 아래 표와 같이 척추동물에서 잘 보존되어 있다.BLAST[23]BLAT에서 시퀀스[22] 검색되었습니다.

순서 속과 종 통칭 NCBI 가입 길이(aa) 시퀀스 아이덴티티 분기 후 시간(Mya)
* C1orf106 호모 사피엔스 인간 NP_060735.3 667 100% NA
* C1orf106 마카카속 게먹이원숭이 XP_005540414.1 703 97% 29.0
* LOC289399 노베기쿠스 노르웨이쥐 NP_001178750.1 667 86% 92.3
* 예측 C1orf106 호몰로그 오도베누스 로즈마루스 다이버겐스 바다코끼리속 XP_004392787.1 672 85% 94.2
* C1orf106과 같은 록소돈타아프리카나 코끼리 XP_003410255.1 663 84% 98.7
* 예측 C1orf106 호몰로그 중편광대 아홉줄아르마딜로 XP_004478752.1 676 81% 104.2
* 예측 C1orf106 호몰로그 오초토나프린셉스 아메리칸 파이카 XP_004578841.1 681 78% 92.3
* 예측 C1orf106 호몰로그 히가시모노도리 회색짧은꼬리주머니쥐 XP_001367913.2 578 76% 162.2
* 예측 C1orf106 호몰로그 히가시바리 칠거북 XP_005313167.1 602 56% 296.0
* 예측 C1orf106 호몰로그 지오스피자포티스 중지 핀치 XP_005426868.1 542 50% 296.0
* 예측 C1orf106 호몰로그 앨리게이터 미시시피엔시스 악어 XP_006278041.1 547 49% 296.0
* 예측 C1orf106 호몰로그 피세둘라 알비콜리스 목줄파리잡이 XP_005059352.1 542 49% 296.0
예측 C1orf106 호몰로그 라티메리아 찰럼나 서인도양실라칸스 XP_005988436.1 613 46% 414.9
* 예측 C1orf106 호몰로그 오큘라투스목 얼룩가르 XP_006628420.1 637 44% 400.1
* 4A를 포함한 FERM 도메인 크세노푸스(실루라나) 트로피컬리스 서양발톱개구리 XP_002935289.2 695 43% 371.2
* 예측 C1orf106 호몰로그 오레오크로미스닐로티쿠스 나일틸라피아 XP_005478188.1 576 40% 400.1
예측 C1orf106 호몰로그 하플로크로미스버튼 아스타토틸라피아버튼 XP_005914919.1 576 40% 400.1
예측 C1orf106 호몰로그 푼다밀리아나이레이 하플로크로미스나이레이 XP_005732720.1 577 40% 400.1
* LOC563192 다니오 레리오 제브라피시 NP_001073474.1 612 37% 400.1
LOC101161145 오리지아스라티프스 일본산 쌀뜨물고기 XP_004069287.1 612 33% 400.1

다음에, 아스타리스크가 붙은 엔트리의 시퀀스 ID 와 컨버전스 후의 시간의 그래프를 나타냅니다.색상은 관련성 정도에 대응합니다(녹색 = 밀접한 관련성, 보라색 = 먼 관련성).

종관련성에대한순서아이덴티티백분율

패럴로그

INAVA 패러로그로 간주되는 단백질은 데이터베이스 간에 일관성이 없다.진정한 평행 [24]관계의 가능성을 결정하기 위해 잠재적으로 평행한 단백질의 다중 배열 정렬(MSA)이 이루어졌다.이 배열은 C1orf106 단백질로 사람을 대상으로 한 BLAST 검색에서 검색되었다.MSA는 단백질들이 진핵생물에서 발견되는 상동 도메인인 DUF3338을 공유한다고 제안한다.다중 시퀀스 정렬의 일부를 아래에 나타냅니다.DUF 도메인(녹색으로 표시)을 제외하면 보존이 거의 이루어지지 않았습니다.DUF3338 도메인은 특별한 물리적 특성을 가지고 있지 않지만, 한 가지 주목할 만한 발견은 MSA의 각 단백질이 두 개의 핵 국재 신호를 가질 것으로 예측된다는 것이다.MSA의 단백질은 모두 [13]핵에 위치할 것으로 예측된다.단백질의 물리적 특성 비교도 SAPS를 사용하여 수행되었으며 표에 [11]나와 있습니다.

인간의 DUF3338 도메인 보존
Physical properties of potential paralogs

임상적 의의

INAVA의 유전자 영역에서 총 556개의 단일 뉴클레오티드 다형(SNP)이 확인되었으며, 이 중 96개는 임상 소스와 [25]관련되어 있다.리바스 외 연구진은 [26]아래 표에 표시된 바와 같이 염증성 장질환 크론병과 관련이 있을 수 있는 4개의 SNP를 확인했다.GeneCards에 따르면 다른 질병 연관성에는 다발성 경화증궤양성 대장염[27]포함될 수 있다.

잔류물 바꾸다 메모들
333(r41313912) 티로신γ페닐알라닌 인산화, 중간 정도의 보존
376 아르기닌γ시스테인 적당한 보존
397 아르기닌γ트레오닌 보존되어 있지 않다
554(rs61745433) 아르기닌γ시스테인 적당한 보존

모델 유기체

모델 유기체는 INAVA 기능의 연구에 사용되어 왔다.5730559C18Rik이라는 조건부tm2a(EUCOMM)Wtsi 녹아웃 마우스 라인이 웰컴 트러스트 생거 연구소에서 [28]생성되었습니다.수컷과 암컷은 표준화된 표현형[29] 검사를 통해 [30][31][32][33]결실의 효과를 확인했습니다.추가 화면 : - 심층면역학적 표현형[34] - 심층골 및 연골 표현형[35]

5730559C18Rik 녹아웃 마우스 표현형

레퍼런스

  1. ^ a b c GRCh38: 앙상블 릴리즈 89: ENSG00000163362 - 앙상블, 2017년 5월
  2. ^ a b c GRCm38: 앙상블 릴리즈 89: ENSMUSG000041605 - 앙상블, 2017년 5월
  3. ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  4. ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
  5. ^ a b c d "NCBI Gene 55765". Retrieved 10 February 2014.
  6. ^ "Genomatix: MatInspector". Retrieved 6 March 2014.
  7. ^ a b "GEO Profiles". Retrieved 6 March 2014.
  8. ^ a b "Aceview". Retrieved 6 March 2014.
  9. ^ "Softberry". Retrieved 20 April 2014.
  10. ^ "TargetScanHuman 6.2". Retrieved 15 April 2014.
  11. ^ a b "Statistical Analysis of Protein Sequences". Retrieved 20 April 2014.
  12. ^ "Compute pI/Mw tool". Retrieved 10 April 2014.
  13. ^ a b "PSORTII". Retrieved 20 April 2014.
  14. ^ "cNLS Mapper". Retrieved 20 April 2014.
  15. ^ "NetNES". Retrieved 20 April 2014.
  16. ^ "NETPhos". Retrieved 20 April 2014.
  17. ^ "Swiss Institute of Bioinformatics: PROSITE".
  18. ^ "ExPASy COILS". Retrieved 20 April 2014.
  19. ^ "SOPMA". Retrieved 27 April 2014.
  20. ^ "STRING". Retrieved 15 April 2014.
  21. ^ "MINT". Retrieved 15 April 2014.
  22. ^ "BLAST". Retrieved 8 March 2014.
  23. ^ "BLAT". Retrieved 8 March 2014.
  24. ^ "SDSC Biology Workbench: ClustalW". Retrieved 12 March 2014.
  25. ^ "dbSNP". Retrieved 22 April 2014.
  26. ^ Rivas MA; et al. (2011). "Deep resequencing of GWAS loci identifies independent rare variants associated with inflammatory bowel disease". Nature Genetics. 43 (11): 1066–1073. doi:10.1038/ng.952. PMC 3378381. PMID 21983784.
  27. ^ "GeneCards". Retrieved 1 May 2014.
  28. ^ Gerdin AK (2010). "The Sanger Mouse Genetics Programme: high throughput characterisation of knockout mice". Acta Ophthalmologica. 88: 925–7. doi:10.1111/j.1755-3768.2010.4142.x. S2CID 85911512.
  29. ^ a b "International Mouse Phenotyping Consortium".
  30. ^ Skarnes WC, Rosen B, West AP, Koutsourakis M, Bushell W, Iyer V, Mujica AO, Thomas M, Harrow J, Cox T, Jackson D, Severin J, Biggs P, Fu J, Nefedov M, de Jong PJ, Stewart AF, Bradley A (Jun 2011). "A conditional knockout resource for the genome-wide study of mouse gene function". Nature. 474 (7351): 337–42. doi:10.1038/nature10163. PMC 3572410. PMID 21677750.
  31. ^ Dolgin E (Jun 2011). "Mouse library set to be knockout". Nature. 474 (7351): 262–3. doi:10.1038/474262a. PMID 21677718.
  32. ^ Collins FS, Rossant J, Wurst W (Jan 2007). "A mouse for all reasons". Cell. 128 (1): 9–13. doi:10.1016/j.cell.2006.12.018. PMID 17218247. S2CID 18872015.
  33. ^ White JK, Gerdin AK, Karp NA, Ryder E, Buljan M, Bussell JN, Salisbury J, Clare S, Ingham NJ, Podrini C, Houghton R, Estabel J, Bottomley JR, Melvin DG, Sunter D, Adams NC, Sanger Institute Mouse Genetics Project, Tannahill D, Logan DW, Macarthur DG, Flint J, Mahajan VB, Tsang SH, Smyth I, Watt FM, Skarnes WC, Dougan G, Adams DJ, Ramirez-Solis R, Bradley A, Steel KP (2013). "Genome-wide generation and systematic phenotyping of knockout mice reveals new roles for many genes". Cell. 154 (2): 452–64. doi:10.1016/j.cell.2013.06.022. PMC 3717207. PMID 23870131.
  34. ^ a b "Infection and Immunity Immunophenotyping (3i) Consortium".
  35. ^ a b "OBCD Consortium".

외부 링크