プレプリント / バージョン1

ヒトタンパク質上のα-ヘリックス型膜貫通ドメインと天然変性領域は遺伝暗号表の配列の特性により遺伝子上の核酸組成の偏りとしてコードされている

##article.authors##

DOI:

https://doi.org/10.51094/jxiv.247

キーワード:

膜貫通ドメイン、 天然変性領域、 核酸組成、 TA skew、 GC含量、 遺伝暗号表、 シャルガフの第2パリティ則

抄録

生物において、遺伝子の核酸配列が遺伝暗号表の対応関係によりアミノ酸の配列に翻訳され、その結果として様々な機能を持ったタンパク質が合成されていることは汎く知られている。また、個々のタンパク質の機能はそのアミノ酸組成により大きく影響されることもよく知られている。一方で、タンパク質の機能に対しその遺伝子の核酸組成がどのような影響を及ぼしているかについてはほとんど報告がない。

今回、NCBIとUniProtの公開情報を用いて、ヒトの各タンパク質のアノテーションと遺伝子のコード領域の核酸組成をRefSeq IDで突合したところ、計25095個のタンパク質の情報が突合された。このデータセットにおける各タンパク質のアミノ酸シーケンスにおけるα-ヘリックス型膜貫通ドメインが占める割合、天然変性領域が占める割合をそれぞれ計算し、それらをそのタンパク質の遺伝子における核酸組成から計算したGC contentおよびTA skewの値に基づいてプロットしたところ、αヘリックス型膜貫通ドメインの割合が高いタンパク質はTA skewが高い領域に集中し、一方で天然変性領域の割合が高いタンパク質はTA skewが低い領域全体と、GC contentが高い一部一部の領域に集中していることが明らかとなった。

遺伝暗号表において、疎水性の高いアミノ酸、親水性の高いアミノ酸がまとまって存在していることは古くから知られているが、これは「変異に対する頑健性があるから」と説明されてきた。しかし、遺伝暗号表を確認すると、コドン1文字目、2文字目にTが含まれるコドンがαヘリックス型膜貫通ドメインに多く含まれているアミノ酸と対応し、逆にコドン1文字目、2文字目にTが含まれないコドンが天然変性領域に特徴的とされるアミノ酸と対応していた。以上より、2種類のタンパク質がプロット上で分離する背景は、ヒトが用いている遺伝暗号表の配列に起源すると推測された。

ゲノム上の核酸配列について十分に長いシーケンスであればその配列に含まれるTとA、GとCの数はほぼ一致することは、シャルガフの第2パリティ則として報告されている。一方で、今回の結果より、各遺伝子においては大半の遺伝子のTとAの数は一致せず、実際はその偏りによってαヘリックス型膜貫通ドメインと天然変性領域がコードし分けられている可能性が示唆された。現在までシャルガフの第2経験則が保たれている理由は謎であるが、仮に遺伝子がTA skewで機能性領域の作り分けをしているという仮説が正しいとするならば、この第2パリティ則は、タンパク質全体における膜貫通ドメインと天然変性領域の占める割合といった、タンパク質機能のバランスをコントロールするために保たれている、という可能性が考えられた。

普遍遺伝暗号表を用いるすべての生物は、その遺伝子としてDNAを用いるにあたり、機能性ドメインの作り分けを容易にするような配置の遺伝暗号表と、非ランダムかつ精密にコントロールされた核酸配列のゲノムを用いることで、ゲノム上にコードするタンパク質全体の機能性ドメインの存在量のバランスが指摘範囲に入るようにコントロールを行っていると推測された。

利益相反に関する開示

本論文に関して、開示すべき利益相反はありません。

ダウンロード *前日までの集計結果を表示します

ダウンロード実績データは、公開の翌日以降に作成されます。

引用文献

B. Alberts他著,中村桂子,松原謙一監訳,『細胞の分子生物学 第6版』(ニュートンプレス,2017).

Carugo, O. (2008). Amino acid composition and protein dimension. Protein Science, 17(12), 2187–2191. https://doi.org/10.1110/ps.037762.108

江角 元史郎. (2022). 膜貫通ドメイン合成支援は遺伝暗号表配列の重要な機能である. Jxiv. https://doi.org/10.51094/jxiv.139

National Center for Biotechnology Information (NCBI). (2022). Genome assembly T2T-CHM13v2.0. National Library of Medicine (NIH) website. https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_009914755.1/

UniProt consortium. (2023). Proteomes · Homo sapiens (Human). UniProt website. https://www.uniprot.org/proteomes/UP000005640

Radványi, Á., & Kun, Á. (2021). The Mutational Robustness of the Genetic Code and Codon Usage in Environmental Context: A Non-Extremophilic Preference? Life, 11(8), 773. https://doi.org/10.3390/life11080773

Rudner, R., Karkas, J. D., & Chargaff, E. (1968). Separation of B. subtilis DNA into complementary strands. 3. Direct analysis. Proceedings of the National Academy of Sciences, 60(3), 921–922. https://doi.org/10.1073/pnas.60.3.921

Fariselli, P., Taccioli, C., Pagani, L., & Maritan, A. (2021). DNA sequence symmetries from randomness: the origin of the Chargaff’s second parity rule. Briefings in Bioinformatics, 22(2), 2172–2181. https://doi.org/10.1093/bib/bbaa041

ダウンロード

公開済


投稿日時: 2023-01-16 01:13:30 UTC

公開日時: 2023-01-23 08:45:46 UTC
研究分野
生物学・生命科学・基礎医学