プレプリント / バージョン1

膜貫通ドメイン合成支援は遺伝暗号表配列の重要な機能である

##article.authors##

DOI:

https://doi.org/10.51094/jxiv.139

キーワード:

遺伝暗号表、 膜貫通ドメイン、 アミノ酸組成、 核酸組成、 主成分分析

抄録

遺伝暗号表は遺伝子上の核酸配列とタンパク質のアミノ酸配列を対応させる対応表である。この遺伝暗号表の配列は現存するすべての生物においてほぼ共通であることが知られているが、なぜそのようになっているかは現在まで明確には説明されていない。

今回、ヒトの全タンパク質のアミノ酸組成を主成分分析したところ、主としてその第二主成分、次いでその第一主成分によって膜貫通ドメインを複数持つ膜タンパク質とそうでないタンパク質が別れることが明らかになった。固有ベクトルから、これらの膜タンパク質には、フェニルアラニン、チロシン、イソロイシン、メチオニン、トリプトファン、シスチン、バリン、ロイシンの含有が多いと推測されたが、大半は疎水性アミノ酸であり、また同時に全て、遺伝暗号表において、コドンの1文字目もしくは2文字目に核酸Uを含むコドンに対応したアミノ酸であった。(Uは遺伝子上のTに対応する。)

次に、ヒトの全タンパク質の遺伝子の核酸組成を主成分分析したところ、その第一、第二主成分がそれぞれ上記アミノ酸組成の第一主成分、第二主成分に強く相関することが明らかとなった。さらに、この核酸の第一、第二主成分はそれぞれ、その核酸組成のAT含量(GC含量に連動)、TとAの存在比にもそれぞれ強く相関していることも判明した。

さらに、ヒト遺伝子をその核酸組成のTとAの比、および、AT含量でプロットしたところ、上記膜貫通ドメインを持つタンパク質群は、AよりもTが多い遺伝子と強く相関していた。

一般に膜タンパク質は全タンパク質の3割を占めると言われており、膜タンパク質の安定的な合成は生命の至上課題の一つであると推測される。これらの膜タンパク質には共通して膜貫通ドメインが含まれるが、この膜貫通ドメインは疎水性の高いアミノ酸残基が一定数連続して配列する特殊な構造をしている。一般に、生物が進化の中で特定の機能性タンパク質を獲得していくためには、ランダムな変異を積み重ねた結果として偶然に望むタンパク質が生成されることを期待する必要があるとされてきた。しかし、今回の解析結果から推測すると、遺伝子の核酸組成においてAよりもTが多い部分においては遺伝子変異がランダムであっても膜貫通ドメインに多いアミノ酸がコードされる確率が格段に高くなっていると考えられた。以上より、生物は遺伝暗号表の配列の特徴を利用して膜貫通ドメインの合成をアシストしている可能性があると考えられた。

膜貫通ドメインの合成支援は遺伝暗号表配列の重要な機能の一つであり、現在の遺伝暗号表はこの機能も含めた様々な機能によって選択され続け、その結果として収束状態にあると考えられた。

ダウンロード *前日までの集計結果を表示します

ダウンロード実績データは、公開の翌日以降に作成されます。

引用文献

Wnętrzak, M., Błażej, P., & Mackiewicz, P. (2019). Optimization of the standard genetic code in terms of two mutation types: Point mutations and frameshifts. Bio Systems, 181, 44–50. https://doi.org/10.1016/j.biosystems.2019.04.012

江角 元史郎. (2022). 必須アミノ酸の起源 細胞外マトリックス仮説. Jxiv. https://doi.org/10.51094/jxiv.121

National Center for Biotechnology Information (NCBI). (2022). Genome assembly GRCh38.p14. National Library of Medicine (NIH) website. https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_000001405.40/

UniProt consortium. (2022). Homo sapiens (species) Related UniProtKB entries. UniProt website. https://www.uniprot.org/uniprotkb?query=(taxonomy_id:9606)

太田 亨, 新井 宏嘉. (2006). 組成データ解析の問題点とその解決方法. 地質学誌, 112(3), 173-187. https://doi.org/10.5575/geosoc.112.173

Vakirlis, N., Acar, O., Hsu, B., Castilho Coelho, N., van Oss, S. B., Wacholder, A., Medetgul-Ernar, K., Bowman, R. W., Hines, C. P., Iannotta, J., Parikh, S. B., McLysaght, A., Camacho, C. J., O’Donnell, A. F., Ideker, T., & Carvunis, A.-R. (2020). De novo emergence of adaptive membrane proteins from thymine-rich genomic sequences. Nature Communications, 11(1), 781. https://doi.org/10.1038/s41467-020-14500-z

Fariselli, P., Taccioli, C., Pagani, L., & Maritan, A. (2021). DNA sequence symmetries from randomness: The origin of the Chargaff’s second parity rule. Briefings in Bioinformatics, 22(2), 2172–2181. https://doi.org/10.1093/bib/bbaa041

Esumi, G. (2022). Synonymous codon usage and its bias in the bacterial proteomes primarily offset GC content variation to maintain optimal amino acid compositions. Jxiv. https://doi.org/10.51094/jxiv.99

Wichmann, S., & Ardern, Z. (2019). Optimality in the standard genetic code is robust with respect to comparison code sets. Bio Systems, 185, 104023. https://doi.org/10.1016/j.biosystems.2019.104023

ダウンロード

公開済


投稿日時: 2022-08-12 00:47:57 UTC

公開日時: 2022-08-16 01:52:59 UTC
研究分野
生物学・生命科学・基礎医学