プレプリント / バージョン1

検出されない代謝物を考慮したエンリッチメント解析のための確率的Over-Representation Analysis

##article.authors##

  • 山本, 博之 質量分析インフォマティクス研究会

DOI:

https://doi.org/10.51094/jxiv.954

キーワード:

エンリッチメント解析、 欠損値、 メタボロミクス

抄録

Over-Representation Analysis (ORA) は、メタボロミクスデータにおける有意な経路を特定するために広く使用されている。しかし、従来の ORA アプローチでは、未検出の代謝物が自動的に非有意な代謝物として扱われるため、潜在的なバイアスが生じる可能性がある。本研究では、絶食マウス由来のメタボロミクスデータを用い、検出された有意代謝物の情報を活用し、未検出代謝物を含めた場合の p 値範囲を全組み合わせから推定する新たな ORA 手法を提案した。さらに、未検出代謝物の有意数を二項分布に従うと仮定するモデルと、その割合をベータ分布でモデル化する手法を導入し、狭い p 値範囲を実現した。最後に、全経路に共通の情報を用いる階層ベイズモデルを適用し、設定した分布からリサンプリングして ORA の p 値を算出し、最も狭い p 値信頼区間を達成した。この結果から、未検出代謝物を考慮することの重要性が示された。

利益相反に関する開示

開示すべきCOIはありません

ダウンロード *前日までの集計結果を表示します

ダウンロード実績データは、公開の翌日以降に作成されます。

引用文献

Chong, J., et al. (2018). MetaboAnalyst 4.0: Towards more transparent and integrative metabolomics analysis. Nucleic Acids Research, 46(W1), W486-W494.

Xia, J., & Wishart, D. S. (2016). Using MetaboAnalyst 3.0 for comprehensive metabolomics data analysis. Current Protocols in Bioinformatics, 55(1), 14-10.

Yamamoto, H., et al. (2014). Statistical hypothesis testing of factor loading in principal component analysis and its application to metabolite set enrichment analysis. BMC Bioinformatics, 15(1), 51.

ダウンロード

公開済


投稿日時: 2024-11-05 00:41:52 UTC

公開日時: 2024-11-07 10:07:17 UTC
研究分野
情報科学