Improving Linear Regression Performance for Interpretable Control: A Partial Dependence Plot Approach

大嶋, 健太

doi:10.51094/jxiv.1516

##article.authors##

大嶋, 健太独立研究者 https://orcid.org/0009-0002-6142-2234

DOI:

https://doi.org/10.51094/jxiv.1516

キーワード:

部分従属プロット、線形回帰、特徴量エンジニアリング、リアルタイム制御、生産プロセス

抄録

この論文は、工業および化学システムにおけるリアルタイムなプロセス制御のために、解釈可能な線形モデルの性能を向上させるという課題に取り組んでいます。ランダムフォレストやXGBoostのようなブラックボックスモデルは高い予測精度を達成しますが、その解釈性の欠如とリアルタイムアプリケーションへの適合性の限界から、生産環境への統合は困難です。この制約を克服するため、私たちは**部分依存プロット（PDP）**を活用した新しい特徴量エンジニアリング手法を提案します。この手法は、ブラックボックスモデルが学習した複雑な非線形関係を捉え、それを線形回帰に適した特徴量に変換します。

私たちは、工業プロセスで観測されるものと類似した多変数かつ非線形な特性を持つ、広く知られた公開データセットであるワイン品質データセットを用いて、提案手法を評価しました。私たちの結果は、PDPに基づく特徴量変換が線形モデルの予測精度を大幅に向上させ、ブラックボックスモデルに匹敵するR2スコアを達成することを示しています。本研究は、高性能でありながら解釈可能なモデルを構築するための実用的な解決策を提案しており、プロセス制御や監視におけるリアルタイム展開に大きな可能性を示しています。

利益相反に関する開示

開示すべき事項はありません。

ダウンロード *前日までの集計結果を表示します

ダウンロード実績データは、公開の翌日以降に作成されます。

引用文献

L. Breiman, "Random forests," Machine Learning, vol. 45, no. 1, pp. 5-32, 2001.

Chen, T., & Guestrin, C. “XGBoost: A Scalable Tree Boosting System“. KDD '16, 2016.

P. J. Werbos, "Backpropagation: Past and future," in Proceedings of the IEEE International Conference on Neural Networks, 1988.

Rudin, C. et al. “Interpretable Machine Learning: Fundamental Principles and 10 Grand Challenges”, 2021.

P. Cortez, A. Cerdeira, F. Almeida, T. Matos, and J. Reis, "Modeling wine preferences by data mining from physicochemical properties," Decision Support Systems, vol. 47, no. 4, pp. 547-553, 2009.

解釈可能な制御のための線形回帰性能の改善

部分依存プロットによるアプローチ