Preprint / Version 1

Automated File Processing Microservice via On-Campus Cloud Storage for Utilizing Generative AI

##article.authors##

DOI:

https://doi.org/10.51094/jxiv.1364

Keywords:

On-Campus Cloud Storage, Locally hosted generative AI, Speech-to-text, OCR, Fixed-prompt processing

Abstract

高等教育機関の多様なデータは適切な活用で教育・研究・業務の質の向上に有用である一方,機密情報を含む場合があるため学外クラウド処理時には各ファイルの機密性評価が必要である.本研究では,学内データの整理や検索,機密性の判断の効率化を目的として,セキュアな学内クラウドストレージを介してマルチメディアファイルを自動でテキスト化し,ローカルな生成AIと連携して活用できるファイル自動処理マイクロサービスのシステムを設計・実装し,試験運用を行った.本システムでは,ユーザが対象ファイルを含むフォルダをサービス提供用のアカウントに共有するだけで処理が始まり,出力ファイルが同じ共有フォルダに保存される仕組みにより,ユーザ側の学習コストを抑えつつ,既存の学内クラウドストレージのフロントエンドを活用した管理側の運用負担軽減を実現している.実証実験の結果,機密データを扱う学内環境においても心理的ハードルなく活用できる安全性と,会議録作成等の日常業務における顕著な効率化効果が確認され,本システムが学内でのセキュアかつ実用的な生成AI活用基盤として教職員の業務支援に有効であることが明らかになった.

Conflicts of Interest Disclosure

The authors declare no conflict of interest.

Downloads *Displays the aggregated results up to the previous day.

Download data is not yet available.

References

J. Radas, B. Risse, R. Vogl: Building UniGPT: A Customizable On-Premise LLM-Solution for Universities, EPiC Series in Computing, Vol. 105, pp. 108--116, 2025.

A. J. O'Connell: How (and Why) the University of Michigan Built Its Own Closed Generative AI Tools, EDUCAUSE Review, 2024. https://er.educause.edu/articles/2024/2/how-and-why-the-university-of-michigan-built-its-own-closed-generative-ai-tools (2025年7月4日参照)

松原 伸樹:三重大学ownCloudサービスの運用・構築,技術職員による技術報告集,Vol. 25,pp. 20–23,2017.

松岡 孝,田島 尚徳,出口 大輔,森 健策:ownCloudを用いた全教職員向けファイル共有サービスの構築,大学ICT推進協議会年次大会論文集2014年度年次大会,2014.

葛川 寛之,葛西 真寿,須藤 勝弘:ownCloudによる学内クラウドサービス「弘大クラウド」の構築と運用,第18回学術情報処理研究集会発表論文集,2014.

OpenAI: Whisper. https://github.com/openai/whisper (2025年7月4日参照)

FFmpeg Developers: FFmpeg. https://ffmpeg.org/ (2025年7月4日参照)

Jaided AI: EasyOCR. https://github.com/JaidedAI/EasyOCR (2025年7月4日参照)

京都大学情報環境機構:「文字起こし試行サービスkwhisperの紹介」,京都大学情報環境機構広報誌「Info!」No. 28,p. 9,2023.https://www.iimc.kyoto-u.ac.jp/sites/default/files/2025-02/info28.pdf (2025年7月4日参照)

Nobu C. Shirai: GAUTIのロゴとマスコットキャラクター「ゴチ」の画像公開用リポジトリ https://github.com/nobucshirai/GAUTI-logo (2025年7月4日参照)

Nobu C. Shirai: textify: A Microservice for Automated File Processing via On-Campus Cloud Storage. https://github.com/nobucshirai/textify (2025年7月4日参照)

Ollama: Ollama. https://github.com/ollama/ollama (2025年7月4日参照)

O. Sanseviero, I. Ballantyne: Introducing Gemma 3n: The developer guide, 2025. https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/ (2025年7月4日参照)

Gemma Team, Google DeepMind: Gemma 3 Technical Report, 2025. https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf (2025年7月4日参照)

Posted


Submitted: 2025-07-07 04:43:48 UTC

Published: 2025-07-11 09:21:06 UTC
Section
Information Sciences