AI関連論文

AI論文記事のカテゴリ画像自分が読んだAI関連の論文について、日本語解説していきます。

特に、AI(LLM, Diffusionモデルなど)を用いた画像処理(Denoiseや画像再構成、超解像などについての技術論文と
上記技術をエッジデバイスなどに搭載するために必要な縮小・軽量化(Quantization, LoRAなど)がメインになります。

AI関連論文

【論文解説】WindowQuantとは?動画VLMのKV Cacheを軽量化する混合精度量子化手法を解説

動画VLMの推論で問題になるKV Cacheのメモリ使用量と遅延を削減する手法「WindowQuant」を解説します。質問との関連度に応じて動画windowごとにFP16、INT4、INT2を使い分ける混合精度量子化の仕組み、KV Cacheの基礎、実験結果を整理します。
AI関連論文

【論文解説】知識蒸留で実画像ノイズ除去をモバイルNPU向けに高速化する:Real Image Denoising with Knowledge Distillation for High-Performance Mobile NPUs 解説

実画像ノイズ除去をスマートフォンのNPUで高速に動かす論文「Real Image Denoising with Knowledge Distillation for High-Performance Mobile NPUs」を解説します。知識蒸留、NPU向け演算設計、LiteDenoiseNet、PSNR/SSIM、実機推論速度の観点から、画像処理エンジニア向けに要点を整理します。
AI関連論文

【論文解説】 LoRAとは何か?低コストなAIモデル微調整と、学習後にLoRAを圧縮するPARAの解説

LoRAの基本原理、学習コスト削減の仕組み、複数タスク運用でのメリットを解説。さらに論文「Post-Optimization Adaptive Rank Allocation for LoRA」で提案されたPARAによるLoRA圧縮手法を、数式と図で分かりやすく紹介します。
AI関連論文

【論文解説】SplitFT:LLMの分散ファインチューニングを実用化する適応型Split Learning

LLMの分散ファインチューニングを効率化する「SplitFT」を解説。適応型Split LearningとLoRA最適化により、通信コストと計算負荷を大幅削減する最新研究をわかりやすく紹介。
AI関連論文

【論文解説】Diffusionは「均一処理」が無駄?難易度に応じて計算配分する新手法

拡散モデルの計算効率と生成品質を同時に改善する最新研究を解説。画像の難易度に応じて処理を変える「Patch Forcing」の仕組みとメリットをわかりやすく紹介。
スポンサーリンク