2026-05

AI関連論文

【論文解説】WindowQuantとは?動画VLMのKV Cacheを軽量化する混合精度量子化手法を解説

動画VLMの推論で問題になるKV Cacheのメモリ使用量と遅延を削減する手法「WindowQuant」を解説します。質問との関連度に応じて動画windowごとにFP16、INT4、INT2を使い分ける混合精度量子化の仕組み、KV Cacheの基礎、実験結果を整理します。
AI関連論文

【論文解説】知識蒸留で実画像ノイズ除去をモバイルNPU向けに高速化する:Real Image Denoising with Knowledge Distillation for High-Performance Mobile NPUs 解説

実画像ノイズ除去をスマートフォンのNPUで高速に動かす論文「Real Image Denoising with Knowledge Distillation for High-Performance Mobile NPUs」を解説します。知識蒸留、NPU向け演算設計、LiteDenoiseNet、PSNR/SSIM、実機推論速度の観点から、画像処理エンジニア向けに要点を整理します。
AI関連論文

【論文解説】 LoRAとは何か?低コストなAIモデル微調整と、学習後にLoRAを圧縮するPARAの解説

LoRAの基本原理、学習コスト削減の仕組み、複数タスク運用でのメリットを解説。さらに論文「Post-Optimization Adaptive Rank Allocation for LoRA」で提案されたPARAによるLoRA圧縮手法を、数式と図で分かりやすく紹介します。
AI関連論文

【論文解説】SplitFT:LLMの分散ファインチューニングを実用化する適応型Split Learning

LLMの分散ファインチューニングを効率化する「SplitFT」を解説。適応型Split LearningとLoRA最適化により、通信コストと計算負荷を大幅削減する最新研究をわかりやすく紹介。
スポンサーリンク