2億2600万パラメーターで100億パラメーター級の画像補完性能を示すAIフレームワーク「Moebius」、不要物の除去や顔の置き換えが可能
2026年06月23日 12時32分
https://gigazine.net/news/20260623-moebius-image-inpainting-framework/
中国の華中科技大学とVIVO AI Labの共同研究チームが、画像の欠損領域を周囲と自然につながるように生成する「インペインティング」向けの軽量AIフレームワーク「Moebius」を発表しました。Moebiusは約2億2600万パラメーターで動作しながら、100億パラメーター級の大規模産業用モデルに近い、あるいは一部の評価で上回る品質を目指した用途特化型モデルです。
夜道を歩くカップル以外の群衆をきれいに消すことができています。
風景写真から邪魔なオブジェクトを削除。大きな破綻は見られません。
人の顔に大きくマスクをかけて補完処理をするとこんな感じ。さすがに元の顔とはまったく違う顔になってはいるものの、写真自体には破綻がなく、元を知らなければ自然な写真に見えるレベル。
論文では、Places2のテスト設定でLλMIブロックと軽量化処理の効果も比較しています。従来型の構成は約5億2600万パラメーター・約314GFLOPsでしたが、Local-λとInteractive-λを導入した構成では約4億8500万パラメーターまで削減され、画質指標もほぼ維持されました。さらにDepthwise ConvolutionとMix-FFNを組み合わせた最終構成では、パラメーター数を約2億2600万、計算量を約154GFLOPsまで削減しました。その際の評価値はFIDが約26、LPIPSが約0.26と、軽量化後も補完画像の品質を一定水準に維持しています。
研究チームは、約2億2600万パラメーターのMoebiusは10B級の汎用モデルに近い画像補完品質を示しながら、総推論時間で15倍超の高速化を達成したと報告しています。同時に、この結果は画像補完や不要物除去のように目的が明確な用途ではモデルを単に大型化するのではなく、タスクに特化した軽量設計によって高品質と実用的な処理速度を両立できる可能性を示していると論じました。