978コメント379KB

【超解像】Lada part4

レス数が950を超えています。1000を超えると書き込みができなくなります。

965名無しさん＠お腹いっぱい。

2026/06/27(土) 21:13:44.57ID:NF/mC53i0

FC2で集めた無修正動画を使って自分で　lada_mosaic_restoration_model_generic_v1.2.pth　を Fine tune して新しいモデル作ったわ
もうね、二次修復しなくてもクッキリ見える

966名無しさん＠お腹いっぱい。

2026/06/27(土) 21:21:46.64ID:NF/mC53i0

自分で　lada_mosaic_restoration_model_generic_v1.2.pth　を作ってみて分かったけど、
>>1 で紹介されてる　lada_mosaic_restoration_model_generic_v1.2_full.pth　は意味ない

https://github.com/ladaapp/lada/blob/main/docs/training_and_dataset_creation.md
での、stage2 終了直後のものが　lada_mosaic_restoration_model_generic_v1.2_full.pth　

で、そこから　export-weights-basicvsrpp-stage2-for-inference.py　を実行して、モザイク破壊に必要な情報だけを抜き取ったやつが lada_mosaic_restoration_model_generic_v1.2.pth

破壊結果は full でも fullじゃなくても同じ

967名無しさん＠お腹いっぱい。

2026/06/27(土) 21:24:36.83ID:NF/mC53i0

5070ti 16GB なら
stage1の学習で16時間（iter 100000）
stage2の学習で18時間（iter 100000に変更）
で出来る
unetに課金するより、自分でモデルを作った方がいいよ

968名無しさん＠お腹いっぱい。

2026/06/27(土) 21:43:21.24ID:wpQTfNVF0

>>965
HFで公開してる人かな？

969名無しさん＠お腹いっぱい。

2026/06/27(土) 22:17:34.60ID:QM7vauQn0

処理の高速化に行き詰まっていて、これ以上は復元モデル小型化とかの再学習に手を出すしか無いのか、とか思っているんだけど、
その学習データセット準備と確認にどんだけ時間ががかかるんだろうか？
数千クリップのサムネとか誤検知の確認やったら時間〜日オーダーっすよね・・・

970名無しさん＠お腹いっぱい。

2026/06/27(土) 23:01:39.12ID:NF/mC53i0

集めた無修正動画を１つのディレクトリにおいて　create-mosaic-restoration-dataset.py　を実行すれば全部自動で学習データを作ってくれるぞ
２時間くらいの動画なら100~400個くらいのクリップが出来る
自分で切り出す必要はない

971名無しさん＠お腹いっぱい。

2026/06/28(日) 00:25:02.51ID:ptYoGEab0

こういうのってモザ前後で学習するもんだと思ってたけど非モザだけで良いのか

972名無しさん＠お腹いっぱい。

2026/06/28(日) 01:00:16.71ID:zCQoUJQw0

学習時にバイナリマスクに合わせてモザかかってるデータも作ってたはず
実写はデータ豊富で羨ましいな
アニメはデータが限られてて1ヶ月かけても仕上がりに納得がいかなかったよ

973名無しさん＠お腹いっぱい。

2026/06/28(日) 01:30:06.86ID:Ip6T25wN0

>>970
やってみたいから、もう少し詳しくやり方教えて

974名無しさん＠お腹いっぱい。

2026/06/28(日) 02:05:16.17ID:TfNlxNEk0

>>965
うpきぼんぬ

975名無しさん＠お腹いっぱい。

2026/06/28(日) 02:46:34.72ID:WH2KvNU40

>>971
学習の stage1 で自動的に様々な大きさのモザイクを掛けた上で
モザ無し画像とモザ有り画像とを使って教師学習させてる

976名無しさん＠お腹いっぱい。

2026/06/28(日) 03:06:12.85ID:BgddJsgz0

FC2500が一番いいような気がする

977名無しさん＠お腹いっぱい。

2026/06/28(日) 07:54:45.98ID:bvZlYxkp0

>>970
5070tiでいいモデルを作れるんなら、作者の人にやり方教えてあげればめっちゃ喜ぶと思うよ
寄付を募ってるのは復元モデル制作用のサーバー借りる資金を作るためだそうなんで

978名無しさん＠お腹いっぱい。

2026/06/28(日) 08:25:52.57ID:AyRIpcz80

>>966
復元モデルのv1.2とv1.2_fullの違いだが意味ないことは無いよ
jasna v0.7.2 (処理パイプラインが決定的であることは確認済み) で出力動画のSSIMを取ってみると
HD動画の入力について、v1.2の処理結果を基準としてv1.2_full処理結果と全体SSIMを測定　→　0.9955
と微妙に1ではないので、復元モデルの差分がフレームに反映されてる

GridPlayerで並べて目視比較してもv1.2_fullの方がディテールがよくなっている部分ある
意味あるかどうかは素材によりけりってことで

決定的：同じモデル・パラメタで何回実行しても結果が変わらないこと

スレをまとめに
5ch即うp → gzo.ai

新着レスの表示

レスを投稿する

レス数が950を超えています。1000を超えると書き込みができなくなります。