1.36秒だと29.97fpsの場合40.76フレーム程度か。
音声オブジェクトの再生位置パラメータでも対応可能かな?
(どのみち映像と音声のズレは再生環境にも依存するし

ただ正直aviutl本体の波形表示って波形編集ツールで見るのと全然違ってピンと来ないんで
あれを見て判断することはあまりできないと思う
音で判断して位置調整することはある