昔一回だけやったな
bontsdemuxでm2vとwavで分離
そのあと音声を後から読み込む
aacで吐くと主音声と副音声が同時に再生されるファイルになった記憶がある
うろ覚えだからちょっと自信ないけど