LongCat-Video-Avatar 升级至 1.5 版本后,长视频推理的上下文 latent 逻辑变更:历史片段隐变量需要经过 VAE 解码、重新编码后再作为上下文。而 1.0 方案直接复用上一段 latent,以此避免多次 VAE 编解码带来的画质劣化,想咨询该改动的设计出发点。
LongCat-Video-Avatar 升级至 1.5 版本后,长视频推理的上下文 latent 逻辑变更:历史片段隐变量需要经过 VAE 解码、重新编码后再作为上下文。而 1.0 方案直接复用上一段 latent,以此避免多次 VAE 编解码带来的画质劣化,想咨询该改动的设计出发点。