fun-asr-nano 配合 vad ,cam等模型是不是可以支持时间戳返回和说话人分离,或者有什么方法可以实现呢
fun-asr-nano 配合 vad ,cam等模型是不是可以支持时间戳返回和说话人分离,或者有什么方法可以实现呢