现在TTS很成熟,很方便,在r.maifeipin.com 中的RSS 语音播报功能。那么把音视频转文字的STT有哪些好的方案呢?Google的AIStudio 就可以,而且可以多人多场景角色模拟自动切换,非常的惊艳,但这个只能试用或者升级收费。有没有免费好用的呢,当然就是whisper ,为了演示...