打赏

相关文章

多模态:用大语言模型进行TTS-ASR-OCR

你好,我是程序员贵哥。 说到多模态,最常见的当然是图/文之间的相互转换,也就是给出提示文字,让Stable Diffusion / Midjourney / DALL-E 这样的模型出图。或者是把图片丢给大语言模型,然后让大语言模型给出图片的解说…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部