语音转文字神器,支持13K大小的语音转文字

荐一款基于 OpenAI 的语音转文字的开源工具 - Transcribe,只有不到20K的大小,支持几十种常见的语言。

语音转文字神器,支持13K大小的语音转文字

作者给出了一个demo的界面,如下,试用前需要准备好 OpenAI API key.

语音转文字神器,支持13K大小的语音转文字

先看看效果,我自己先录制了一段30s的MP3音频,如下:

 
下图是识别的效果:
语音转文字神器,支持13K大小的语音转文字

识别的可以还不错吧~~

接下来我试了一段3分钟的VOA英文MP3

效果如下:

语音转文字神器,支持13K大小的语音转文字

左边为工具生成的英文,右边为VOA下载的字幕,准确率还是蛮高的。

除了转成文本外,这个工具还支持将MP3转成SRT、VTT格式。

语音转文字神器,支持13K大小的语音转文字

当然,你还可以把它下载到本地进行使用。

解压之后,双击下图的index.html文件就可以正常使用了。

语音转文字神器,支持13K大小的语音转文字

体验下来感觉还是非常香的,如果你有语音转文字的需求,不妨来试试这个工具吧~~

项目地址及演示地址:

免责说明

本站资源部分来自网友投稿,如有侵犯你的权益请联系管理员或给邮箱发送邮件PubwinSoft@foxmail.com 我们会第一时间进行审核删除。
站内资源为网友个人学习或测试研究使用,未经原版权作者许可,禁止用于任何商业途径!请在下载24小时内删除!


如果遇到评论下载的文章,评论后刷新页面点击对应的蓝字按钮即可跳转到下载页面
本站资源少部分采用7z压缩,为防止有人压缩软件不支持7z格式,7z解压,建议下载7-zip,zip、rar解压,建议下载WinRAR

温馨提示:本站部分付费下载资源收取的费用为资源收集整理费用,并非资源费用,不对下载的资源提供任何技术支持及售后服务。

给TA打赏
共{{data.count}}人
人已打赏
Code开源推荐开源源码

开源推荐:前后端分离的人脸识别登录系统

2023-5-29 10:37:46

Code开源推荐NewBing开源源码

一键部署新必应NewBing网页版,支持ChatGPT-4.0

2023-5-29 16:02:41

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索