万能君的工具箱是网民开发设计的一款常用工具结合,在其中包含大批量音频转文字实用工具,现阶段包含音频转文字、文字转换语音、截屏识别文字、大批量图片识别文字、拷贝汉语翻译、图种制做作用,适用大批量选择音频格式转换,不特惠长,完全免费!
【需求分析报告】
1、音频转文字:现阶段目前市面上的音频转文字大多数收费标准。音频转文字的要求是:提交一段声频,立即鉴别成文本,针对会议纪要的较为管用,留意并不是即时的语音识别技术。
2、文字转换语音:转的视频语音不必太生涩。
3、截屏识别文字(OCR):手机截图进行就可以弹出来截屏所含图片中的文本。
4、大批量图片识别文字:挑选好几张图片,立即鉴别出每一张图片的文本。
5、拷贝汉语翻译:看外文文献,有时懒,假如能有顶置悬浮球,实时监测粘贴板,碰到要想汉语翻译的文章段落,立即拷贝,就可以得出多个国家文字翻译結果也是刚性需求;自然一些毕业论文文字不可以拷贝,因此 还多路复用了截屏OCR的作用,对OCR結果开展汉语翻译。
6、图种制做:这一名不副实,实属个人兴趣爱好,没啥科技含量。
【功能介绍】
要求造成开发设计驱动力,根据百度AI和pyqt5制做了自身的实用工具,解决了所述全部要求,要求也就便是作用了。
1、大批量音频转文字
(1)例如大批量鉴别小学生课文
(2)例如鉴别长达五分钟的《荷塘月色》
(3)鉴别小岳岳的相声小品
2、文字转换语音
这一没有什么好说的,输入文字,挑选音标发音人、声音速度、声调这类的,可试听课,可生产制造mp3格式的影音文件。
3、截屏OCR
点一下截屏按键就可以截屏,自弹出出文字扫描。以下动态图演试,也是个第一版,页面简单。
4、图片大批量鉴别
在截屏OCR往下拉按键有一个图片大批量识别文字作用,这都归属于OCR作用,简单直接,大批量挑选图片,就可以鉴别全部图片中的文本。以下动态图演试:
5、拷贝汉语翻译
看外文文献,有时懒,假如能有顶置悬浮球,实时监测粘贴板,碰到要想汉语翻译的文章段落,立即拷贝,就可以得出多个国家文字翻译結果也是刚性需求;自然一些毕业论文文字不可以拷贝,因此 还多路复用了截屏OCR的作用,对OCR結果开展汉语翻译。以下演试:
6、图种制做
没什么意思,便是将一张图和一个压缩包合拼成一个图片文档,这一形成的图片文档开启是一张图,假如后缀名改动为zip,缓解压力后就能见到原来的压缩包,不做演试了。
【软件实际操作】
开启很有可能慢,且软件打开后带著cmd黑边。
【应用注意事项】
要有API Key、Secret Key,自身去百度注册获得,完全免费能够鉴别五万次哈。
【版本更新】
V2.2版升级:
添加更智能,改动了无法打开的BUG。