CapsWriter离线识别语音输入工具是一款绿色的语音输入类型的工具,能够辅助个人在PC上面完成语音输入的内容,并且支持离线识别的功能,在你下载好相关模型的请款之下能够轻松的进行使用,满足个人用户对于语音输入的需求,快来西西下载CapsWriter离线识别语音输入工具!

CapsWriter离线识别语音输入工具
这是 CapsWriter 简陋的离线版,一个 PC 端的语音输入工具。
运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。
安装说明
安装 Python 后,在 cmd 窗口进入本文件夹,运行 pip install -r requirements.txt 安装依赖
sherpa-onnx-bin 文件夹中已经放置了在 Win10-64 端预先编译的 sherpa-onnx 二进制。
其它系统暂时需要按照 sherpa-onnx — sherpa 1.2 documentation 编译后,放入 sherpa-onnx-bin 文件夹。
运行和使用
运行 01sherpa-onnx-server.py 脚本,会载入 Paraformer 模型识别模型(这会占用1GB的内存,载入时长约十几秒)
运行 02-CapsWriter-client.py 脚本,它会打开系统默认麦克风,开始监听按键
按住 CapsLock 键,录音开始,松开 CapsLock 键,录音结束,识别结果立马被输入(录音时长短于0.3秒不算)
注意事项
目前使用的模型是 Paraformer 非实时模型,即录完再转,因此录音时间越长,上屏延迟越大。
主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每 10s 录音需 0.6s 转录时长。
本地模型对算力要求非常低,基本无需担心性能问题
暂不支持标点符号,暂不支持逆标准化(如把中文数字转阿拉伯数字)
为方便用户检查录音质量、识别效果,脚本默认开启了保存录音,所有都被保存在了 audios 文件夹






















大小: 6.7M
大小: 40.7M
练耳大师中文版(EarMaster)v6.1.620PW 绿色破解版
MP3录音机汉化绿色版
视频音乐提取工具(Moo0 VideoToAudio)V1.11 官方免费版
音乐节拍器v3.4.2 特别版
MP3MP4MP5万能刷机维修工具合集v4.5绿色免费版
Moo0音频格式转换器(Moo0 AudioConverter)1.32 绿色中文版
Lrc歌词编辑器v2012.02.08
Voxengo VariSaturator VST 音频激励器v1.5 特别版
QQ音乐绿钻破解补丁
Eac3to(转换电子和TrueHD技术的AC3音轨到AC3或FLAC)V3.26 绿色英文免费版
Moo0 Mp3InfoEditor(MP3信息编辑)1.21 中文安装版
ImTOO iPhone Ringtone Maker(手机铃声制作)v1.0.17.0710 多国语言特别版
Create Ringtone(定制铃声)V4.97英文绿色特别版