CapsWriter-Offline PC 端语音输入工具，自动识别视频字幕（离线识别）

这是 CapsWriter-Offline ，一个 PC 端的语音输入工具。｜同时也支持 macOS M芯片 CPU 机器。
运行后，只要按下键盘上的大写锁定键，就会开始录音，当你松开大写锁定键时，就会识别你的录音，并将识别结果立刻输入。

功能介绍：
1.按下键盘上的大写锁定键，录音开始，当松开大写锁定键时，就会识别你的录音，并将识别结果立刻输入
2.将音视频文件拖动到客户端打开，即可转录生成 srt 字幕。

软件特性
完全离线、无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔
热词功能：可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三种热词，客户端动态载入
日记功能：默认每次录音识别后，识别结果记录在年份/月份/日期.md ，录音文件保存在年份/月份/assets
关键词日记：识别结果若以关键词开头，会被记录在年份/月份/关键词-日期.md，关键词在 keywords.txt 中定义
转录功能：将音视频文件拖动到客户端打开，即可转录生成 srt 字幕
服务端、客户端分离，可以服务多台客户端
编辑 config.py ，可以配置服务端地址、快捷键、录音开关……
Windows 端：
请确保电脑上安装了 Microsoft Visual C++ Redistributable 运行库
服务端载入模型所用的 onnxruntime 只能在 Windows 10 及以上版本的系统使用
服务端载入模型需要系统内存 4G，只能在 64 位系统上使用
额外打包了 32 位系统可用的客户端，在 Windows 7 及以上版本的系统可用
模型文件较大，单独打包，解压模型后请放入软件目录的 models 文件夹中
其它系统：

其它系统，可以下载模型、安装依赖后从 Python 源码运行。
由于我没有 Mac 电脑，无法打包 Mac 版本，只能从源码运行，可能会有诸多问题要解决。（由于系统限制，客户端需要 sudo 启动，且默认快捷键为 right shift）

使用说明

我已经把模型和程序都打包好了，下载就可以直接使用，不需要自己在下载模型。

图片[2]-CapsWriter-Offline PC 端语音输入工具，自动识别视频字幕（离线识别） - 优源网-优源网

功能：转录文件

在服务端运行后，将音视频文件拖动到客户端打开，即可转录生成四个同名文件：

json 文件，包含了字级时间戳
txt 文件，包含了分行结果
merge.txt 文件，包含了带标点的整段结果
srt 文件，字幕文件

如果生成的字幕有微小错误，可以在分行的 txt 文件中修改，然后将 txt 文件拖动到客户端打开，客户端检测到输入的是 txt 文件，就会查到同名的 json 文件，结合 json 文件中的字级时间戳和 txt 文件中修正结果，更新 srt 字幕文件。

注意事项

当用户安装了 FFmpeg 时，会以 mp3 格式保存录音；当用户没有装 FFmpeg 时，会以 wav 格式保存录音
音视频文件转录功能依赖于 FFmpeg，打包版本已内置 FFmpeg
默认的快捷键是 caps lock，你可以打开 core_client.py 进行修改
MacOS 无法监测到 caps lock 按键，可改为 right shift 按键

修改配置

你可以编辑 config.py ，在开头部分有注释，指导你修改服务端、客户端的：

连接的地址和端口，默认是 127.0.0.1 和 6006
键盘快捷键
是否要保存录音文件
要移除识别结果末尾的哪些标点，（如果你想把句尾的问号也删除掉，可以在这边加上）

项目地址

我只提供了win版本，需要其他版本的可以去项目地址下载

https://gitcode.com/HaujetZhao/CapsWriter-Offline/overview

登录后可以使用不限速网盘下载

1 如果您喜欢本站点击这儿多帮忙宣传本站！
2 可能会帮助到你：下载帮助 | 报毒说明 | 进站必看 | 广告合作
3 本站素材资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责
4 本站所有素材资源来源于网络，仅供学习与参考，请于下载后24小时内删除
5 若作商业用途请联系原作者授权，若侵犯了您的权益请联系站长进行删除
6 如需要转载请注明文章出处，本文链接：

THE END