开源语音识别funasrwindows版本二进制包_funasr实时语音识别资源-CSDN下载

共34个文件

dll：15个

exe：15个

txt：1个

语音识别

windows

需积分: 21 8 浏览量 2023-11-15 19:51:02 上传评论 2 收藏 79.9MB ZIP 举报

开源语音识别技术在近年来得到了广泛的关注和发展，尤其是在AI领域，它为开发者提供了高效且成本低廉的解决方案。Funasr是一款开源的语音识别软件，专为Windows操作系统设计，并提供了二进制包供用户直接使用。这款软件的核心优势在于其开放源代码，允许开发者深入研究和定制化，以满足特定的应用场景需求。在描述中提到，如果Funasr在运行时遇到问题，可能是因为缺少VC运行时库。VC_redist.x64(2022).exe是一个微软的Visual C++运行时库，它是许多基于C++编译的程序运行所必需的组件。确保安装这个库可以帮助解决运行Funasr时可能出现的兼容性或依赖性问题。在提供的压缩包文件名称列表中，我们可以看到几个关键的动态链接库（DLL）文件，这些是Funasr运行时所依赖的组件： 1. avcodec-60.dll：这是FFmpeg库的一部分，用于处理音频和视频编码。FFmpeg是一个强大的多媒体处理框架，Funasr可能利用了它的功能来处理和解析音频数据。 2. avfilter-9.dll：同样属于FFmpeg，它提供了各种过滤器，用于对音视频流进行处理，如音频转换、音量调整等。 3. avformat-60.dll：FFmpeg的格式库，用于打开、读取和写入多种音频和视频格式的文件，对于处理不同来源的音频至关重要。 4. onnxruntime.dll：这是微软的开放神经网络交换（ONNX）运行时库，它支持多种深度学习模型的运行，Funasr可能使用它来执行语音识别的深度学习模型。 5. avdevice-60.dll：FFmpeg的设备接口库，可能用于处理音频输入设备，如麦克风。 6. libcrypto-1_1-x64.dll 和 libssl-1_1-x64.dll：这两个文件是OpenSSL库的组件，用于加密和安全通信，可能在Funasr中用于保护数据传输的安全。 7. avutil-58.dll：FFmpeg的通用工具库，提供了一些基础的函数和数据结构，用于处理媒体数据。 8. funasr.dll：这是Funasr的核心库文件，包含了主要的语音识别逻辑和功能。通过这些文件，我们可以推断Funasr依赖于FFmpeg进行音频处理，使用ONNXRuntime执行深度学习模型进行语音识别，并通过OpenSSL库保障通信安全。因此，Funasr可能是一个基于深度学习的实时语音转文字工具，适用于开发人员集成到他们的Windows应用中，实现语音交互功能。为了正确运行Funasr，用户需要确保所有依赖项都已安装并配置到位。

资源推荐

资源详情

资源评论

收起资源包目录

funasr.zip （34个子文件）

avdevice-60.dll 4.58MB

funasr-onnx-offline-vad.exe 104KB

funasr-wss-server-2pass.exe 795KB

avfilter-9.dll 25.72MB

funasr-onnx-online-vad.exe 108KB

funasr-wss-server.exe 784KB

funasr-onnx-offline-punc.exe 95KB

funasr-wss-client.exe 754KB

glog.dll 193KB

funasr-onnx-online-punc.exe 96KB

avcodec-60.dll 76.55MB

avformat-60.dll 16.55MB

funasr-onnx-online-rtf.exe 124KB

funasr-onnx-2pass-rtf.exe 144KB

postproc-57.dll 88KB

server.key 2KB

yaml-cpp.dll 242KB

portaudio_x64.dll 164KB

swscale-7.dll 631KB

server.crt 1KB

avutil-58.dll 2.41MB

libcrypto-1_1-x64.dll 3.28MB

test.wav 230KB

使用说明.txt 1014B

onnxruntime.dll 9.51MB

funasr-onnx-offline-rtf.exe 132KB

VC_redist.x64(2022).exe 24.29MB

funasr-onnx-offline.exe 126KB

funasr.dll 1.66MB

funasr-onnx-online-asr.exe 111KB

swresample-4.dll 627KB

funasr-wss-client-2pass.exe 825KB

funasr-onnx-2pass.exe 135KB

libssl-1_1-x64.dll 674KB

下载模型 git clone https://www.modelscope.cn/damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx.git git clone https://www.modelscope.cn/damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx.git git clone https://www.modelscope.cn/damo/speech_fsmn_vad_zh-cn-16k-common-onnx.git git clone https://www.modelscope.cn/thuduj12/fst_itn_zh.git git cloen https://www.modelscope.cn/damo/speech_ngram_lm_zh-cn-ai-wesp-fst.git 启动服务端 funasr-wss-server.exe --certfile server.crt --keyfile server.key --vad-quant true --quantize true --punc-quant true --lm-dir speech_ngram_lm_zh-cn-ai-wesp-fst --model-dir speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx --vad-dir speech_fsmn_vad_zh-cn-16k-common-onnx --punc-dir punc_ct-transformer_cn-en-common-vocab471067-large-onnx --itn-dir fst_itn_zh 启动客户端 funasr-wss-client.exe --wav-path test.wav --port 10095 --server-ip 127.0.0.1 鼎鼎于 2023年11月15日编译我的博客 https://blog.csdn.net/iyaosan/

评论收藏

内容反馈