龙空技术网

Stt-benchmark 语音到文本的转换框架的基准

AI践行者 108

前言:

如今各位老铁们对“pythonbenchmark”大概比较重视,大家都需要知道一些“pythonbenchmark”的相关资讯。那么小编同时在网络上搜集了一些关于“pythonbenchmark””的相关知识,希望大家能喜欢,兄弟们快快来学习一下吧!

Stt-benchmark是一款语音到文本的转换框架基准。通过深度学习技术,改进先前语音-文本引擎的不足,并将这些优化迁移到低 CPU、低内存占用的物联网平台。

这是一个最小化的,可扩展的框架,为了基准测试speech-to-text引擎。

依赖:

Python3.6

Ubuntu 18.04

数据:

使用Mozilla Common Voice数据集,位置在

指标:

Word Error Rate 单词错误率

Real Time Factor 实时性

Memory 内存

转换引擎:

Mozilla DeepSpeech,一个基于百度DeepSpeech的开源实现。能不依赖语言模型来运行,还不支持嵌入式平台。

Picovoice Cheetah,深度学习技术的引擎,可离线,支持多个嵌入式平台Android, iOS, and Raspberry Pi。

PocketSphinx,可离线,能用于嵌入式平台如Raspberry Pi。

运行:

单词错误率验证:

python benchmark.py --dataset_root COMMON_VOICE_PATH --deep_speech_model_path DEEP_SPEECH_MODELS_PATH/output_graph.pb \

--deep_speech_alphabet_path DEEP_SPEECH_MODELS_PATH/alphabet.txt

实时性验证:

time resources/cheetah/pv_cheetah_app PATH_TO_WAV_FILE resources/cheetah/cheetah_params.pv resources/cheetah/cheetah_linux_eval.lic

内存使用验证;

valgrind --tool=massif pocketsphinx_continuous -infile PATH_TO_WAV_FILE

标签: #pythonbenchmark