Stt-benchmark 语音到文本的转换框架的基准

AI践行者 05-21 128

前言：

如今各位老铁们对“pythonbenchmark”大概比较重视，大家都需要知道一些“pythonbenchmark”的相关资讯。那么小编同时在网络上搜集了一些关于“pythonbenchmark””的相关知识，希望大家能喜欢，兄弟们快快来学习一下吧！

Stt-benchmark是一款语音到文本的转换框架基准。通过深度学习技术，改进先前语音-文本引擎的不足，并将这些优化迁移到低 CPU、低内存占用的物联网平台。

这是一个最小化的，可扩展的框架，为了基准测试speech-to-text引擎。

依赖：

Python3.6

Ubuntu 18.04

数据:

使用Mozilla Common Voice数据集，位置在

指标:

Word Error Rate 单词错误率

Real Time Factor 实时性

Memory 内存

转换引擎：

Mozilla DeepSpeech，一个基于百度DeepSpeech的开源实现。能不依赖语言模型来运行，还不支持嵌入式平台。

Picovoice Cheetah，深度学习技术的引擎，可离线，支持多个嵌入式平台Android, iOS, and Raspberry Pi。

PocketSphinx，可离线，能用于嵌入式平台如Raspberry Pi。

运行：

单词错误率验证：

python benchmark.py --dataset_root COMMON_VOICE_PATH --deep_speech_model_path DEEP_SPEECH_MODELS_PATH/output_graph.pb \

--deep_speech_alphabet_path DEEP_SPEECH_MODELS_PATH/alphabet.txt

实时性验证：

time resources/cheetah/pv_cheetah_app PATH_TO_WAV_FILE resources/cheetah/cheetah_params.pv resources/cheetah/cheetah_linux_eval.lic

内存使用验证；

valgrind --tool=massif pocketsphinx_continuous -infile PATH_TO_WAV_FILE