PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库
https://github.com/PaddlePaddle/PaddleSpeech
文本介绍 Docker 部署方式
依赖环境介绍,docker 环境就不用担心这些:
gcc >= 4.8.5
paddlepaddle <= 2.5.1 桨桨 <= 2.5.1
python >= 3.8
自 2024 年 6 月以来 Docker Hub 访问不了,国内开源厂商镜像如清华等都宣布下架。
// 设置 docker mirrors
sudo vim /etc/docker/daemon.json
{
"registry-mirrors": [
"https://registry.docker-cn.com",
"https://docker.mirrors.ustc.edu.cn",
"https://hub-mirror.c.163.com",
"https://mirror.baidubce.com",
"https://ccr.ccs.tencentyun.com",
"https://dockerhub.icu/"
]
}
# GPU版本
docker pull paddlecloud/paddlespeech:develop-gpu-cuda10.2-cudnn7-latest
# CPU版本
docker pull paddlecloud/paddlespeech:develop-cpu-latest
# 或者使用 docker search paddlespeech 搜索相关的镜像版本
# 启动服务
docker run --name dev -v $PWD:/mnt -p 8888:8888 -p 8090:8090 -it paddlecloud/paddlespeech:develop-cpu-latest /bin/bash
# 自然语言处理工具库NLTK安装
docker 镜像内的目录是 /root/nltk_data/
可以将下载好的传输到服务器上复制到这个目录下如:cp -r /mnt/nltk_data-gh-pages/packages/ /root/nltk_data/
NLTK 数据下载: https://github.com/nltk/nltk_data/archive/refs/heads/gh-pages.zip
// 设置 python pip
pip install xxx -i https://mirror.baidu.com/pypi/simple
or
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
测试数据下载:
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
启动 WEB 服务
paddlespeech_server start --config_file ./demos/speech_server/conf/application.yaml
识别语音命令:
paddlespeech asr --lang zh --input zh.wav
文字转语音命令:
paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav
其他命令请参考开源:
https://github.com/PaddlePaddle/PaddleSpeech
docker 命令回顾
# 查看正在运行的 docker hub
docker ps -a
# 进入一个正在运行的 docker hub
docker attach 36e3553f6bb3
or
docker run -it xxx /bin/bash