如需转载本网站内容,请标明转载来源,且保持作品完整性
2018年9月24日,晚7点,赶往新光电楼匆匆记录
本来不会记录下这些,只是做个PPT而已,但下面这条命令促使我把学习过程一点点写下来保存住。
sudo apt install aptitude
由于输入了这条命令,我鼓捣好的系统以及安装好的软件还有跑完的语音库,被它一条条卸载,最终电脑只剩下一个终端命令框…其他的一点不剩,强制关机后,无法开机。
Kaldi的安装
Kaldi是一款基于C++编写的开源语音识别工具箱,可以在Windows下编译,但最好在Linux下使用。
安装Win10+Linux双系统,连续好几天折腾到凌晨,经历了各种大小的坑,最后跳进了Linux的这个大坑。
我一开始安装的是Ubuntu 18.04版本,但最终选择了Ubuntu 16.04,原因有两个,一是新版本用的人少,有问题解决起来麻烦,二是老师建议使用16.04,对Kaldi支持的更好。
下载
打开终端,把kaldi源程序从github上下载下来,输入:
git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
可能会提示,需要安装git,git是一种版本控制软件,输入:
sudo apt-get install git
然后,重新输入下载命令即可。
编译
安装Kaldi需要以下依赖库:
- itemsubversion
- automake
- autoconf
- libtool
- g++ zlib
- libatal
- wget
使用 sudo apt-get install _ 安装。
在kaldi-trunk/tools和kaldi-trunk/src两个文件夹中,都有INSTALL这个文件,这个就是安装说明书,看这个来安装比任何教程都得心应手!切身体会。
首先,目录切换到tools,输入
extras/check_dependencies.sh
没问题的话继续输入
make -j 2
这个2,指的是处理器核心数,用来并行处理,加快速度。 切换到src目录下,输入:
./configure
用来配置,完成后输入:
make depend -j 2
接着输入
make -j 2
如果没有提示错误,就是已经完成安装。
Kaldi 目录
Kaldi下有三个目录比较重要,./tools,./src,./egs,
./tools
目录下放的是Kaldi依赖的包,主要有:
- OpenFST:据说很重要
- ATLAS:C++下的线性代数库
- IRSTLM:一个统计语言模型的工具包
- sph2pipe:宾夕法尼亚大学linguistic data consortium(LDC)开发的一款处理SPHERE_formatted数字音频文件的软件,它可以将LDC的sph格式的文件转换成其它格式。
./src
目录存放的是Kaldi的源代码。
./egs
存放的是Kaldi提供的一些例子,比如下面要运行的yesno,timit,thchs 30实例。
PS:安装Kaldi本身并不难,很让人恼火的是在使用Linux的时候要解决的一系列小问题。比如说,我想听歌,安装了网易云音乐,然后无法通过图标打开,解决如何能打开这个问题就很花费时间,但同时可以更快速的了解Ubuntu系统。