好记性不如烂笔头

Kaldi(1)

Posted on By ZealerDrm

如需转载本网站内容,请标明转载来源,且保持作品完整性

2018年9月24日,晚7点,赶往新光电楼匆匆记录

本来不会记录下这些,只是做个PPT而已,但下面这条命令促使我把学习过程一点点写下来保存住。

sudo apt install aptitude

由于输入了这条命令,我鼓捣好的系统以及安装好的软件还有跑完的语音库,被它一条条卸载,最终电脑只剩下一个终端命令框…其他的一点不剩,强制关机后,无法开机。

Kaldi的安装

Kaldi是一款基于C++编写的开源语音识别工具箱,可以在Windows下编译,但最好在Linux下使用。

安装Win10+Linux双系统,连续好几天折腾到凌晨,经历了各种大小的坑,最后跳进了Linux的这个大坑。

我一开始安装的是Ubuntu 18.04版本,但最终选择了Ubuntu 16.04,原因有两个,一是新版本用的人少,有问题解决起来麻烦,二是老师建议使用16.04,对Kaldi支持的更好。

下载

打开终端,把kaldi源程序从github上下载下来,输入:

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

可能会提示,需要安装git,git是一种版本控制软件,输入:

sudo apt-get install git

然后,重新输入下载命令即可。

编译

安装Kaldi需要以下依赖库:

  • itemsubversion
  • automake
  • autoconf
  • libtool
  • g++ zlib
  • libatal
  • wget

使用 sudo apt-get install _ 安装。

在kaldi-trunk/tools和kaldi-trunk/src两个文件夹中,都有INSTALL这个文件,这个就是安装说明书,看这个来安装比任何教程都得心应手!切身体会。

首先,目录切换到tools,输入

extras/check_dependencies.sh

没问题的话继续输入

make -j 2

这个2,指的是处理器核心数,用来并行处理,加快速度。 切换到src目录下,输入:

./configure

用来配置,完成后输入:

make depend -j 2

接着输入

make -j 2

如果没有提示错误,就是已经完成安装。

Kaldi 目录

Kaldi下有三个目录比较重要,./tools,./src,./egs,

./tools

目录下放的是Kaldi依赖的包,主要有:

  1. OpenFST:据说很重要
  2. ATLAS:C++下的线性代数库
  3. IRSTLM:一个统计语言模型的工具包
  4. sph2pipe:宾夕法尼亚大学linguistic data consortium(LDC)开发的一款处理SPHERE_formatted数字音频文件的软件,它可以将LDC的sph格式的文件转换成其它格式。

./src

目录存放的是Kaldi的源代码。

./egs

存放的是Kaldi提供的一些例子,比如下面要运行的yesno,timit,thchs 30实例。

PS:安装Kaldi本身并不难,很让人恼火的是在使用Linux的时候要解决的一系列小问题。比如说,我想听歌,安装了网易云音乐,然后无法通过图标打开,解决如何能打开这个问题就很花费时间,但同时可以更快速的了解Ubuntu系统。