艰辛五天：Ubuntu14.04+显卡驱动+cuda+Theano环境安装过程

时间：2016-07-11 19:01:15 收藏：0 阅读：18343

题记：从一开始不知道显卡就是GPU（虽然是学计算机的，但是我真的不知道…脑残如我也是醉了），到搞好所有这些环境前后弄了5天时间，前面的买显卡、装显卡和装双系统见另一篇博客装显卡、双系统，这篇主要记录我怎么配置后面的环境，虽然中间重装Ubuntu三次，后面安装过程也没差别。

基础平台：64-bit，Ubuntu14.04

1.安装NVIDIA驱动（参考技术文章，基本是复制啊，蟹蟹作者~）

(1) 在官网下载NVIDIA驱动，根据自己买的型号选择下载，放到 /home/lvxia/ 目录下面，我下载的是NVIDIA-Linux-x86_64-367.27.run.

(2) 屏蔽开源驱动 nouveau（原文章说“可以不编辑blacklist.conf，NVIDIA.run驱动程序可以自己停止其他开源驱动，但是需要重启”)

sudo gedit /etc/modprobe.d/blacklist.conf

添加以下内容保存

blacklist vga16fb 
blacklist nouveau 
blacklist rivafb 
blacklist nvidiafb 
blacklist rivatv 
（这里有一行空格）

(3) 删除旧NVIDIA驱动

sudo apt-get --purge remove nvidia-*(需要清除干净)
sudo apt-get --purge remove xserver-xorg-video-nouveau

(4) 重启电脑。

(5) 按Ctrl + Alt +F1(F1~F6均可)到x-server, Ctrl+Alt+F7是返回

(6) 关闭图形环境，否则驱动无法正常安装

输入用户名密码登录，然后键入命令后执行（数字不能用小键盘输入）

sudo service lightdm stop

成功关闭服务后将出现：lightdm stop/waiting

(7) 进入驱动所在的文件夹，这里就是/home/lvxia，执行

sudo sh NVIDIA*.run

原文章链接里的 sudo sh NVIDIA.run 执行失败，键入用户密码。后面就一路Accept就可以~报错The distribution-provided pre-install script failed!不必理会，继续安装。最重要的一步，安装程序问你是否使用nv的xconfig文件，这里一点要选yes，否则在启动x-window时不会使用nv驱动。

至此，安装成功~

(8) 重启 X-window 服务

sudo service lightdm start

查看显卡是否装好，运行

glxinfo | grep rendering

假如显示"direct rendering: Yes"，则已安装。

原技术文章写了另一PPA源方法，我没有测验过，就不贴了~~

2.安装Theano、cuda支持

这里看了很多不错的技术博客，但是因为没有一个是完全适合我的情况的，也入了不少坑，所以我自己也记录一个吧~

(1) Ubuntu-安装-theano+caffe-超详细教程

(2) Ubuntu 14.04系统安装Nvidia CUDA7.5并搭建Python Theano深度学习开发环境

(3) Ubuntu14.04安装cuda

蟹蟹作者们~~

2.1 安装Theano

(1) 预先安装工具

sudo apt-get install -y python-dev python-pip python-nose gcc g++ git gfortran

(2) 安装BLAS, LAPACK, ATLAS

sudo apt-get install -y libopenblas-dev liblapack-dev libatlas-base-dev

(3) 安装NumPy

后面安装的每一步测试为 0 errors，才能进行下一步~~时间都挺长的啊~

sudo pip install numpy
#进行测试。
python -c ‘import numpy; numpy.test()‘

也可以命令python进入—>import numpy—>numpy.test()。

(4) 安装scipy

sudo pip install scipy
python -c ‘import scipy; scipy.test()‘

(5) 安装Theano

sudo pip install Theano
sudo python -c ‘import theano; theano.test()‘

这个测试的时候遇到 ImportError:No module named nose-parameterized 错误，后来执行：

pip install nose_parameterized

再次测试就木有问题啦,等了好久~以上操作我都是参考博客2的，然后后面我按照他的操作装cuda时，install libgl1-mesa-glx的时候出现依赖包问题解决不了,报以下错误:

The following packages have unmet dependencies:

unity-control-center: Depends:libcheese-gtk23(>=3.4.0) but it is not going to be installed

Depends:libcheese7(>=3.0.1) but it is not going to be installed

令人抓狂的错误提示，后面搞这个搞了一两天，最后还是没有正面解决这个问题，不更新/更新系统补丁、不换/换软件源都不行，明明已经安装了依赖的包，但是却总提示包不被安装，最后通过另一篇博客里介绍的方法安装cuda了。。

2.2 安装Cuda（参考博客3）

(1) 验证电脑是否有显卡支持

lspci | grep -i nvidia

我买的是GTX 960，穷人版本…

(2) 查看Linux的版本

uname -m && cat /etc/*release

(3) 查看gcc版本

gcc --version

(4) 下载nvidia cuda的仓库安装包nvidia-cuda，找到自己电脑对应系统对应版本。

注意选择的是deb(network).

wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_7.5-18_amd64.deb

直接下载到主目录下了~~

(5) 安装cuda软件包

sudo dpkg -i cuda-repo-ubuntu1404_7.5-18_amd64.deb

(6) 更新本地仓库

sudo apt-get update

(7) 安装cuda啦

sudo apt-get install cuda

原来的技术博客里说Ubuntu系统安装好后不要更新系统补丁，原因见博客3.

(8) 测试

echo ‘export PATH=/usr/local/cuda-7.5/bin:$PATH‘ >> ~/.bashrc

echo ‘export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH‘ >> ~/.bashrc

source ~/.bashrc

这里最好重启一下电脑，因为我按照操作后测试deviceQuery时一开始是不对的，重启电脑后就好了~

2.3 验证

(1) 查看NVCC编译器的版本

nvcc -V i

(2) 查看显卡的驱动版本

cat /proc/driver/nvidia/version

(3) 安装cuda的示例代码

cuda-install-samples-7.5.sh /home/lvxia/cuda

(4) 编译代码

cd cuda/NVIDIA_CUDA-7.5_Samples/
make

(5) 运行代码

cd bin/x86_64/linux/release/
sudo ./deviceQuery
sudo ./bandwidthTest

最后一行 result=pass表示通过~

3. 验证环境

(1) 新建test.py，复制如下内容保存，（主目录/home/lvxia下）

from theano import function, config, shared, sandbox
import theano.tensor as T
import numpy
import time
 
vlen = 10 * 30 * 768  # 10 x #cores x # threads per core
iters = 1000
 
rng = numpy.random.RandomState(22)
x = shared(numpy.asarray(rng.rand(vlen), config.floatX))
f = function([], T.exp(x))
print(f.maker.fgraph.toposort())
t0 = time.time()
for i in xrange(iters):
    r = f()
t1 = time.time()
print("Looping %d times took %f seconds" % (iters, t1 - t0))
print("Result is %s" % (r,))
if numpy.any([isinstance(x.op, T.Elemwise) for x in f.maker.fgraph.toposort()]):
    print(‘Used the cpu‘)
else:
    print(‘Used the gpu‘)

(2)新建 .theanorc 设置GPU代替CPU运算(主目录)

可以使用 gedit 打开，因为 vi 不太会操作。。复制如下内容到文件中保存。这个文件在home目录下看不到，可以通过命令 ls –all 看到的~

[global]
floatX=float32
device=gpu

(3) 运行test.py

python test.py

最后一行显示 used the gpu 就对啦~

然后有句提示CNMEM is disabled, cuDNN not available, 资料说CNMEM可以不用管，Theano支持cuDNN（可选），但是Tensorflow必须要cuDNN，所以就装cuDNN了。

(4) 安装cuDNN

cuDNN是专门针对deep learning框架设计的一套GPU计算加速方案，首先需要注册一下，然后才能下载cuDNN。

进入Downloads目录

tar xvzf cudnn-7.5-linux-x64-v5.0-ga.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cd -a cuda/lib64/libcudnn*  /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

有个技术博客里说的问题我这里没遇到。

再运行test.py,提示 CNMEM is disabled, cuDNN 5005对啦~！

后面发现了一些不错的博客，没有测试，贴在这后面看看使用GPU和Theano加速深度学习、Theano、Lasagne、TensorFlow在Ubuntu支持GPU的安装

end,happy~