艰辛五天:Ubuntu14.04+显卡驱动+cuda+Theano环境安装过程
题记:从一开始不知道显卡就是GPU(虽然是学计算机的,但是我真的不知道…脑残如我也是醉了),到搞好所有这些环境前后弄了5天时间,前面的买显卡、装显卡和装双系统见另一篇博客装显卡、双系统,这篇主要记录我怎么配置后面的环境,虽然中间重装Ubuntu三次,后面安装过程也没差别。
基础平台:64-bit,Ubuntu14.04
1.安装NVIDIA驱动(参考技术文章,基本是复制啊,蟹蟹作者~)
(1) 在官网下载NVIDIA驱动,根据自己买的型号选择下载,放到 /home/lvxia/ 目录下面,我下载的是NVIDIA-Linux-x86_64-367.27.run.
(2) 屏蔽开源驱动 nouveau(原文章说“可以不编辑blacklist.conf,NVIDIA.run驱动程序可以自己停止其他开源驱动,但是需要重启”)
sudo gedit /etc/modprobe.d/blacklist.conf
添加以下内容保存
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
(这里有一行空格)
(3) 删除旧NVIDIA驱动
sudo apt-get --purge remove nvidia-*(需要清除干净)
sudo apt-get --purge remove xserver-xorg-video-nouveau
(4) 重启电脑。
(5) 按Ctrl + Alt +F1(F1~F6均可)到x-server, Ctrl+Alt+F7是返回
(6) 关闭图形环境,否则驱动无法正常安装
输入用户名密码登录,然后键入命令后执行(数字不能用小键盘输入)
sudo service lightdm stop
成功关闭服务后将出现:lightdm stop/waiting
(7) 进入驱动所在的文件夹,这里就是/home/lvxia,执行
sudo sh NVIDIA*.run
原文章链接里的 sudo sh NVIDIA.run 执行失败,键入用户密码。后面就一路Accept就可以~报错The distribution-provided pre-install script failed!不必理会,继续安装。最重要的一步,安装程序问你是否使用nv的xconfig文件,这里一点要选yes,否则在启动x-window时不会使用nv驱动。
至此,安装成功~
(8) 重启 X-window 服务
sudo service lightdm start
查看显卡是否装好,运行
glxinfo | grep rendering
假如显示"direct rendering: Yes",则已安装。
原技术文章写了另一PPA源方法,我没有测验过,就不贴了~~
2.安装Theano、cuda支持
这里看了很多不错的技术博客,但是因为没有一个是完全适合我的情况的,也入了不少坑,所以我自己也记录一个吧~
(1) Ubuntu-安装-theano+caffe-超详细教程
蟹蟹作者们~~
2.1 安装Theano
(1) 预先安装工具
sudo apt-get install -y python-dev python-pip python-nose gcc g++ git gfortran
(2) 安装BLAS, LAPACK, ATLAS
sudo apt-get install -y libopenblas-dev liblapack-dev libatlas-base-dev
(3) 安装NumPy
后面安装的每一步测试为 0 errors,才能进行下一步~~时间都挺长的啊~
sudo pip install numpy
#进行测试。
python -c ‘import numpy; numpy.test()‘
也可以命令python进入—>import numpy—>numpy.test()。
(4) 安装scipy
sudo pip install scipy
python -c ‘import scipy; scipy.test()‘
(5) 安装Theano
sudo pip install Theano
sudo python -c ‘import theano; theano.test()‘
这个测试的时候遇到 ImportError:No module named nose-parameterized 错误,后来执行:
pip install nose_parameterized
再次测试就木有问题啦,等了好久~以上操作我都是参考博客2的,然后后面我按照他的操作装cuda时,install libgl1-mesa-glx的时候出现依赖包问题解决不了,报以下错误:
The following packages have unmet dependencies:
unity-control-center: Depends:libcheese-gtk23(>=3.4.0) but it is not going to be installed
Depends:libcheese7(>=3.0.1) but it is not going to be installed
令人抓狂的错误提示,后面搞这个搞了一两天,最后还是没有正面解决这个问题,不更新/更新系统补丁、不换/换软件源都不行,明明已经安装了依赖的包,但是却总提示包不被安装,最后通过另一篇博客里介绍的方法安装cuda了。。
2.2 安装Cuda(参考博客3)
(1) 验证电脑是否有显卡支持
lspci | grep -i nvidia
我买的是GTX 960,穷人版本…
(2) 查看Linux的版本
uname -m && cat /etc/*release
(3) 查看gcc版本
gcc --version
(4) 下载nvidia cuda的仓库安装包nvidia-cuda,找到自己电脑对应系统对应版本。
注意选择的是deb(network).
wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_7.5-18_amd64.deb
直接下载到主目录下了~~
(5) 安装cuda软件包
sudo dpkg -i cuda-repo-ubuntu1404_7.5-18_amd64.deb
(6) 更新本地仓库
sudo apt-get update
(7) 安装cuda啦
sudo apt-get install cuda
原来的技术博客里说Ubuntu系统安装好后不要更新系统补丁,原因见 博客3.
(8) 测试
echo ‘export PATH=/usr/local/cuda-7.5/bin:$PATH‘ >> ~/.bashrc echo ‘export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH‘ >> ~/.bashrc source ~/.bashrc
这里最好重启一下电脑,因为我按照操作后测试deviceQuery时一开始是不对的,重启电脑后就好了~
2.3 验证
(1) 查看NVCC编译器的版本
nvcc -V i
(2) 查看显卡的驱动版本
cat /proc/driver/nvidia/version
(3) 安装cuda的示例代码
cuda-install-samples-7.5.sh /home/lvxia/cuda
(4) 编译代码
cd cuda/NVIDIA_CUDA-7.5_Samples/
make
(5) 运行代码
cd bin/x86_64/linux/release/ sudo ./deviceQuery sudo ./bandwidthTest
最后一行 result=pass表示通过~
3. 验证环境
(1) 新建test.py,复制如下内容保存,(主目录/home/lvxia下)
from theano import function, config, shared, sandbox import theano.tensor as T import numpy import time vlen = 10 * 30 * 768 # 10 x #cores x # threads per core iters = 1000 rng = numpy.random.RandomState(22) x = shared(numpy.asarray(rng.rand(vlen), config.floatX)) f = function([], T.exp(x)) print(f.maker.fgraph.toposort()) t0 = time.time() for i in xrange(iters): r = f() t1 = time.time() print("Looping %d times took %f seconds" % (iters, t1 - t0)) print("Result is %s" % (r,)) if numpy.any([isinstance(x.op, T.Elemwise) for x in f.maker.fgraph.toposort()]): print(‘Used the cpu‘) else: print(‘Used the gpu‘)
(2)新建 .theanorc 设置GPU代替CPU运算(主目录)
可以使用 gedit 打开,因为 vi 不太会操作。。复制如下内容到文件中保存。这个文件在home目录下看不到,可以通过命令 ls –all 看到的~
[global] floatX=float32 device=gpu
(3) 运行test.py
python test.py
最后一行显示 used the gpu 就对啦~
然后有句提示CNMEM is disabled, cuDNN not available, 资料说CNMEM可以不用管,Theano支持cuDNN(可选),但是Tensorflow必须要cuDNN,所以就装cuDNN了。
(4) 安装cuDNN
cuDNN是专门针对deep learning框架设计的一套GPU计算加速方案,首先需要注册一下,然后才能下载cuDNN。
进入Downloads目录
tar xvzf cudnn-7.5-linux-x64-v5.0-ga.tgz sudo cp cuda/include/cudnn.h /usr/local/cuda/include sudo cd -a cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
有个技术博客里说的问题我这里没遇到。
再运行test.py,提示 CNMEM is disabled, cuDNN 5005对啦~!
后面发现了一些不错的博客,没有测试,贴在这后面看看 使用GPU和Theano加速深度学习、Theano、Lasagne、TensorFlow在Ubuntu支持GPU的安装
end,happy~