国产计算框架mindspore在gpu环境下1.3.0版本的分布式计算组件安装—— (openmpi 和 nccl 的安装,配置,示例代码的运行)
时间:2021-07-27 17:33:28
收藏:0
阅读:0
前文已经给出1.3.0gpu版本的编译及安装,本文在此基础上进行分布式组件的安装,前文信息参看:
国产计算框架mindspore在gpu环境下编译分支r1.3,使用suod权限成功编译并安装,成功运行——(修复部分bug,给出具体编译和安装过程)—— 第一部分:依赖环境的安装
国产计算框架mindspore在gpu环境下编译分支r1.3,使用suod权限成功编译并安装,成功运行——(修复部分bug,给出具体编译和安装过程)—— 第二部分:源码编译及编译后文件安装、运行
===============================================================
OpenMPI-4.0.3
:MindSpore采用的多进程通信库。
OpenMPI-4.0.3源码下载地址:
https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.3.tar.gz
参考OpenMPI官网教程安装:https://www.open-mpi.org/faq/?category=building#easy-build。
先安装依赖环境:
sudo apt-get install libibverbs1
解压:
tar -zxvf openmpi-4.0.3.tar.gz
配置:
./configure --prefix=/usr/local --enable-mpi-threads --enable-progress-threads --enable-shared --with-threads=poxis --enable-mpi-thread-multiple --with-cuda=/usr/local/cuda-11.1
(注意:这里我们假设cuda的安装目录为: /usr/local/cuda-11.1 , 该地址可以按照具体情况进行修改)
编译并安装:
make&&sudo make install
评论(0)