1- FROM nvidia/cuda:11.8.0 -devel-ubuntu22 .04
1+ FROM nvidia/cuda:11.7.1 -devel-ubuntu20 .04
22
33# #############################################################################
44# Temporary Installation Directory
@@ -9,6 +9,8 @@ RUN mkdir -p ${STAGE_DIR}
99# #############################################################################
1010# Installation/Basic Utilities
1111# #############################################################################
12+ ENV DEBIAN_FRONTEND=noninteractive
13+ ENV TZ=America/Los_Angeles
1214RUN apt-get update && \
1315 apt-get install -y --no-install-recommends \
1416 software-properties-common build-essential autotools-dev \
@@ -17,7 +19,7 @@ RUN apt-get update && \
1719 curl wget vim tmux emacs less unzip \
1820 htop iftop iotop ca-certificates openssh-client openssh-server \
1921 rsync iputils-ping net-tools sudo \
20- llvm-14 -dev
22+ llvm-11 -dev
2123
2224# #############################################################################
2325# Installation Latest Git
@@ -41,11 +43,11 @@ RUN cp /etc/ssh/sshd_config ${STAGE_DIR}/sshd_config && \
4143ENV MLNX_OFED_VERSION=5.7-1.0.2.0
4244RUN apt-get install -y libnuma-dev
4345RUN cd ${STAGE_DIR} && \
44- wget -q -O - http://www.mellanox.com/downloads/ofed/MLNX_OFED-${MLNX_OFED_VERSION}/MLNX_OFED_LINUX-${MLNX_OFED_VERSION}-ubuntu22 .04-x86_64.tgz | tar xzf - && \
45- cd MLNX_OFED_LINUX-${MLNX_OFED_VERSION}-ubuntu22 .04-x86_64 && \
46+ wget -q -O - http://www.mellanox.com/downloads/ofed/MLNX_OFED-${MLNX_OFED_VERSION}/MLNX_OFED_LINUX-${MLNX_OFED_VERSION}-ubuntu20 .04-x86_64.tgz | tar xzf - && \
47+ cd MLNX_OFED_LINUX-${MLNX_OFED_VERSION}-ubuntu20 .04-x86_64 && \
4648 ./mlnxofedinstall --user-space-only --without-fw-update --all -q && \
4749 cd ${STAGE_DIR} && \
48- rm -rf ${STAGE_DIR}/MLNX_OFED_LINUX-${MLNX_OFED_VERSION}-ubuntu22 .04-x86_64*
50+ rm -rf ${STAGE_DIR}/MLNX_OFED_LINUX-${MLNX_OFED_VERSION}-ubuntu20 .04-x86_64*
4951
5052# #############################################################################
5153# nv_peer_mem
@@ -90,7 +92,6 @@ RUN mv /usr/local/mpi/bin/mpirun /usr/local/mpi/bin/mpirun.real && \
9092# #############################################################################
9193# Python
9294# #############################################################################
93- ENV DEBIAN_FRONTEND=noninteractive
9495ENV PYTHON_VERSION=3
9596RUN apt-get install -y python3 python3-dev && \
9697 rm -f /usr/bin/python && \
@@ -169,11 +170,11 @@ RUN rm -rf /usr/lib/python3/dist-packages/yaml && \
169170# DeepSpeed
170171# #############################################################################
171172RUN git clone https://github.com/microsoft/DeepSpeed.git ${STAGE_DIR}/DeepSpeed
172- RUN pip install ninja
173+ RUN pip install triton==1.0.0
173174RUN cd ${STAGE_DIR}/DeepSpeed && \
174175 git checkout . && \
175176 git checkout master && \
176- DS_BUILD_FUSED_LAMB=1 DS_BUILD_FUSED_ADAM=1 DS_BUILD_TRANSFORMER=1 DS_BUILD_TRANSFORMER_INFERENCE=1 DS_BUILD_STOCHASTIC_TRANSFORMER=1 DS_BUILD_UTILS=1 DS_BUILD_AIO=1 DS_BUILD_CPU_ADAM =1 pip install .
177+ DS_BUILD_OPS =1 pip install .
177178RUN rm -rf ${STAGE_DIR}/DeepSpeed
178179RUN python -c "import deepspeed; print(deepspeed.__version__)" && ds_report
179180
0 commit comments