parallelcodefoundry
diff --git a/‎.gitignore‎
Lines changed: 1 addition & 0 deletions b/‎.gitignore‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎generate.py‎
Lines changed: 0 additions & 54 deletions b/‎generate.py‎
Lines changed: 0 additions & 54 deletions
diff --git a/‎generate/generate-codellama-13b-prompted.sbatch‎
Lines changed: 40 additions & 0 deletions b/‎generate/generate-codellama-13b-prompted.sbatch‎
Lines changed: 40 additions & 0 deletions
diff --git a/‎generate/generate-codellama-13b.sbatch‎
Lines changed: 39 additions & 0 deletions b/‎generate/generate-codellama-13b.sbatch‎
Lines changed: 39 additions & 0 deletions
diff --git a/‎generate/generate-codellama-34b-prompted.sbatch‎
Lines changed: 44 additions & 0 deletions b/‎generate/generate-codellama-34b-prompted.sbatch‎
Lines changed: 44 additions & 0 deletions
diff --git a/‎generate/generate-codellama-34b.sbatch‎
Lines changed: 43 additions & 0 deletions b/‎generate/generate-codellama-34b.sbatch‎
Lines changed: 43 additions & 0 deletions
diff --git a/‎generate/generate-codellama-7b-prompted.sbatch‎
Lines changed: 40 additions & 0 deletions b/‎generate/generate-codellama-7b-prompted.sbatch‎
Lines changed: 40 additions & 0 deletions
diff --git a/‎generate/generate-codellama-7b.sbatch‎
Lines changed: 39 additions & 0 deletions b/‎generate/generate-codellama-7b.sbatch‎
Lines changed: 39 additions & 0 deletions
diff --git a/‎generate/generate-phind-v2-prompted.sbatch‎
Lines changed: 44 additions & 0 deletions b/‎generate/generate-phind-v2-prompted.sbatch‎
Lines changed: 44 additions & 0 deletions
@@ -4,6 +4,7 @@
 # python
 *.pyc
 __pycache__
+.env
 
 # cpp
 *.out
 
@@ -0,0 +1,40 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 4
+#SBATCH --mem=64000
+#SBATCH -t 23:59:59
+#SBATCH -p gpu
+#SBATCH --gpus=a100:1
+#SBATCH -J generate-codellama-13b-prompted
+#SBATCH -o generate-codellama-13b-prompted-%A.out
+
+# settings
+MODEL="codellama/CodeLlama-13b-hf"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=4
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_prompted_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=~/scratch/.cache/huggingface
+export OMP_NUM_THREADS=4
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE \
+    --prompted
@@ -0,0 +1,39 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 4
+#SBATCH --mem=64000
+#SBATCH -t 23:59:59
+#SBATCH -p gpu
+#SBATCH --gpus=a100:1
+#SBATCH -J generate-codellama-13b-bs4
+#SBATCH -o generate-codellama-13b-bs4-%A.out
+
+# settings
+MODEL="codellama/CodeLlama-13b-hf"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=4
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=~/scratch/.cache/huggingface
+export OMP_NUM_THREADS=4
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE
@@ -0,0 +1,44 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 8
+#SBATCH --ntasks-per-node=1
+#SBATCH --gpus-per-task=1
+#SBATCH --mem=128000
+#SBATCH -t 23:59:59
+#SBATCH -A m2404
+#SBATCH -C gpu&hbm80g
+#SBATCH -q regular
+#SBATCH -J generate-codellama-34b-prompted
+#SBATCH -o generate-codellama-34b-prompted-%A.out
+
+# settings
+MODEL="codellama/CodeLlama-34b-hf"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=8
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_prompted_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=/pscratch/sd/d/dnicho/.cache/huggingface
+export OMP_NUM_THREADS=8
+#export SLURM_CPU_BIND="cores"
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE \
+    --prompted
@@ -0,0 +1,43 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 8
+#SBATCH --ntasks-per-node=1
+#SBATCH --gpus-per-task=1
+#SBATCH --mem=128000
+#SBATCH -t 23:59:59
+#SBATCH -A m2404
+#SBATCH -C gpu&hbm80g
+#SBATCH -q regular
+#SBATCH -J generate-codellama-34b-bs8
+#SBATCH -o generate-codellama-34b-bs8-%A.out
+
+# settings
+MODEL="codellama/CodeLlama-34b-hf"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=8
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=/pscratch/sd/d/dnicho/.cache/huggingface
+export OMP_NUM_THREADS=8
+#export SLURM_CPU_BIND="cores"
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE
@@ -0,0 +1,40 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 4
+#SBATCH --mem=64000
+#SBATCH -t 23:59:59
+#SBATCH -p gpu
+#SBATCH --gpus=a100:1
+#SBATCH -J generate-codellama-7b-prompted
+#SBATCH -o generate-codellama-7b-prompted-%A.out
+
+# settings
+MODEL="codellama/CodeLlama-7b-hf"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=8
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_prompted_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=~/scratch/.cache/huggingface
+export OMP_NUM_THREADS=4
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE \
+    --prompted
@@ -0,0 +1,39 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 4
+#SBATCH --mem=64000
+#SBATCH -t 23:59:59
+#SBATCH -p gpu
+#SBATCH --gpus=a100:1
+#SBATCH -J generate-codellama-7b-bs8
+#SBATCH -o generate-codellama-7b-bs8-%A.out
+
+# settings
+MODEL="codellama/CodeLlama-7b-hf"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=8
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=~/scratch/.cache/huggingface
+export OMP_NUM_THREADS=4
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE
@@ -0,0 +1,44 @@
+#!/bin/bash
+#SBATCH -n 1
+#SBATCH -c 8
+#SBATCH --ntasks-per-node=1
+#SBATCH --gpus-per-task=1
+#SBATCH --mem=128000
+#SBATCH -t 23:59:59
+#SBATCH -A m2404
+#SBATCH -C gpu&hbm80g
+#SBATCH -q regular
+#SBATCH -J generate-phind-v2-prompted
+#SBATCH -o generate-phind-v2-prompted-%A.out
+
+# settings
+MODEL="Phind/Phind-CodeLlama-34B-v2"
+TEMP=0.2
+TOPP=0.95
+MAX_NEW_TKNS=1024
+SAMPLES_PER_PROMPT=20
+BATCH_SIZE=8
+hash=$(md5sum ../prompts/generation-prompts.json | cut -d' ' -f1)
+OUTPUT="../outputs/output_${hash:0:8}_${MODEL//\//--}_prompted_temp${TEMP}.json"
+echo "Writing to $OUTPUT"
+echo "model=$MODEL   MAX_NEW_TKNS=$MAX_NEW_TKNS   SAMPLES_PER_PROMPT=$SAMPLES_PER_PROMPT   BATCH_SIZE=$BATCH_SIZE"
+
+# setup
+ml cuda/11.8.0
+source .env/bin/activate
+export HF_HOME=/pscratch/sd/d/dnicho/.cache/huggingface
+export OMP_NUM_THREADS=8
+#export SLURM_CPU_BIND="cores"
+
+# generate
+srun python generate.py \
+    --model $MODEL \
+    --prompts ../prompts/generation-prompts.json \
+    --output $OUTPUT \
+    --temperature $TEMP \
+    --top_p $TOPP \
+    --do_sample \
+    --max_new_tokens $MAX_NEW_TKNS \
+    --num_samples_per_prompt $SAMPLES_PER_PROMPT \
+    --batch_size $BATCH_SIZE \
+    --prompted