updated

xkd9 · Harika · commit 648f3dc482b5 · 2026-03-04T14:11:47.000-06:00
Signed-off-by: Harika &lt;codewith3@gmail.com&gt;
diff --git a/core/lib/cluster/nodes/add-node.sh b/core/lib/cluster/nodes/add-node.sh
@@ -1,9 +1,5 @@
 
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 add_inference_nodes_playbook() {    
@@ -20,11 +16,7 @@ add_inference_nodes_playbook() {
 
     invoke_prereq_workflows "$@"     
 
-<<<<<<< HEAD
-    ansible-playbook -i "${INVENTORY_PATH}" playbooks/cluster.yml --become --become-user=root 
-=======
     ansible-playbook -i "${INVENTORY_PATH}" playbooks/cluster.yml --become --become-user=root --become-password-file="${BECOME_PASSWORD_FILE}"
->>>>>>> dell-deploy-1.4-nv
     
 }
 
diff --git a/core/lib/cluster/state/cluster-state-check.sh b/core/lib/cluster/state/cluster-state-check.sh
@@ -1,17 +1,9 @@
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 check_cluster_state() {
     echo "Checking the state of the Kubernetes cluster..."
-<<<<<<< HEAD
-    ansible-playbook -i inventory/mycluster/hosts.yaml --become --become-user=root upgrade-cluster.yml --check
-=======
     ansible-playbook -i inventory/mycluster/hosts.yaml --become --become-user=root --become-password-file="${BECOME_PASSWORD_FILE}" upgrade-cluster.yml --check
->>>>>>> dell-deploy-1.4-nv
     # Check the exit status of the Ansible playbook command
     if [ $? -eq 0 ]; then
         echo "Kubernetes cluster state check completed successfully."
@@ -23,10 +15,6 @@ check_cluster_state() {
 
 run_k8s_cluster_wait() {
     echo "Waiting for Kubernetes control plane to become ready..."
-<<<<<<< HEAD
-    ansible -i "${INVENTORY_PATH}" kube_control_plane -m wait_for -a "port=6443 timeout=600" --become --become-user=root   
-=======
     ansible -i "${INVENTORY_PATH}" kube_control_plane -m wait_for -a "port=6443 timeout=600" --become --become-user=root --become-password-file="${BECOME_PASSWORD_FILE}"
->>>>>>> dell-deploy-1.4-nv
     return $?
 }
diff --git a/core/lib/components/intel-base-operator.sh b/core/lib/components/intel-base-operator.sh
@@ -1,8 +1,4 @@
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 run_deploy_habana_ai_operator_playbook() {
@@ -15,19 +11,11 @@ run_deploy_habana_ai_operator_playbook() {
     else
         gaudi_operator=""
     fi    
-<<<<<<< HEAD
-    ansible-playbook -i "${INVENTORY_PATH}" --become --become-user=root playbooks/deploy-habana-ai-operator.yml --extra-vars "gaudi_operator=${gaudi_operator}"
-=======
     ansible-playbook -i "${INVENTORY_PATH}" --become --become-user=root --become-password-file="${BECOME_PASSWORD_FILE}" playbooks/deploy-habana-ai-operator.yml --extra-vars "gaudi_operator=${gaudi_operator}"
->>>>>>> dell-deploy-1.4-nv
     if [ $? -eq 0 ]; then
         echo "The deploy-habana-ai-operator.yml playbook ran successfully."
     else
         echo "The deploy-habana-ai-operator.yml playbook encountered an error."
         exit 1
     fi
-<<<<<<< HEAD
 }
-=======
-}
->>>>>>> dell-deploy-1.4-nv
diff --git a/core/lib/components/observability-controller.sh b/core/lib/components/observability-controller.sh
@@ -1,8 +1,4 @@
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 deploy_observability_playbook() {
@@ -22,10 +18,5 @@ deploy_observability_playbook() {
 
     local extra_vars="secret_name=${cluster_url} cert_file=${cert_file} key_file=${key_file} deploy_observability=${deploy_observability} deploy_logging=${deploy_logging} observability_stack_chart_version=${observability_stack_chart_version} kubernetes_platform=${kubernetes_platform}"
 
-<<<<<<< HEAD
-    ansible-playbook -i "${INVENTORY_PATH}" "$playbook_path" --become --become-user=root --extra-vars "$extra_vars" --tags "$tags" --vault-password-file "$vault_pass_file"
-}
-=======
     ansible-playbook -i "${INVENTORY_PATH}" "$playbook_path" --become --become-user=root --become-password-file="${BECOME_PASSWORD_FILE}" --extra-vars "$extra_vars" --tags "$tags" --vault-password-file "$vault_pass_file"
 }
->>>>>>> dell-deploy-1.4-nv
diff --git a/core/lib/models/install-model-hf.sh b/core/lib/models/install-model-hf.sh
@@ -1,9 +1,5 @@
 
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 deploy_from_huggingface() {
diff --git a/core/lib/models/install-model.sh b/core/lib/models/install-model.sh
@@ -1,8 +1,4 @@
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 deploy_inference_llm_models_playbook() {
@@ -14,10 +10,7 @@ deploy_inference_llm_models_playbook() {
         cpu_playbook="true"
         gpu_playbook="false"
         gaudi_deployment="false"
-<<<<<<< HEAD
-=======
         nvidia_deployment="false"
->>>>>>> dell-deploy-1.4-nv
         enable_cpu_balloons="true"  # Enable NRI balloons for CPU deployments
         huggingface_model_deployment_name="${huggingface_model_deployment_name}-cpu"
         if [ "$balloon_policy_cpu" == "enabled" ]; then
@@ -27,17 +20,13 @@ deploy_inference_llm_models_playbook() {
     if [ "$cpu_or_gpu" == "g" ]; then
         cpu_playbook="false"
         gpu_playbook="true"
-<<<<<<< HEAD
-        gaudi_deployment="true"
-=======
         if [ "$gpu_vendor" == "nvidia" ]; then
             gaudi_deployment="false"
             nvidia_deployment="true"
         else
             gaudi_deployment="true"
             nvidia_deployment="false"
         fi
->>>>>>> dell-deploy-1.4-nv
         enable_cpu_balloons="false"
     fi
     if [ "$deploy_apisix" == "no" ]; then        
@@ -61,19 +50,13 @@ deploy_inference_llm_models_playbook() {
     elif [[ "$gaudi_platform" == "gaudi3" ]]; then
         gaudi_values_file=$gaudi3_values_file_path
     fi    
-<<<<<<< HEAD
-=======
     nvidia_values_file=$nvidia_values_file_path
->>>>>>> dell-deploy-1.4-nv
 
     echo "Ingress based Deployment: $ingress_enabled"
     echo "APISIX Enabled: $apisix_enabled"
     echo "Keycloak Enabled: $deploy_keycloak"    
     echo "Gaudi based: $gaudi_deployment"
-<<<<<<< HEAD
-=======
     echo "NVIDIA based: $nvidia_deployment"
->>>>>>> dell-deploy-1.4-nv
     echo "Model Metrics Enabled: $vllm_metrics_enabled"
     echo "CPU NRI Balloons: $enable_cpu_balloons"
     
@@ -103,11 +86,7 @@ deploy_inference_llm_models_playbook() {
     fi
         
     ansible-playbook -i "${INVENTORY_PATH}" playbooks/deploy-inference-models.yml \
-<<<<<<< HEAD
-        --extra-vars "kubernetes_platform=${kubernetes_platform} secret_name=${cluster_url} cert_file=${cert_file} key_file=${key_file} keycloak_admin_user=${keycloak_admin_user} keycloak_admin_password=${keycloak_admin_password} keycloak_client_id=${keycloak_client_id} hugging_face_token=${hugging_face_token} install_true=${install_true} model_name_list='${model_name_list//\ /,}' cpu_playbook=${cpu_playbook} gpu_playbook=${gpu_playbook} hugging_face_token_falcon3=${hugging_face_token_falcon3} deploy_keycloak=${deploy_keycloak} apisix_enabled=${apisix_enabled} ingress_enabled=${ingress_enabled} gaudi_deployment=${gaudi_deployment} huggingface_model_id=${huggingface_model_id} hugging_face_model_deployment=${hugging_face_model_deployment} huggingface_model_deployment_name=${huggingface_model_deployment_name} deploy_inference_llm_models_playbook=${deploy_inference_llm_models_playbook} huggingface_tensor_parellel_size=${huggingface_tensor_parellel_size} deploy_genai_gateway=${deploy_genai_gateway} vllm_metrics_enabled=${vllm_metrics_enabled} gaudi_values_file=${gaudi_values_file} xeon_values_file=${xeon_values_file_path} deploy_ceph=${deploy_ceph} enable_cpu_balloons=${enable_cpu_balloons} balloon_policy_cpu=${balloon_policy_cpu} aws_certificate_arn=${aws_certificate_arn}" --tags "$tags" --vault-password-file "$vault_pass_file"
-=======
         --extra-vars "kubernetes_platform=${kubernetes_platform} secret_name=${cluster_url} cert_file=${cert_file} key_file=${key_file} keycloak_admin_user=${keycloak_admin_user} keycloak_admin_password=${keycloak_admin_password} keycloak_client_id=${keycloak_client_id} hugging_face_token=${hugging_face_token} install_true=${install_true} model_name_list='${model_name_list//\ /,}' cpu_playbook=${cpu_playbook} gpu_playbook=${gpu_playbook} hugging_face_token_falcon3=${hugging_face_token_falcon3} deploy_keycloak=${deploy_keycloak} apisix_enabled=${apisix_enabled} ingress_enabled=${ingress_enabled} gaudi_deployment=${gaudi_deployment} nvidia_deployment=${nvidia_deployment} huggingface_model_id=${huggingface_model_id} hugging_face_model_deployment=${hugging_face_model_deployment} huggingface_model_deployment_name=${huggingface_model_deployment_name} deploy_inference_llm_models_playbook=${deploy_inference_llm_models_playbook} huggingface_tensor_parellel_size=${huggingface_tensor_parellel_size} deploy_genai_gateway=${deploy_genai_gateway} vllm_metrics_enabled=${vllm_metrics_enabled} gaudi_values_file=${gaudi_values_file} nvidia_values_file=${nvidia_values_file} xeon_values_file=${xeon_values_file_path} deploy_ceph=${deploy_ceph} enable_cpu_balloons=${enable_cpu_balloons} balloon_policy_cpu=${balloon_policy_cpu} aws_certificate_arn=${aws_certificate_arn}" --tags "$tags" --vault-password-file "$vault_pass_file"
->>>>>>> dell-deploy-1.4-nv
 
 }
 
@@ -138,27 +117,7 @@ add_model() {
         setup_bastion "$@"
         INVENTORY_PATH=$brownfield_deployment_host_file
         fi        
-<<<<<<< HEAD
-        invoke_prereq_workflows "$@"               
-
-        # Deploy NRI CPU Balloons for CPU deployments (after all infrastructure, before models)
-        if [[ "$deploy_nri_balloon_policy" == "yes" ]]; then
-            # Ensure this is a CPU deployment
-            if [[ "$cpu_or_gpu" != "c" ]]; then
-                    echo "${RED}Error: NRI Balloon Policy can only be deployed for CPU deployments (cpu_or_gpu='c')${NC}"
-                    echo "${RED}Current cpu_or_gpu setting: '$cpu_or_gpu'${NC}"
-                    echo "${RED}Please set cpu_or_gpu to 'c' or disable NRI balloon policy deployment. Exiting!${NC}"
-                    exit 1
-            fi
-            execute_and_check "Deploying CPU Optimization (NRI Balloons & Topology Detection)..." deploy_nri_balloons_playbook "$@" \
-                "CPU optimization deployed successfully." \
-                "Failed to deploy CPU optimization. Exiting!."
-        else
-            echo "Skipping CPU optimization deployment..."
-        fi
-=======
         invoke_prereq_workflows "$@"                
->>>>>>> dell-deploy-1.4-nv
         execute_and_check "Deploying Inference LLM Models..." deploy_inference_llm_models_playbook "$@" \
             "Inference LLM Model is deployed successfully." \
             "Failed to deploy Inference LLM Model Exiting!." 
@@ -175,8 +134,4 @@ add_model() {
         echo "Please refer to this comprehensive guide for detailed instructions."          
         echo ""
     fi
-<<<<<<< HEAD
-}
-=======
 }
->>>>>>> dell-deploy-1.4-nv
diff --git a/core/lib/models/model-selection.sh b/core/lib/models/model-selection.sh
@@ -1,8 +1,4 @@
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 model_selection(){
@@ -44,19 +40,12 @@ model_selection(){
                             echo "12. BAAI/bge-reranker-base"
                             echo "13. codellama/CodeLlama-34b-Instruct-hf"
                             echo "14. tiiuae/Falcon3-7B-Instruct"
-<<<<<<< HEAD
-=======
                             echo "15. meta-llama/Llama-3.2-3B-Instruct"
->>>>>>> dell-deploy-1.4-nv
                             read -p "Enter the numbers of the GPU models you want to deploy/remove (comma-separated, e.g., 1,3,5): " models
                             # Validate input
                             IFS=',' read -ra selected <<< "$models"
                             for m in "${selected[@]}"; do
-<<<<<<< HEAD
-                                if ! [[ "$m" =~ ^(1|2|3|4|5|6|7|8|9|10|11|12|13|14)$ ]]; then
-=======
                                 if ! [[ "$m" =~ ^(1|2|3|4|5|6|7|8|9|10|11|12|13|14|15)$ ]]; then
->>>>>>> dell-deploy-1.4-nv
                                     echo "Error: Invalid model selected ($m). Exiting." >&2
                                     exit 1
                                 fi
@@ -212,16 +201,13 @@ get_model_names() {
                 fi
                 model_names+=("falcon3-7b")
                 ;;
-<<<<<<< HEAD
-=======
             15)
                 if [ "$cpu_or_gpu" = "c" ]; then
                     echo "Error: GPU model identifier provided for CPU deployment/removal." >&2
                     exit 1
                 fi
                 model_names+=("llama-3-2-3b")
                 ;;
->>>>>>> dell-deploy-1.4-nv
             21)
                 if [ "$cpu_or_gpu" = "g" ]; then
                     echo "Error: CPU model identifier provided for GPU deployment/removal." >&2
@@ -264,11 +250,7 @@ get_model_names() {
                 fi
                 model_names+=("cpu-qwen3-4b")
                 ;;
-<<<<<<< HEAD
-            "llama-8b"|"llama-70b"|"codellama-34b"|"mixtral-8x-7b"|"mistral-7b"|"tei"|"tei-rerank"|"falcon3-7b"|"deepseek-r1-distill-qwen-32b"|"deepseek-r1-distill-llama8b"|"llama3-405b"|"llama-3-3-70b"|"llama-4-scout-17b"|"qwen-2-5-32b")
-=======
             "llama-8b"|"llama-70b"|"codellama-34b"|"mixtral-8x-7b"|"mistral-7b"|"tei"|"tei-rerank"|"falcon3-7b"|"deepseek-r1-distill-qwen-32b"|"deepseek-r1-distill-llama8b"|"llama3-405b"|"llama-3-3-70b"|"llama-4-scout-17b"|"qwen-2-5-32b"|"llama-3-2-3b")
->>>>>>> dell-deploy-1.4-nv
                 if [ "$cpu_or_gpu" = "c" ]; then
                     echo "Error: GPU model identifier provided for CPU deployment/removal." >&2
                     exit 1
diff --git a/core/lib/system/config-vars.sh b/core/lib/system/config-vars.sh
@@ -1,18 +1,11 @@
-<<<<<<< HEAD
 # Copyright (C) 2025-2026 Intel Corporation
-=======
-# Copyright (C) 2024-2025 Intel Corporation
->>>>>>> dell-deploy-1.4-nv
 # SPDX-License-Identifier: Apache-2.0
 
 HOMEDIR="$(pwd)"
 KUBESPRAYDIR="$(dirname "$(realpath "$0")")/kubespray"
 VENVDIR="$(dirname "$(realpath "$0")")/kubespray225-venv"
 INVENTORY_PATH="${KUBESPRAYDIR}/inventory/mycluster/hosts.yaml"
-<<<<<<< HEAD
-=======
 BECOME_PASSWORD_FILE="$(dirname "$(realpath "$0")")/inventory/.become-passfile"
->>>>>>> dell-deploy-1.4-nv
 # Set the default values for the parameters
 cluster_url=""
 cert_file=""
@@ -24,15 +17,10 @@ hugging_face_token=""
 models=""
 model_name_list=""
 cpu_or_gpu=""
-<<<<<<< HEAD
-deploy_kubernetes_fresh=""
-deploy_habana_ai_operator=""
-=======
 gpu_vendor=""
 deploy_kubernetes_fresh=""
 deploy_habana_ai_operator=""
 deploy_nvidia_operator=""
->>>>>>> dell-deploy-1.4-nv
 deploy_ingress_controller=""
 deploy_genai_gateway=""
 deploy_llm_models=""
@@ -58,10 +46,7 @@ gaudi_platform=""
 gaudi_operator=""
 gaudi2_values_file_path=""
 gaudi3_values_file_path=""
-<<<<<<< HEAD
-=======
 nvidia_values_file_path=""
->>>>>>> dell-deploy-1.4-nv
 python3_interpreter=""
 skip_check=""
 purge_inference_cluster=""
diff --git a/core/lib/system/precheck/prereq-check.sh b/core/lib/system/precheck/prereq-check.sh