feat: Add Nvidia Cloud and Ollama Cloud as CustomProviders

HavenDV · claude · HavenDV · commit 38dee7047d2e · 2026-03-20T17:57:15.000+04:00
Add two new OpenAI-compatible providers for cloud-hosted inference:
- Nvidia NIM (build.nvidia.com) with chat, streaming, tools, and embeddings
- Ollama Cloud (ollama.com) with chat, streaming, and embeddings

Co-Authored-By: Claude Opus 4.6 &lt;noreply@anthropic.com&gt;
diff --git a/CLAUDE.md b/CLAUDE.md
@@ -124,6 +124,8 @@ Each custom provider requires specific environment variables to run its integrat
 | **Nebius** | `NEBIUS_API_KEY` | `Qwen/Qwen2.5-72B-Instruct` | Chat, streaming, tools, embeddings (`BAAI/bge-en-icl`) |
 | **GitHub Models** | `TOKEN_FOR_GITHUB_MODELS` | `gpt-4o` | Chat, streaming, tools, embeddings (`text-embedding-3-small`) |
 | **Hyperbolic** | `HYPERBOLIC_API_KEY`, `HYPERBOLIC_CHAT_MODEL` (optional) | `meta-llama/Llama-3.3-70B-Instruct` | Chat, streaming |
+| **Nvidia** | `NVIDIA_API_KEY`, `NVIDIA_CHAT_MODEL` (optional) | `meta/llama-3.3-70b-instruct` | Chat, streaming, tools, embeddings (`nvidia/nv-embedqa-e5-v5`) |
+| **Ollama Cloud** | `OLLAMA_API_KEY`, `OLLAMA_CLOUD_CHAT_MODEL` (optional) | `llama3.2` | Chat, streaming, embeddings (`nomic-embed-text`) |
 | **Ollama** | *(local, no key)* | `llama3.2` | Chat, streaming (local only) |
 | **LM Studio** | *(local, no key)* | `lmstudio-community/Llama-3.2-3B-Instruct-GGUF` | Chat, streaming (local only) |
 
diff --git a/src/libs/tryAGI.OpenAI/CustomProviders.cs b/src/libs/tryAGI.OpenAI/CustomProviders.cs
@@ -96,6 +96,16 @@ public static class CustomProviders
     /// </summary>
     public const string NebiusBaseUrl = "https://api.studio.nebius.ai/v1/";
 
+    /// <summary>
+    /// https://build.nvidia.com/
+    /// </summary>
+    public const string NvidiaBaseUrl = "https://integrate.api.nvidia.com/v1";
+
+    /// <summary>
+    /// https://ollama.com/
+    /// </summary>
+    public const string OllamaCloudBaseUrl = "https://ollama.com/api/v1";
+
     /// <summary>
     /// Creates an API to use for GitHub Models: https://github.com/marketplace/models
     /// </summary>
@@ -266,4 +276,22 @@ public static OpenAiClient Nebius(string apiKey)
     {
         return new OpenAiClient(apiKey, baseUri: new Uri(NebiusBaseUrl));
     }
+
+    /// <summary>
+    /// Create an API to use for Nvidia NIM.
+    /// </summary>
+    /// <returns></returns>
+    public static OpenAiClient Nvidia(string apiKey)
+    {
+        return new OpenAiClient(apiKey, baseUri: new Uri(NvidiaBaseUrl));
+    }
+
+    /// <summary>
+    /// Create an API to use for Ollama Cloud.
+    /// </summary>
+    /// <returns></returns>
+    public static OpenAiClient OllamaCloud(string apiKey)
+    {
+        return new OpenAiClient(apiKey, baseUri: new Uri(OllamaCloudBaseUrl));
+    }
 }
diff --git a/src/tests/OpenAI.IntegrationTests/CustomProvider.cs b/src/tests/OpenAI.IntegrationTests/CustomProvider.cs
@@ -22,4 +22,6 @@ public enum CustomProvider
     Cerebras,
     Cohere,
     Nebius,
+    Nvidia,
+    OllamaCloud,
 }
diff --git a/src/tests/OpenAI.IntegrationTests/Tests.Chat.cs b/src/tests/OpenAI.IntegrationTests/Tests.Chat.cs
@@ -19,6 +19,8 @@ public partial class Tests
     [DataRow(CustomProvider.Mistral)]
     [DataRow(CustomProvider.Codestral)]
     [DataRow(CustomProvider.Hyperbolic)]
+    [DataRow(CustomProvider.Nvidia)]
+    [DataRow(CustomProvider.OllamaCloud)]
     public async Task GenerateFiveRandomWords(CustomProvider customProvider)
     {
         var pair = GetAuthorizedChatApi(customProvider);
@@ -54,6 +56,8 @@ public async Task GenerateFiveRandomWords(CustomProvider customProvider)
     [DataRow(CustomProvider.Mistral)]
     //[DataRow(CustomProvider.Codestral)]
     [DataRow(CustomProvider.Hyperbolic)]
+    [DataRow(CustomProvider.Nvidia)]
+    [DataRow(CustomProvider.OllamaCloud)]
     public async Task GenerateFiveRandomWordsAsStream(CustomProvider customProvider)
     {
         var pair = GetAuthorizedChatApi(customProvider);
@@ -88,6 +92,8 @@ public async Task GenerateFiveRandomWordsAsStream(CustomProvider customProvider)
     [DataRow(CustomProvider.Groq)]
     //[DataRow(CustomProvider.XAi)]
     [DataRow(CustomProvider.Hyperbolic)]
+    [DataRow(CustomProvider.Nvidia)]
+    [DataRow(CustomProvider.OllamaCloud)]
     public async Task GenerateFiveRandomWordsAsJsonObject(CustomProvider customProvider)
     {
         var pair = GetAuthorizedChatApi(customProvider);
diff --git a/src/tests/OpenAI.IntegrationTests/Tests.ChatClient.CustomProviders.cs b/src/tests/OpenAI.IntegrationTests/Tests.ChatClient.CustomProviders.cs
@@ -341,6 +341,35 @@ public Task ChatClient_Nebius_Streaming() =>
     public Task ChatClient_Nebius_ToolCalling() =>
         ChatClient_CustomProvider_ToolCallingAsync(CustomProvider.Nebius);
 
+    // --- Nvidia ---
+
+    [TestMethod]
+    [Retry(2)]
+    public Task ChatClient_Nvidia_GetResponse() =>
+        ChatClient_CustomProvider_GetResponseAsync(CustomProvider.Nvidia);
+
+    [TestMethod]
+    [Retry(2)]
+    public Task ChatClient_Nvidia_Streaming() =>
+        ChatClient_CustomProvider_StreamingAsync(CustomProvider.Nvidia);
+
+    [TestMethod]
+    [Retry(2)]
+    public Task ChatClient_Nvidia_ToolCalling() =>
+        ChatClient_CustomProvider_ToolCallingAsync(CustomProvider.Nvidia);
+
+    // --- Ollama Cloud ---
+
+    [TestMethod]
+    [Retry(2)]
+    public Task ChatClient_OllamaCloud_GetResponse() =>
+        ChatClient_CustomProvider_GetResponseAsync(CustomProvider.OllamaCloud);
+
+    [TestMethod]
+    [Retry(2)]
+    public Task ChatClient_OllamaCloud_Streaming() =>
+        ChatClient_CustomProvider_StreamingAsync(CustomProvider.OllamaCloud);
+
     // --- GitHub Models ---
 
     //[TestMethod]
diff --git a/src/tests/OpenAI.IntegrationTests/Tests.EmbeddingGenerator.CustomProviders.cs b/src/tests/OpenAI.IntegrationTests/Tests.EmbeddingGenerator.CustomProviders.cs
@@ -129,6 +129,34 @@ public Task EmbeddingGenerator_Nebius_Batch() =>
         EmbeddingGenerator_CustomProvider_BatchAsync(
             CustomProvider.Nebius, "BAAI/bge-en-icl");
 
+    // --- Nvidia ---
+
+    [TestMethod]
+    [Retry(2)]
+    public Task EmbeddingGenerator_Nvidia_Generate() =>
+        EmbeddingGenerator_CustomProvider_GenerateAsync(
+            CustomProvider.Nvidia, "nvidia/nv-embedqa-e5-v5");
+
+    [TestMethod]
+    [Retry(2)]
+    public Task EmbeddingGenerator_Nvidia_Batch() =>
+        EmbeddingGenerator_CustomProvider_BatchAsync(
+            CustomProvider.Nvidia, "nvidia/nv-embedqa-e5-v5");
+
+    // --- Ollama Cloud ---
+
+    [TestMethod]
+    [Retry(2)]
+    public Task EmbeddingGenerator_OllamaCloud_Generate() =>
+        EmbeddingGenerator_CustomProvider_GenerateAsync(
+            CustomProvider.OllamaCloud, "nomic-embed-text");
+
+    [TestMethod]
+    [Retry(2)]
+    public Task EmbeddingGenerator_OllamaCloud_Batch() =>
+        EmbeddingGenerator_CustomProvider_BatchAsync(
+            CustomProvider.OllamaCloud, "nomic-embed-text");
+
     // --- Azure ---
 
     [TestMethod]
diff --git a/src/tests/OpenAI.IntegrationTests/Tests.Helpers.cs b/src/tests/OpenAI.IntegrationTests/Tests.Helpers.cs
@@ -209,6 +209,28 @@ internal static (OpenAiClient Api, string Model) GetAuthorizedChatApi(CustomProv
                 : throw new AssertInconclusiveException("NEBIUS_API_KEY environment variable is not found.")),
                 model ?? "Qwen/Qwen2.5-72B-Instruct");
         }
+        if (customProvider == CustomProvider.Nvidia)
+        {
+            return (CustomProviders.Nvidia(apiKey:
+                Environment.GetEnvironmentVariable("NVIDIA_API_KEY") is { Length: > 0 } nvidiaKeyValue
+                ? nvidiaKeyValue
+                : throw new AssertInconclusiveException("NVIDIA_API_KEY environment variable is not found.")),
+                model ??
+                (Environment.GetEnvironmentVariable("NVIDIA_CHAT_MODEL") is { Length: > 0 } nvidiaModel
+                    ? nvidiaModel
+                    : "meta/llama-3.3-70b-instruct"));
+        }
+        if (customProvider == CustomProvider.OllamaCloud)
+        {
+            return (CustomProviders.OllamaCloud(apiKey:
+                Environment.GetEnvironmentVariable("OLLAMA_API_KEY") is { Length: > 0 } ollamaCloudKeyValue
+                ? ollamaCloudKeyValue
+                : throw new AssertInconclusiveException("OLLAMA_API_KEY environment variable is not found.")),
+                model ??
+                (Environment.GetEnvironmentVariable("OLLAMA_CLOUD_CHAT_MODEL") is { Length: > 0 } ollamaCloudModel
+                    ? ollamaCloudModel
+                    : "llama3.2"));
+        }
 
         var apiKey =
             Environment.GetEnvironmentVariable("OPENAI_API_KEY") is { Length: > 0 } openAiKeyValue

Original file line number	Diff line number	Diff line change
`@@ -22,4 +22,6 @@ public enum CustomProvider`
`22`	`22`	`Cerebras,`
`23`	`23`	`Cohere,`
`24`	`24`	`Nebius,`
	`25`	`+ Nvidia,`
	`26`	`+ OllamaCloud,`
`25`	`27`	`}`