oops-rs
diff --git a/‎README.md‎
Lines changed: 25 additions & 6 deletions b/‎README.md‎
Lines changed: 25 additions & 6 deletions
diff --git a/‎langcodec-cli/README.md‎
Lines changed: 36 additions & 3 deletions b/‎langcodec-cli/README.md‎
Lines changed: 36 additions & 3 deletions
diff --git a/‎langcodec-cli/src/ai.rs‎
Lines changed: 133 additions & 0 deletions b/‎langcodec-cli/src/ai.rs‎
Lines changed: 133 additions & 0 deletions
@@ -27,6 +27,7 @@ With one toolchain, you can:
 - edit files in place across formats
 - normalize files to reduce noisy diffs
 - generate draft translations with AI-backed providers
+- generate translator-facing xcstrings comments from source usage
 
 ## What It Feels Like
 
@@ -47,15 +48,23 @@ langcodec translate \
   --target-lang fr,de,ja \
   --provider openai \
   --model gpt-4.1-mini
+
+# Generate xcstrings comments with source-aware AI annotation
+langcodec annotate \
+  --input Localizable.xcstrings \
+  --source-root Sources \
+  --source-root Modules \
+  --provider openai \
+  --model gpt-4.1-mini
 ```
 
 ## Highlights
 
 - Unified data model for singular and plural translations
 - Read/write support for Apple, Android, CSV, and TSV formats
-- CLI commands for convert, diff, merge, sync, edit, normalize, view, stats, debug, and translate
+- CLI commands for convert, diff, merge, sync, edit, normalize, view, stats, debug, translate, and annotate
 - `.xcstrings` and Android plural support
-- Config-driven translate workflows with `langcodec.toml`
+- Config-driven translate and annotate workflows with `langcodec.toml`
 - Rust library API for building your own tooling on top
 
 ## Installation
@@ -113,28 +122,38 @@ langcodec merge -i a.xcstrings -i b.xcstrings -o merged.xcstrings --strategy las
 langcodec sync --source source.xcstrings --target target.xcstrings --match-lang en
 ```
 
-### Translate with config
+### AI workflows with config
 
 Create a `langcodec.toml` in your project:
 
 ```toml
-[translate]
-source = "locales/Localizable.xcstrings"
+[ai]
 provider = "openai"
 model = "gpt-4.1-mini"
+
+[translate]
+source = "locales/Localizable.xcstrings"
 source_lang = "en"
 target_lang = "fr,de"
 status = ["new", "stale"]
 concurrency = 4
+
+[annotate]
+input = "locales/Localizable.xcstrings"
+source_roots = ["Sources", "Modules"]
+concurrency = 4
 ```
 
 Then run:
 
 ```sh
 langcodec translate
+langcodec annotate
 ```
 
-For larger projects, `translate.sources = [...]` can fan out parallel runs from config.
+`translate` still accepts legacy `translate.provider` and `translate.model` if you have older config files. For larger projects, `translate.sources = [...]` can fan out parallel runs from config.
+
+`annotate` also supports `annotate.inputs = [...]` for config-driven in-place runs across multiple xcstrings files.
 
 More CLI details live in [langcodec-cli/README.md](langcodec-cli/README.md).
 
 
@@ -22,6 +22,7 @@ Supported inputs and outputs:
 - edit translations in place
 - merge or sync catalogs safely
 - draft translations with AI providers
+- generate translator-facing xcstrings comments from source usage
 
 Instead of treating localization as a pile of ad hoc file conversions, `langcodec` gives you one CLI that works across common formats and workflows.
 
@@ -39,6 +40,7 @@ The CLI should teach the detailed usage directly:
 langcodec --help
 langcodec convert --help
 langcodec translate --help
+langcodec annotate --help
 langcodec view --help
 ```
 
@@ -100,26 +102,56 @@ langcodec translate \
 - preflight validation before model requests
 - translation result summaries at the end
 
+### Generate xcstrings comments with AI
+
+```sh
+langcodec annotate \
+  --input Localizable.xcstrings \
+  --source-root Sources \
+  --source-root Modules \
+  --provider openai \
+  --model gpt-4.1-mini
+```
+
+`annotate` supports:
+
+- filling missing xcstrings comments
+- refreshing existing auto-generated comments
+- preserving manual comments
+- config defaults from `langcodec.toml`
+- source shortlisting before agent lookup
+- `--dry-run` and `--check` for CI-friendly runs
+
 ## Example Config
 
 ```toml
-[translate]
-source = "locales/Localizable.xcstrings"
+[ai]
 provider = "openai"
 model = "gpt-4.1-mini"
+
+[translate]
+source = "locales/Localizable.xcstrings"
 source_lang = "en"
 target_lang = "fr,de"
 status = ["new", "stale"]
 concurrency = 4
+
+[annotate]
+input = "locales/Localizable.xcstrings"
+source_roots = ["Sources", "Modules"]
+concurrency = 4
 ```
 
 Then run:
 
 ```sh
 langcodec translate
+langcodec annotate
 ```
 
-For larger repos, `translate.sources = [...]` can fan out parallel runs from config.
+Legacy configs using `translate.provider` and `translate.model` still work. For larger repos, `translate.sources = [...]` can fan out parallel runs from config.
+
+For annotate fan-out runs, use `annotate.inputs = [...]` and omit `annotate.output` so each catalog is updated in place.
 
 ## Main Commands
 
@@ -132,6 +164,7 @@ For larger repos, `translate.sources = [...]` can fan out parallel runs from con
 - `sync`: update existing target entries from a source file
 - `merge`: combine multiple inputs into one output
 - `translate`: draft translations with AI-backed providers
+- `annotate`: generate translator-facing xcstrings comments with AI-backed source lookup
 - `debug`: inspect parsed output as JSON
 
 ## When It Fits Best
 
@@ -0,0 +1,133 @@
+use std::sync::Arc;
+
+use mentra::{BuiltinProvider, provider::{self, Provider}};
+
+#[derive(Debug, Clone, PartialEq, Eq)]
+pub(crate) enum ProviderKind {
+    OpenAI,
+    Anthropic,
+    Gemini,
+}
+
+impl ProviderKind {
+    pub(crate) fn parse(value: &str) -> Result<Self, String> {
+        match value.trim().to_ascii_lowercase().as_str() {
+            "openai" => Ok(Self::OpenAI),
+            "anthropic" => Ok(Self::Anthropic),
+            "gemini" => Ok(Self::Gemini),
+            other => Err(format!(
+                "Unsupported provider '{}'. Expected one of: openai, anthropic, gemini",
+                other
+            )),
+        }
+    }
+
+    pub(crate) fn display_name(&self) -> &'static str {
+        match self {
+            Self::OpenAI => "openai",
+            Self::Anthropic => "anthropic",
+            Self::Gemini => "gemini",
+        }
+    }
+
+    pub(crate) fn api_key_env(&self) -> &'static str {
+        match self {
+            Self::OpenAI => "OPENAI_API_KEY",
+            Self::Anthropic => "ANTHROPIC_API_KEY",
+            Self::Gemini => "GEMINI_API_KEY",
+        }
+    }
+
+    pub(crate) fn builtin_provider(&self) -> BuiltinProvider {
+        match self {
+            Self::OpenAI => BuiltinProvider::OpenAI,
+            Self::Anthropic => BuiltinProvider::Anthropic,
+            Self::Gemini => BuiltinProvider::Gemini,
+        }
+    }
+}
+
+#[derive(Clone)]
+pub(crate) struct ProviderSetup {
+    pub(crate) provider_kind: ProviderKind,
+    pub(crate) provider: Arc<dyn Provider>,
+}
+
+pub(crate) fn resolve_provider(
+    cli: Option<&str>,
+    shared_cfg: Option<&str>,
+    legacy_cfg: Option<&str>,
+) -> Result<ProviderKind, String> {
+    if let Some(value) = cli {
+        return ProviderKind::parse(value);
+    }
+    if let Some(value) = shared_cfg {
+        return ProviderKind::parse(value);
+    }
+    if let Some(value) = legacy_cfg {
+        return ProviderKind::parse(value);
+    }
+
+    let mut available = Vec::new();
+    for kind in [
+        ProviderKind::OpenAI,
+        ProviderKind::Anthropic,
+        ProviderKind::Gemini,
+    ] {
+        if std::env::var(kind.api_key_env()).is_ok() {
+            available.push(kind);
+        }
+    }
+
+    match available.len() {
+        1 => Ok(available.remove(0)),
+        0 => Err(
+            "--provider is required (or set ai.provider in langcodec.toml, or use legacy translate.provider, or configure exactly one provider API key)"
+                .to_string(),
+        ),
+        _ => Err(
+            "Multiple provider API keys are configured; specify --provider or set ai.provider in langcodec.toml"
+                .to_string(),
+        ),
+    }
+}
+
+pub(crate) fn resolve_model(
+    cli: Option<&str>,
+    shared_cfg: Option<&str>,
+    legacy_cfg: Option<&str>,
+) -> Result<String, String> {
+    cli.map(ToOwned::to_owned)
+        .or_else(|| shared_cfg.map(ToOwned::to_owned))
+        .or_else(|| legacy_cfg.map(ToOwned::to_owned))
+        .or_else(|| std::env::var("MENTRA_MODEL").ok())
+        .ok_or_else(|| {
+            "--model is required (or set ai.model in langcodec.toml, or use legacy translate.model, or set MENTRA_MODEL)"
+                .to_string()
+        })
+}
+
+pub(crate) fn read_api_key(kind: &ProviderKind) -> Result<String, String> {
+    std::env::var(kind.api_key_env()).map_err(|_| {
+        format!(
+            "Missing {} environment variable for {} provider",
+            kind.api_key_env(),
+            kind.display_name()
+        )
+    })
+}
+
+pub(crate) fn build_provider(kind: &ProviderKind) -> Result<ProviderSetup, String> {
+    let api_key = read_api_key(kind)?;
+
+    let provider: Arc<dyn Provider> = match kind {
+        ProviderKind::OpenAI => Arc::new(provider::openai::OpenAIProvider::new(api_key)),
+        ProviderKind::Anthropic => Arc::new(provider::anthropic::AnthropicProvider::new(api_key)),
+        ProviderKind::Gemini => Arc::new(provider::gemini::GeminiProvider::new(api_key)),
+    };
+
+    Ok(ProviderSetup {
+        provider_kind: kind.clone(),
+        provider,
+    })
+}