Skip to content

Latest commit

 

History

History
101 lines (70 loc) · 3.44 KB

File metadata and controls

101 lines (70 loc) · 3.44 KB

📊 Model Optimizer - Краткое руководство

Что это?

Model Optimizer - инструмент для оптимизации затрат на AI модели, аналогичный Google Cloud Vertex AI Model Optimizer.

🚀 Быстрый старт (5 минут)

1. Система уже готова к работе!

Model Optimizer автоматически интегрирован в проект. Никаких дополнительных установок не требуется.

2. Включите автоматическое отслеживание

В вашем коде, где вызываете AI модели, добавьте декоратор:

from backend.optimizer_middleware import track_usage

@track_usage("openai", "gpt-4o", "content_generation")
def generate_content(prompt):
    # Ваш код работы с AI
    return ai_response

Готово! Теперь каждый запрос автоматически логируется.

3. Смотрите рекомендации

Через CLI:

python cli.py
# Выберите пункт 8 - Рекомендации

Через API:

curl http://localhost:5000/api/optimizer/recommendations

💰 Что вы получите?

Автоматически:

  • ✅ Отслеживание каждого запроса к AI
  • ✅ Подсчет реальных затрат
  • ✅ Детальная аналитика по моделям

По запросу:

  • 💡 Рекомендации более дешевых альтернатив
  • 📊 Анализ экономии (до 90%)
  • 📈 Прогноз месячных затрат
  • 🎯 Подбор оптимальной модели для задачи

📊 Пример результата

💡 Found 2 optimization opportunities
💰 Total Potential Savings: $45.60/month

1. openai/gpt-4o → anthropic/claude-3-haiku-20240307
   Savings: 75.0% ($37.50/mo)
   Quality Impact: minimal
   Confidence: 80%

🔗 Подробнее

Полная документация: docs/MODEL_OPTIMIZER.md

⚙️ Конфигурация

# .env
OPTIMIZER_ENABLED=true  # Включен по умолчанию
OPTIMIZER_DB_PATH=data/optimizer.db

📚 Основные API endpoints

Endpoint Описание
GET /api/optimizer/stats Статистика использования
GET /api/optimizer/recommendations Рекомендации по оптимизации
GET /api/optimizer/report Полный отчет
POST /api/optimizer/optimal-model Найти оптимальную модель
GET /api/optimizer/pricing Цены на все модели

🎯 Топ-3 функции

  1. Автоматическое отслеживание - просто добавьте декоратор
  2. Умные рекомендации - система сама найдет экономию
  3. База данных цен - 15+ моделей от 6 провайдеров

💡 Совет

Запускайте анализ раз в неделю через CLI (пункт 8) и применяйте рекомендации с уверенностью 70%+.


Создано: 2025-12-29
Версия: 1.0.0