GitHub - Trojan3877/QUANT-LLM-ASSISTANT: LLM-powered Quantitative research assistant which combines financial data, quantitative models, and natural laungage generation to produce insightful market research reports. AI/ML + FinTech Engineering

QUANT LLM ASSISTANT – Financial Intelligence Platform

Overview

Quant LLM Assistant is a production-grade financial intelligence platform integrating:

Retrieval-Augmented Generation (FAISS)
Real-time Kafka market data ingestion
Redis caching for cost optimization
gRPC + REST inference layers
A/B testing model routing
Drift detection monitoring
Load testing and benchmarking
OpenTelemetry distributed tracing
Kubernetes-ready deployment

Architecture Flow Market Data Stream (Kafka) ↓ Embedding Generator ↓ FAISS Vector Store ↓ LLM Router (A/B Testing) ↓ Redis Cache ↓ gRPC / REST API ↓ Load Balancer ↓ Prometheus + Tracing

Performance Metrics

Metric	Value
Avg REST Latency	110ms
Avg gRPC Latency	65ms
Redis Cache Hit Rate	58%
FAISS Retrieval Time	<15ms
Max Load (Locust)	950 RPS
Drift Sensitivity	0.91

Quick Start

Run Dependencies Run API

uvicorn api.main:app

Run gRPC

python api/grpc_server.py

Run Load Test

Extended Q&A

Why FAISS?

Low-latency semantic retrieval for financial knowledge bases.

Why Redis? Reduces repeated LLM inference costs.

Why gRPC? Improves throughput under high query load.

How is drift detected? Statistical monitoring of embedding distribution shifts.

How does A/B testing work? Weighted routing between model versions.

Roadmap

Multi-region scaling
GPU inference optimization
Risk-based response validation
Real-time portfolio simulation

Name		Name	Last commit message	Last commit date
Latest commit History 78 Commits
.github/workflows		.github/workflows
api		api
benchmarks		benchmarks
caching		caching
docs		docs
group_vars/production		group_vars/production
helm		helm
inventories		inventories
k8s		k8s
load_tests		load_tests
models		models
monitoring		monitoring
notebooks		notebooks
roles		roles
src		src
streaming		streaming
tests		tests
vector_store		vector_store
workflows		workflows
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
File Structure		File Structure
LICENSE		LICENSE
Makefile		Makefile
NEXT_STEPS.md		NEXT_STEPS.md
README.md		README.md
ansible.cfg		ansible.cfg
examples		examples
mcp_config.yaml		mcp_config.yaml
mkdocs.yml		mkdocs.yml
playbook.yml		playbook.yml
requirements.txt		requirements.txt
risk_metrics.ipynb		risk_metrics.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Why FAISS?

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Why FAISS?

About

Topics

Resources

License

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages