Banking Fraud Detection & Robustness Testing (NLP)

Bu proje, bankacılık sektöründe müşteri iletişim kanalları üzerinden gerçekleştirilen dolandırıcılık (Fraud) girişimlerini tespit etmek ve bu tespitleri yapan modellerin AI Testing (Yapay Zeka Testi) metodolojileriyle dayanıklılığını ölçmek amacıyla geliştirilmiştir.

Proje; sadece bir sınıflandırma modeli değil, aynı zamanda modelin uç durumlarda (Edge Cases) ve yanıltıcı saldırılarda (Adversarial Attacks) nasıl performans gösterdiğini analiz eden kapsamlı bir test çalışmasıdır.

Projenin Temel Amaçları

Dolandırıcılık Tespiti: Müşteri mesajlarındaki sosyal mühendislik ve oltalama (phishing) girişimlerini NLP teknikleriyle saptamak.
Model Şeffaflığı (Explainable AI): Modelin hangi kelimelere neden önem verdiğini (Feature Importance) görselleştirerek "Kara Kutu" (Black Box) sorununu ortadan kaldırmak.
Robusness (Dayanıklılık) Analizi: Modelin karakter manipülasyonları ve bağlamsal hatalara karşı direncini test etmek.

Mimarisi ve Veri Akışı Proje, klasik Makine Öğrenmesi (Machine Learning) yöntemlerini modern veri işleme teknikleriyle birleştirir:

Veri Hazırlama: Bankacılık senaryolarını içeren sentetik bir veri kümesinin oluşturulması.
Feature Engineering: Metinlerin TF-IDF Vectorization (N-gram=1,2) yöntemiyle sayısal vektörlere dönüştürülmesi.
Model Eğitimi: Çoklu karar ağacı yapısına sahip Random Forest Classifier algoritması ile dengeli (balanced) eğitim.
Değerlendirme: Karmaşıklık Matrisi (Confusion Matrix) ve temel metrikler (Accuracy, Recall, Precision, F1) üzerinden analiz.

Profesyonel AI Testing: Edge Case Senaryoları

Adversarial Text Manipulation (Yanıltıcı Metin Manipülasyonu)
Semantic Ambiguity (Anlamsal Belirsizlik & False Positive Kontrolü)
Out-of-Distribution (Kapsam Dışı Veri / Anlamsız Girişler)
Overfitting vs. Professional Language (Maskelenmiş Dolandırıcılık)

Öne Çıkan Bulgular ve Görselleştirmeler

Karar Mekanizması (Feature Importance) Modelin dolandırıcılık tespiti yaparken "hemen", "şüpheli", "iade" ve "şifrenizi" gibi kelimelere en yüksek ağırlığı verdiği saptanmıştır. Bu durum, modelin dolandırıcılık dilindeki "aciliyet" ve "hassas veri talebi" örüntülerini öğrendiğini kanıtlar.
Performans Metrikleri Modelimiz Recall: 1.00 değerine ulaşarak test verisindeki tüm dolandırıcılık vakalarını yakalamayı başarmıştır. Ancak Precision: 0.67 değeri, bazı masum müşteri taleplerinin "False Positive" olarak işaretlendiğini göstermektedir. Bu durum, bankacılık güvenliğinde "güvenli bölgede kalma" stratejisiyle uyumludur.

Kurulum ve Kullanım Repo'yu Klonlayın: git clone https://github.com/mcecen/BankingFraudDetection.git

Gereksinimleri Yükleyin:

pip install pandas scikit-learn matplotlib seaborn

Notebook'u Çalıştırın: aiTestingDemo.ipynb dosyasını Jupyter Notebook veya VS Code üzerinden açarak tüm hücreleri sırayla çalıştırabilirsiniz.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.idea		.idea
.ipynb_checkpoints		.ipynb_checkpoints
.gitignore		.gitignore
README.MD		README.MD
aiTestingDemo.ipynb		aiTestingDemo.ipynb
akis.ipynb		akis.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Banking Fraud Detection & Robustness Testing (NLP)

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Banking Fraud Detection & Robustness Testing (NLP)

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages