enron_spam_detection

Bu proje, 33.000'den fazla e-posta barındıran Enron veri seti üzerinde veri madenciliği ve doğal dil işleme (NLP) teknikleri kullanılarak geliştirilmiş otomatik bir spam tespit sistemidir. Gelen mesajların metin içeriklerini analiz ederek "Spam" (istenmeyen) veya "Ham" (normal) olarak sınıflandırmayı amaçlayan çalışmada, veri ön işleme ve TF-IDF (N-Gram) vektörleştirme adımlarının ardından Logistic Regression ve Multinomial Naive Bayes modelleri eğitilmiştir. Yapılan testler sonucunda Logistic Regression modeli %98.6 doğruluk (accuracy) ve %98.5 F1-skoru ile en yüksek performansı göstermiş olup, e-posta filtreleme senaryoları için güvenilir ve yüksek performanslı bir makine öğrenmesi çözümü ortaya konmuştur.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
README.md		README.md
Rapor.pdf		Rapor.pdf
Spam_Tespiti.ipynb		Spam_Tespiti.ipynb
Sunum.pptx		Sunum.pptx
enron_spam_data.csv		enron_spam_data.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

enron_spam_detection

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

enron_spam_detection

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages