Skip to content

Latest commit

 

History

History
101 lines (50 loc) · 2.83 KB

File metadata and controls

101 lines (50 loc) · 2.83 KB

Bu repository çeşitli AI modellerinin implementasyonlarını içerir. Makalelere buradan ulaşabilirsiniz:

[https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf]

  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

[https://arxiv.org/pdf/1810.04805]

  • Llama 2: Open Foundation and Fine-Tuned Chat Models

[https://arxiv.org/pdf/2307.09288]

  • The Llama 3 Herd of Models

[https://arxiv.org/pdf/2407.21783]

  • Qwen3 Technical Report

[https://arxiv.org/pdf/2505.09388]

  • Gemma 3 Technical Report

[https://arxiv.org/pdf/2503.19786]

  • DeepSeek-V3 Technical Report

[https://arxiv.org/pdf/2412.19437]

  • Sigmoid Loss for Language Image Pre-Training

[https://arxiv.org/pdf/2303.15343]

Görüntü İşleme kısmı için tavsiye edilen okuma sırası:

LeNet -> AlexNet -> VGGNet -> MobileNet -> InceptionNet -> ResNet -> EfficientNet -> GAN ->DCGAN -> SRGAN -> ESRGAN

Büyük Dil Modelleri için tavsiye edilen okuma sırası:

Transformers -> GPT2 -> BERT -> LLaMA2 -> LLaMA3 -> Qwen3 -> Gemma3 -> Deepseek

Çoklu Modeller için tavsiye edilen okuma sırası:

SigLIP

NOT: Büyük Dil Modelleri klasöründeki bazı dosyaları Preview kısmında Invalid gösterebilir. Dosyaları indirdiğinizde notebookları görüntüleyebilirsiniz.