Bu çalışma, 1908-2009 yılları arasında gerçekleşen 5.246 havacılık kazasının kapsamlı istatistiksel analizini ve görselleştirmesini içermektedir. Proje, havacılık güvenliği alanında tarihsel verilerin sistematik olarak incelenmesi ve çeşitli analitik yöntemlerle yorumlanması amacıyla geliştirilmiştir.
Çalışma kapsamında, bir asrı aşkın süreçte meydana gelen havacılık kazaları; operatör kategorileri, uçak tipleri, zamansal trendler ve ölüm oranları açısından detaylı olarak incelenmiştir. Analiz sürecinde Python programlama dili ve ilgili veri bilimi kütüphaneleri kullanılarak 10 farklı görselleştirme türü üretilmiştir.
- Eksik ve hatalı kayıtların temizlenmesi
- Veri tutarlılığının sağlanması
- Kategorik değişkenlerin standardizasyonu
- Ölüm oranı (fatality ratio) hesaplaması
- Dekat bazlı zaman gruplandırması
- Operatör kategorilerinin (askeri/sivil) belirlenmesi
Kazalar, uçaktaki toplam kişi sayısına göre ölüm oranı ≥%50 olması durumunda "ölümcül" olarak sınıflandırılmıştır. Bu eşik değer, kaza şiddetinin objektif bir şekilde değerlendirilmesi için belirlenmiştir.
- Toplam Kaza Sayısı: 5.246
- Toplam Kayıp: 105.358 kişi
- İncelenen Dönem: 1908-2009 (101 yıl)
- Ölümcül Kaza Oranı: %85
- En Yüksek Kayıp Yaşanan Yıl: 1972 (2.937 kişi)
- En fazla kaza: Aeroflot (179 kaza, 7.156 kayıp)
- Askeri operatörler: %15 (789 kaza)
- Sivil operatörler: %85 (4.457 kaza)
- En yüksek kayıp: Douglas DC-3 (4.792 kişi)
- Toplam 10 farklı uçak tipi detaylı olarak incelenmiştir
Araştırma kapsamında üretilen 10 farklı görselleştirme türü:
- Pasta Grafiği - Askeri/sivil kaza dağılımı
- Yatay Çubuk Grafik - Operatör bazlı kaza sıralaması
- Dağılım Grafiği - Kapasite-ölüm oranı ilişkisi
- Çoklu Çizgi Grafik - Dekat bazlı trend analizi
- Isı Haritası - Periyodik ortalama kayıp analizi
- Violin Plot - Ölüm oranı dağılım karşılaştırması
- Yığılmış Çubuk Grafik - Şiddet bazlı dekat analizi
- Halka Grafik - Uçak tipi bazlı kayıp dağılımı
- Alan Grafiği - Kümülatif kayıp trendi
- Kutu Grafiği - Kaza başına kayıp dağılımı
- Python 3.x: Temel programlama dili
- pandas: Veri manipülasyonu ve analizi
- numpy: Sayısal hesaplamalar
- matplotlib: Görselleştirme altyapısı
- seaborn: İstatistiksel görselleştirme
pip install -r requirements.txtpython advanced_visualizations.pyProgram çalıştırıldığında, proje dizininde 10 adet PNG formatında görselleştirme dosyası oluşturulacaktır.
Veri seti, 1908-2009 yılları arasındaki havacılık kazalarına ilişkin aşağıdaki bilgileri içermektedir:
- Tarih, saat ve konum bilgisi
- Operatör ve uçak tipi
- Uçaktaki toplam kişi sayısı
- Kayıp sayısı
- Kaza özeti
Kaynak: Tarihsel havacılık kaza kayıtları
Tüm istatistiksel hesaplamalar ve bulgular, ham veri seti ile karşılaştırmalı olarak doğrulanmıştır. Veri bütünlüğü ve hesaplama doğruluğu test edilmiş, yanıltıcı bilgi içermediği teyit edilmiştir.
Bu proje MIT Lisansı altında açık kaynak olarak sunulmaktadır.
Alperen Uca
This study presents a comprehensive statistical analysis and visualization of 5,246 aviation accidents that occurred between 1908 and 2009. The project was developed with the aim of systematically examining historical data in the field of aviation safety and interpreting it through various analytical methods.
Within the scope of this study, aviation accidents spanning over a century have been examined in detail in terms of operator categories, aircraft types, temporal trends, and fatality ratios. During the analysis process, 10 different types of visualizations were generated using the Python programming language and related data science libraries.
- Cleaning of missing and erroneous records
- Ensuring data consistency
- Standardization of categorical variables
- Calculation of fatality ratio
- Decade-based temporal grouping
- Determination of operator categories (military/civilian)
Accidents were classified as "fatal" when the fatality ratio relative to the total number of people aboard was ≥50%. This threshold value was determined for objective assessment of accident severity.
- Total Number of Accidents: 5,246
- Total Fatalities: 105,358 persons
- Period Examined: 1908-2009 (101 years)
- Fatal Accident Rate: 85%
- Year with Highest Fatalities: 1972 (2,937 persons)
- Highest accident count: Aeroflot (179 accidents, 7,156 fatalities)
- Military operators: 15% (789 accidents)
- Civilian operators: 85% (4,457 accidents)
- Highest fatalities: Douglas DC-3 (4,792 persons)
- A total of 10 different aircraft types were examined in detail
Ten different types of visualizations produced within the scope of the research:
- Pie Chart - Military/civilian accident distribution
- Horizontal Bar Chart - Operator-based accident ranking
- Scatter Plot - Capacity-fatality ratio relationship
- Multi-Line Chart - Decade-based trend analysis
- Heatmap - Periodic average fatality analysis
- Violin Plot - Fatality ratio distribution comparison
- Stacked Bar Chart - Severity-based decade analysis
- Donut Chart - Aircraft type-based fatality distribution
- Area Chart - Cumulative fatality trend
- Box Plot - Fatalities per accident distribution
- Python 3.x: Primary programming language
- pandas: Data manipulation and analysis
- numpy: Numerical computations
- matplotlib: Visualization infrastructure
- seaborn: Statistical visualization
pip install -r requirements.txtpython advanced_visualizations.pyWhen the program is executed, 10 visualization files in PNG format will be created in the project directory.
The dataset contains the following information regarding aviation accidents between 1908-2009:
- Date, time, and location information
- Operator and aircraft type
- Total number of people aboard
- Number of fatalities
- Accident summary
Source: Historical aviation accident records
All statistical calculations and findings have been validated comparatively against the raw dataset. Data integrity and computational accuracy have been tested and confirmed to contain no misleading information.
This project is provided as open source under the MIT License.
Alperen Uca
Repository: https://github.com/alperenuca/aircraft-accident-data-analysis