Bayesian Combining

A Python implementation for combining multiple machine learning models using Bayesian Networks. This project provides tools for model stacking, feature importance analysis, and automated hyperparameter tuning using Bayesian optimization.

Features

Bayesian Network model stacking
Automated hyperparameter optimization
Feature importance analysis
Multiple classifier support (Random Forest, SVM, XGBoost, etc.)
Comprehensive performance metrics and visualizations
Support for both sequential and parallel processing

Prerequisites

Python 3.8 or higher
pip package manager
Virtual environment management tools

Installation

Clone the repository:

git clone https://github.com/Narden91/bayesian-combining.git
cd bayesian-combining

Create and activate a Python virtual environment:

Linux/macOS:

python -m venv env
source env/bin/activate

Windows:

python -m venv env
env\Scripts\activate

Install required dependencies:

pip install -r requirements.txt

Configuration

The project uses YAML configuration files located in the config/ directory:

config.yaml: Main configuration file for model parameters
Custom configurations can be added for different experiments

Usage

Basic Usage

python main.py

Parallel Processing

python main_multiprocessing.py

Configuration Options

python main.py --config path/to/custom_config.yaml

Project Structure

The project is organized as follows. Each Python module in the src directory has a specific responsibility:

bayesian-combining/
├── config/              # Configuration files
│   └── config.yaml     # Main configuration file
├── data/               # Data directory
├── output/             # Output directory for results
├── src/               # Source code
│   ├── aggregate_results_combining.py
│   ├── bayesian_net_importance_score.py
│   ├── bayesian_net_importance.py
│   ├── bayesian_network.py
│   ├── classification.py
│   ├── explainability.py
│   ├── hyperparameters.py
│   ├── importance_tracker.py
│   ├── main_backup.py
│   ├── main_multiprocessing.py
│   ├── main_process.py
│   ├── main.py
│   ├── preprocessing.py
│   ├── results_analysis.py
│   ├── task_analysis.py
│   └── utils.py
├── .gitignore         # Git ignore file
├── bayesian_folder_conv.py
├── LICENSE           # License file
├── organize_results.ipynb  # Jupyter notebook for results organization
├── README.md         # Project documentation
└── requirements.txt  # Project dependencies

Key Components

Bayesian Network Implementation:
- bayesian_network.py: Core implementation of Bayesian Network model stacking
- bayesian_net_importance.py: Feature importance analysis using Bayesian Networks
- bayesian_net_importance_score.py: Scoring mechanisms for Bayesian Network features
Model Management:
- classification.py: Implementation of various classification models
- hyperparameters.py: Hyperparameter optimization using Optuna
- preprocessing.py: Data preprocessing and feature engineering
Analysis and Tracking:
- importance_tracker.py: Tracks feature importance across experiments
- results_analysis.py: Analysis of experimental results
- explainability.py: Model explainability tools
- task_analysis.py: Task-specific analysis utilities
Core Processing:
- main.py: Main entry point for sequential processing
- main_multiprocessing.py: Entry point for parallel processing
- main_process.py: Core processing logic
- utils.py: Utility functions used across the project
Additional Tools:
- organize_results.ipynb: Jupyter notebook for organizing and visualizing results
- bayesian_folder_conv.py: Utilities for folder structure conversion

Development

Adding New Dependencies

When installing new packages, update requirements.txt:

pip freeze > requirements.txt

Running Tests

python -m pytest tests/

Contributing

Fork the repository
Create your feature branch (git checkout -b feature/AmazingFeature)
Commit your changes (git commit -m 'Add some AmazingFeature')
Push to the branch (git push origin feature/AmazingFeature)
Open a Pull Request

License

This project is licensed under the MIT License - see the LICENSE file for details.

Citation

TODO

Contact

Emanuele Nardone - emanuele.nardone@unicas.it

Project Link: https://github.com/Narden91/bayesian-combining

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
config		config
dl_fusion		dl_fusion
docs		docs
notebooks		notebooks
script		script
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt
run_fusion.py		run_fusion.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Bayesian Combining

Features

Prerequisites

Installation

Configuration

Usage

Basic Usage

Parallel Processing

Configuration Options

Project Structure

Key Components

Development

Adding New Dependencies

Running Tests

Contributing

License

Citation

Contact

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Bayesian Combining

Features

Prerequisites

Installation

Configuration

Usage

Basic Usage

Parallel Processing

Configuration Options

Project Structure

Key Components

Development

Adding New Dependencies

Running Tests

Contributing

License

Citation

Contact

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages