Ce projet vise à créer un système de recommandation de livres. Il ciblera de nombreux domaines de la science des données. Les étapes sont les suivantes :
-Source de données (création d'un web spider pour analyser les données en ligne)
-Nettoyer les données (prendre les données extraites et les rendre plus utiles)
-Explorer les données (comprendre les données extraites)
-Construire le système (créer un système de recommandation basé sur les données)
-Déploiement du système (création d'un service Web utilisant le modèle)
Ce projet utilise le site Web de GoodReads comme source de données. GoodReads dispose d'une API, mais elle se concentre principalement sur l'interaction avec les utilisateurs. Dans un monde idéal, nous serions la source de tous les livres possibles et de leurs métadonnées, mais cela est à grande échelle et coûteux en calcul.