Ce livre de la collection vBook se compose d'un livre de référence sur la Data Science avec le langage Python, alliant théorie et pratique, pour apprendre à analyser des données avec Python et d'un approfondissement sous forme de vidéo qui présente Numpy et Pandas, deux bibliothèques dédiées à la Data Science et à la visualisation de données. Livre Python pour la Data Science - Analysez vos données avec NumPy, Pandas, Matplotlib et Seaborn Ce livre sur la Data Science avec le langage Python, alliant théorie et pratique, s'adresse aussi bien aux étudiants et professionnels (ingénieurs, chercheurs, enseignants, data scientists), qu'aux informaticiens souhaitant apprendre à analyser des données avec Python. La première partie du livre vise à introduire le langage Python et son utilisation dans le domaine de l'analyse de données. Le lecteur y découvre la mise en place de l'environnement de travail ainsi que des rappels sur le langage Python. Dans une deuxième partie, le lecteur apprend à manipuler efficacement ses données grâce aux librairies NumPy et Pandas. Chaque notion est introduite théoriquement puis illustrée par un exemple concret permettant de comprendre son application. Il apprend à importer ses données sous Python et à utiliser les fonctions, méthodes et attributs fournis pour les explorer et les manipuler afin d'en faire ressortir des informations et tendances. Dans une troisième partie, le lecteur apprend à visualiser ses données avec les librairies Matplotlib et Seaborn, lui permettant de comprendre l'architecture et le fonctionnement de la création de figures avec Python, ainsi que les types de graphiques à utiliser selon le type de variables à représenter. Enfin, dans le dernier chapitre, l'auteur propose un exercice complet avec sa correction permettant de mettre en pratique les notions étudiées. Il permet au lecteur d'écrire le code permettant de répondre aux questions de l'exercice. Pour chaque chapitre, un fichier contenant le code source utilisé, appelé notebook, est disponible en téléchargement sur le site www.editions-eni.fr. Ce notebook permet au lecteur de tester le code, de le modifier et d'y tester ses propres lignes de code. De plus, deux jeux de données réels sont disponibles en téléchargement et utilisés dans ce livre pour illustrer les propos de l'auteur. Vidéo Data Science et visualisation de données L'arrivée du Big Data et la multiplicité des sources de données font que les besoins en matière d'analyse de données deviennent de plus en plus importants. L'objectif de cette vidéo est de vous montrer comment utiliser le langage Python dans le cadre de la Data Science pour être en mesure d'analyser de gros volumes de données. Nous présenterons Numpy et Pandas, deux bibliothèques dédiées à la Data Science et travaillerons sur la préparation et la visualisation de données.