Recherche

Python pour la Data Science. Analysez vos données avec NumPy, Pandas, Matplotlib et Seaborn

Extraits

ActuaLitté

Programmation

Python pour la Data Science. Analysez vos données avec NumPy, Pandas, Matplotlib et Seaborn

Ce livre de la collection vBook se compose d'un livre de référence sur la Data Science avec le langage Python, alliant théorie et pratique, pour apprendre à analyser des données avec Python et d'un approfondissement sous forme de vidéo qui présente Numpy et Pandas, deux bibliothèques dédiées à la Data Science et à la visualisation de données. Livre Python pour la Data Science - Analysez vos données avec NumPy, Pandas, Matplotlib et Seaborn Ce livre sur la Data Science avec le langage Python, alliant théorie et pratique, s'adresse aussi bien aux étudiants et professionnels (ingénieurs, chercheurs, enseignants, data scientists), qu'aux informaticiens souhaitant apprendre à analyser des données avec Python. La première partie du livre vise à introduire le langage Python et son utilisation dans le domaine de l'analyse de données. Le lecteur y découvre la mise en place de l'environnement de travail ainsi que des rappels sur le langage Python. Dans une deuxième partie, le lecteur apprend à manipuler efficacement ses données grâce aux librairies NumPy et Pandas. Chaque notion est introduite théoriquement puis illustrée par un exemple concret permettant de comprendre son application. Il apprend à importer ses données sous Python et à utiliser les fonctions, méthodes et attributs fournis pour les explorer et les manipuler afin d'en faire ressortir des informations et tendances. Dans une troisième partie, le lecteur apprend à visualiser ses données avec les librairies Matplotlib et Seaborn, lui permettant de comprendre l'architecture et le fonctionnement de la création de figures avec Python, ainsi que les types de graphiques à utiliser selon le type de variables à représenter. Enfin, dans le dernier chapitre, l'auteur propose un exercice complet avec sa correction permettant de mettre en pratique les notions étudiées. Il permet au lecteur d'écrire le code permettant de répondre aux questions de l'exercice. Pour chaque chapitre, un fichier contenant le code source utilisé, appelé notebook, est disponible en téléchargement sur le site www.editions-eni.fr. Ce notebook permet au lecteur de tester le code, de le modifier et d'y tester ses propres lignes de code. De plus, deux jeux de données réels sont disponibles en téléchargement et utilisés dans ce livre pour illustrer les propos de l'auteur. Vidéo Data Science et visualisation de données L'arrivée du Big Data et la multiplicité des sources de données font que les besoins en matière d'analyse de données deviennent de plus en plus importants. L'objectif de cette vidéo est de vous montrer comment utiliser le langage Python dans le cadre de la Data Science pour être en mesure d'analyser de gros volumes de données. Nous présenterons Numpy et Pandas, deux bibliothèques dédiées à la Data Science et travaillerons sur la préparation et la visualisation de données.

03/2023

ActuaLitté

Programmation

Data Science avec Python. Avec Jupyter et PyCharm

Ce livre est destiné aux personnes souhaitant avoir une première immersion dans le domaine de l'analyse de données avec le langage de programmation Python et les librairies dédiées à l'analyse de données que sont NumPy, Pandas, Matplotlib et Seaborn. Dans ce livre, nous verrons principalement comment explorer, manipuler et visualiser des données structurées, c'est-à-dire des tableaux contenant des lignes et des colonnes. La première partie aborde l'utilisation de la librairie NumPy qui est une librairie Python dédiée au calcul scientifique fournissant des fonctions très performantes de calcul, mais aussi des structures de données spécialisées et remarquablement performantes. La seconde partie aborde l'utilisation de la librairie Pandas qui est une librairie Python dédiée à la Data Science. Il s'agit de la librairie Python la plus populaire et la plus performante pour faire de l'analyse de données. Cette librairie Pandas amène avec elle deux nouvelles structures essentielles pour l'analyse de données qui sont les structures Series et DataFrame. La troisième partie aborde l'utilisation de la librairie Matplotlib qui est une librairie graphique très connue en Python car elle est puissante, très simple à prendre en main et chaque élément de la figure peut être configuré finement via un grand nombre de paramètres disponibles. La quatrième partie aborde l'utilisation de la librairie Seaborn qui est la librairie la plus populaire pour la visualisation de graphique. En réalité, cette librairie s'appuie sur Matplotlib et elle apporte des fonctions supplémentaires permettant de générer des graphiques plus travaillés, aux allures plus modernes, et ce de manière très simple. La cinquième partie aborde la création d'une application autonome pour visualiser des graphiques élaborés avec les librairies Matplotlib et Seaborn. Nous y verrons notamment comment utiliser le composant FigureCanvasQTAgg pour visualiser des graphiques aux allures modernes dans un projet PyCharm avec Python et la librairie des contrôles PyQt5.

03/2022

ActuaLitté

Programmation

Python pour la data science

Le best-seller O'Reilly sur la data science avec Python enfin traduit en Francais ? Pour de nombreux chercheurs, Python est un outil essentiel en raison de ses bibliothèques pour stocker, manipuler et obtenir un aperçu des données. Ce livre décrit toutes les ressources dont vous pouvez disposer pour mettre en oeuvre vos applications : IPython, NumPy, Pandas, Matplotlib, Scikit-Learn et d'autres outils associés. Les scientifiques en activité et les utilisateurs de données familiarisés avec la lecture et l'écriture de code Python trouveront avec cette référence complète l'outil idéal pour s'attaquer aux problèmes quotidiens : manipuler, transformer et nettoyer les données ; visualiser différents types de données ; utiliser les données pour créer des modèles statistiques ou d'apprentissage automatique. Ce livre est tout simplement la référence incontournable pour le calcul scientifique en Python. Vous apprendrez à utiliser : IPython et Jupyter : fournissent des environnements de calcul pour les data scientists utilisant Python NumPy : inclut le ndarray pour un stockage et une manipulation efficaces de tableaux de données denses en Python Pandas : comprend le DataFrame pour un stockage et une manipulation efficaces des données étiquetées / en colonnes en Python Matplotlib : inclut des fonctionnalités pour une gamme flexible de visualisations de données en Python Scikit-Learn : pour des implémentations Python efficaces et propres des algorithmes d'apprentissage automatique les plus importants et les plus établis

04/2022

ActuaLitté

Programmation

Python pour le data scientist. Des bases du langage au machine learning, 3e édition

Si vous vous intéressez au traitement des données avec le langage Python, cet ouvrage s'adresse à vous. Que vous soyez débutant en Python ou que vous ayez une expérience significative, il vous apportera les clés pour utiliser ce langage en data science. Ce livre répond à de nombreuses questions sur Python : - Comment utiliser Python en data science ? - Comment coder en Python ? - Comment préparer des données avec Python ? - Comment créer des visualisations attractives avec Python ? - Comment appliquer des modèles de machine learning et de deep learning avec Python ? - Comment passer aux environnements big data ? Pour mettre en place vos traitements, vous apprendrez à tirer parti des multiples outils Python tels que Anaconda, Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Bokeh, Scikit-Learn, TensorFlow, PySpark... Cette troisième édition, entièrement refondue et augmentée, est enrichie des mises à jour de code liées aux évolutions de Python et des packages de data science. L'ensemble du code compris dans cet ouvrage est disponible sous la forme de notebooks Jupyter dans le repository public de l'auteur : https : //github. com/emjako/pythondatascientist

03/2024

ActuaLitté

Programmation

Python pour le data scientist. Des bases du langage au machine learning, 2e édition

Python est devenu en quelques années un langage majeur dans l'univers des applications centrées sur le traitement des données, et plus particulièrement des gros volumes de données (big data). Cet ouvrage servira de guide à tous ceux qui s'intéressent à l'utilisation de Python pour le travail sur les données et l'automatisation de certaines tâches (data science). Il met l'accent sur la préparation et la mise en forme des données qui sont essentielles dans la qualité du résultat et qui constituent aujourd'hui une part importante du travail du data scientist. Si vous vous intéressez au traitement des données avec le langage Python, cet ouvrage s'adresse à vous. Que vous soyez débutant en Python ou que vous ayez une expérience significative, il vous apportera les clés pour utiliser ce langage en data science. Ce livre répond à de nombreuses questions sur Python : Comment utiliser Python en data science ? Comment coder en Python ? Comment préparer des données avec Python ? Comment créer des visualisations attractives avec Python ? Comment appliquer des modèles de machine learning et de deep learning avec Python ? Comment passer aux environnements big data ? Vous apprendrez à tirer parti des multiples outils Python tels que Anaconda, Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Bokeh, Scikit-Learn, TensorFlow, PySpark... pour mettre en place vos traitements. Cette deuxième édition est complétée et enrichie par des mises à jour de code liées aux évolutions de Python et des packages de data science. Des données plus récentes sont aussi utilisées. Les + en ligne : l'ensemble du code compris dans cet ouvrage est disponible sous la forme de notebooks Jupyter dans le repository public de l'auteur : github.com/emjako/pythondatascientist.

03/2021

ActuaLitté

Programmation

Analyse de données avec Python

Découvrez des techniques éprouvées pour manipuler, traiter, nettoyer et reformer des jeux de données en Python. A jour des dernières versions 3.x de Python, ce guide regorge d'études de cas pratiques montrant comment résoudre efficacement un large ensemble de problèmes d'analyse de données. Vous apprendrez à maîtriser les dernières versions de pandas, NumPy, I Python et Jupyter. Ecrit par le créateur du projet pandas de Python, ce livre est une introduction pratique et moderne aux outils de la science des données en Python. Il est idéal pour les analystes qui débutent en Python comme pour les programmeurs qui ne connaissent pas la datalogie (ou science des données) ni le calcul scientifique. Les fichiers de données et tout le matériel associé sont disponibles sur GitHub.

03/2021

ActuaLitté

Informatique

Programmation en Python pour les sciences de la vie

Python est le langage de programmation le plus répandu dans le monde scientifique. Il est parfaitement adapté pour l'analyse de données en sciences de la vie. Cet ouvrage, didactique et simple d'approche, aborde progressivement la programmation et l'algorithmique. Il présente ensuite des fonctionnalités plus avancées utiles en analyse de données (numpy, pandas, matplotlib, notebooks jupyter), ainsi qu'une introduction à la programmation orientée objet et graphique. L'ouvrage s'appuie sur de nombreux exemples provenant de la biologie, comme la manipulation de séquences nucléiques, l'analyse de structures protéiques, etc. De nombreux exercices d'application, de difficulté croissante, sont proposés et corrigés en détails. L'ensemble des codes sources de l'ouvrage est disponible en ligne.

07/2019

ActuaLitté

Informatique

Python pour la data science pour les nuls

Découvrez Python le langage de prédilection de la science des données La science des données ou data science consiste à extraire des connaissance dans un flot de données. Elle utilise des techniques et des théories tirées de domaines comme les mathématiques et la statistique. Les méthodes qui s'adaptent aux big data sont particulièrement intéressantes dans la science des données. Ce livre est destiné à tous ceux qui travaillent dans le domaine de l'analyse de données et montre comment mettre en oeuvre le langage Python pour dans ce domaine et uassi celui de la statistique. Il traite également de Google Colab, un outil qui permet d'cire du code Python dans le cloud. Au programme : Probabilités Distributions aléatoires Tests d'hypothèses Regressions Modèles de prédiction

11/2019

ActuaLitté

Base de données

Pratique de la data science avec R. Arranger, visualiser, analyser et présenter des données

Le scientifique des données doit maîtriser plusieurs outils informatiques permettant de mettre en oeuvre une méthodologie statistique. Dans sa catégorie, le langage R est un langage de programmation qui peut tout à fait être un outil pertinent pour l'analyse statistique de données, à côté d'autres langages de programmation ou d'autres logiciels. Cet ouvrage s'adresse tant à des étudiants de master en statistique et/ou master big data qui font leurs premiers pas en data science, qu'à des ingénieurs qui souhaitent approfondir leurs connaissances et mettre en oeuvre leurs compétences à l'aide de R, en reprenant les différentes étapes du cycle de vie d'un projet basé sur l'analyse statistique de données : la préparation des données, la transformation des données, la visualisation des données, l'analyse des données et enfin, l'étape ultime, la diffusion des résultats de l'analyse.

06/2021

ActuaLitté

Programmation

Python pour Excel. Automatisation et analyse des données avec un langage moderne

Python et Excel un mariage de raison pour intérroger et manipuler de grandes quantités de données Excel est l'outil informatique le plus utilisé dans le monde pour manipuler les chiffres ; associé au langage de programmation Python, ils forment un tandem redoutable pour manipuler, gérer et analyser des grands quantités de données. Dans ce livre unique sans équivalent sur le marché vous apprendrez à créer des outils performants qui vous permettront de gagner du temps dans la gestion et la manipulationde vos données. Au programme : Utiliser Python comme premier langage S'appuyer sur des outils modernes comme Jupyter notebooks et Visual Studio Utiliser pandas pour acquérir, nettoyer et analyser les données et remplacer des calculs Excel Automatiser des tâches lourdes dans Excel comme la consolidation ou le reporting Utiliser xlwings pour créer des outils interactifs entre Excel et Python Connecter Excel aux bases de données et au fichiers CSV files Utiliser Python pour remplacer VBA, Power Query, et Power Pivot

11/2021

ActuaLitté

Mathématiques (notions fondame

Python & Pandas et les 36 problèmes de data science. Problèmes et exercices corrigés pas à pas

Ce livre contient 36 problèmes corrigés pour apprendre à traiter les données de toutes tailles (big data), et des vidéos et figures dynamiques en bonus accessibles via des QR codes. - Problèmes corrigés pas à pas - Data visualisation, cartes statistiques - Fouille et analyse de données - Modélisation, simulation, lanceur d'alerte - Prédiction et premiers pas vers l'IA

10/2021

ActuaLitté

Agriculture

Data science pour l’agriculture et l’environnement. Méthodes et applications avec R et Python

L'objectif de la data science est de répondre à des questions opérationnelles en analysant des données. Dans ce but, le data scientist récupère, stocke, organise, traite une masse d'informations afin d'en tirer de la valeur. Si la data science a acquis une grande renommée dans de nombreux domaines comme la reconnaissance d'images ou la fouille de données sur internet, son utilisation en agriculture et, plus largement dans les sciences environnementales, reste encore limitée. Pourtant, dans ces domaines, le champ des applications possibles est très vaste. Potentiellement, la data science peut être utilisée pour évaluer l'impact des activités humaines sur les risques de pollution et les émissions de gaz à effet de serre, prédire en temps réel les rendements des cultures et la production des systèmes d'élevage, suivre l'évolution de l'usage des sols à partir de données satellitaires, ou prédire l'impact du changement climatique. Ce manuel d'initiation vise à démocratiser l'usage de la data science pour des applications en lien avec l'agriculture et l'environnement. L'ouvrage couvre les principales méthodes couramment utilisées pour la prédiction, la classification et le partitionnement de données. Il comporte à la fois des explications détaillées du fonctionnement de chaque méthode, une description de codes R et Python permettant leur utilisation pratique, et des exemples d'applications concrètes en lien avec les sciences agricoles et environnementales.

03/2021

ActuaLitté

Système d'information (SI)

Sortez vos données du frigo. Une entreprise performante avec la data et l'IA

A l'ère du numérique, alors que tout est optimisé pour la compétitivité des entreprises, les données restent peu exploitées. Pourtant, toutes les organisations en stockent dans leurs bases de données, ces véritables frigos informationnels. Alors il est grand temps de réagir ! Sortez vos données du frigo et réchauffez-les avec l'iA pour valoriser cet actif en créant de La valeur pour toute l'entreprise. Quels usages et quelle stratégie pour les données et l'iA ? Quelles organisations et méthodologies pour viser la performance ? Comment établir des algorithmes dignes de confiance ? Ce livre accessible à tous développe une vision à 360° pour vous faire entrer de plain-pied dans la révolution des données et de l'iA : stratégie, usages, organisation, nouveaux métiers, technologies et éthique... 101 usages pour toute l'entreprise ; 8 fiches de poste ; 10 cas d'entreprise détaillés ; 4 approches pour se lancer.

02/2021

ActuaLitté

Informatique

Python et l'analyse forensique. Récupérer et analyser les données produites par les ordinateurs

L'informatique forensique nécessite de comprendre en détail le fonctionnement des ordinateurs, des périphériques et des logiciels en question. L'objectif est de donner au lecteur les connaissances nécessaires pour se familiariser avec le langage Python (en version 3) en orientant la problématique de manière à se focaliser sur le fonctionnement de ces objets. Ce livre a été écrit avec la volonté d'être accessible au plus grand nombre et la conviction qu'une "démocratisation" de la compréhension de l'outil informatique est désormais essentielle. Ce livre propose une approche en deux temps : il commence par une introduction au langage Python puis présente comment l'utiliser pour récupérer et manipuler les données produites par nos ordinateurs. Les auteurs traitent ainsi de thématiques variées allant de l'inspection de la mémoire vive des processus, au fonctionnement interne de logiciels grand public ou à l'extraction de l'historique de navigateur web. Différents outils sont étudiés : des plus basiques avec la bibliothèque libmagic, aux technologies les plus récentes comme l'apprentissage automatique avec scikit-learn et son écosystème issu du calcul scientifique. Des éléments complémentaires sont en téléchargement sur le site www.editions-eni.fr.

03/2019

ActuaLitté

Informatique

Azure Data Factory. Intégrez vos données avec le service serverless d'Azure

Ce livre sur Azure Data Factory (dans sa version V2 de 2018) permet au lecteur de disposer des connaissances nécessaires pour mettre en oeuvre des solutions d'intégration de données industrialisées, normées et conformes aux bonnes pratiques de l'outil. Le lecteur sera ainsi en mesure de saisir les subtilités liées à la fois aux architectures cloud et à la modernisation des architectures de données, le tout en capitalisant au maximum sur l'approche DevOps au coeur de l'utilisation d'Azure Data Factory. Les Data Flow, véritable révolution au sein des outils d'intégration dans le Cloud permettant de réaliser des transformations de données graphiquement ou via Power Query, sont aussi détaillés dans cet ouvrage. Le livre est illustré par un exemple détaillé d'alimentation d'entrepôt et de lac de données ainsi qu'avec de nombreux cas d'usages courants tels que l'envoi d'e-mails ou l'actualisation de modèles Analysis Services. Les sources des exemples du livre sont disponibles en téléchargement sur le site www.editions-eni.fr.

10/2019

ActuaLitté

Garder la forme

Intelligence artificielle & Data. Comment mieux analyser vos données, les exploiter et en saisir tous les enjeux

Quelles méthodes adopter pour exploiter avec efficacité vos données ? Comment rester compétitif à l'heure de l'intelligence artificielle ? Quelles stratégies mettre en place pour tirer pleinement parti des technologies de pointe ? Pour répondre à ces questions essentielles, ce nouvel ouvrage HBR réunit une dizaine d'articles proposant un éclairage inédit sur le pouvoir du digital et de la data. RH, marketing, finance, ventes... : tous les services sont désormais concernés par la transformation digitale qui définit de nouvelles règles du jeu au sein de l'entreprise et exige des managers de nouveaux réflexes. Grâce aux enquêtes, analyses et conseils pratiques des experts HBR, découvrez comment relever avec succès le défi des technologies numériques et profiter au mieux de l'impact de l'intelligence artificielle. Un ouvrage de référence à toujours garder à portée de mains !

03/2022

ActuaLitté

Mathématiques

Analyse de données en sciences expérimentales. Probabilités et statistiques, avec exemples en sciences physique

Cet ouvrage est destiné aux étudiants en Licence 3 ou Master 1 de Sciences de la Matière, Sciences de la Terre et Sciences de la Vie et de la Santé. Son objectif est de donner les outils nécessaires à l'analyse de données recueillis dans le cadre des expériences. Il introduit ainsi les mathématiques de bases et présente leur utilisation concrète.L'ouvrage se décompose en trois parties : caractérisation d'un échantillon, probabilités, statistique. Chacune est complétée par des exercices, tous corrigés.Volontairement restreint à l'essentiel, il permet à l'étudiant de se concentrer sur sa matière grâce à l'utilisation des outils mathématiques sans se perdre dans leur théorisation.

04/2012

ActuaLitté

Informatique

Apache Spark. Développez en Python pour le big data

Ce livre sur le framework Apache Spark vous permet d'apprendre à développer des applications en Python en vous appuyant sur l'analyse et le traitement de données volumineuses ainsi que sur la notion d'apprentissage automatique. Après quelques définitions de termes liés au domaine de la data, vous découvrez les fondements de Spark. Vous appréhendez l'architecture logicielle du framework, ses composants et les différents langages avec lesquels il est possible de développer. Vous entrez ensuite concrètement dans la transformation de données. Fonctions numériques, alphanumériques, ajouts d'information, suppressions, agrégations de premier ordre et plus complexes sont à l'honneur. Des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs sont étudiées et les nombreuses API de Spark parcourues, tout en étant illustrées par des exemples. Dans la suite du livre, l'auteur dévoile l'apprentissage machine. Apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de concepts détaillés. Vous découvrez les différents algorithmes présents dans Spark, les manières de préparer des données à l'entraînement ainsi que les possibilités d'évaluation d'un système prédictif au travers de plusieurs mises en pratique. Les notions d'arbres de décision, de forêts aléatoires, de réseaux de neurones, de régressions linéaires et de factorisation de matrices vous sont expliquées ainsi que le traitement des informations numériques et la vectorisation de textes. Pour finir, un chapitre met en avant l'industrialisation de Spark. Déployer, déboguer et tester son application ainsi que les subtilités de l'outil pour assurer une performance optimale sont autant d'éléments cruciaux détaillés. Si les exemples de code du livre sont en Python, langage aujourd'hui le plus utilisé avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision complète du framework.

01/2022

ActuaLitté

Pack office

Analyse de données avec Excel

Excel le sujet bureautique le plus vendu de la suite Office Excel est définitivement le logiciel le plus complexe et le plus puissant de la suite Office. La gestion des données, leur tri et leur analyse sont des tâches récurrentes pour tous les comptables, scientifiques ou contrôleurs de gestion. ce livre vous donnera toutes les clés pour regrouper, trier et analyser toutes vos données et les présenter de manière efficace. Au programme : Les Bases de l'analyse de données Les Tables Pivots Présentation sous forme graphique Créer des graphiques croisés dynamiques Les fonctions de bases de données Les fonctions statistiques Optimisation des modèles avec le Solver

09/2022

ActuaLitté

Informatique

La donnée n'est pas donnée. Stratégie & Big Data

La donnée est au coeur de la révolution cyber : tous nos outils quotidiens la brassent sans relâche au point qu'elle suscite un nouvel intérêt et qu'elle est à la pointe du débat scientifique : propriété des données, usage des données, localisation des données sont des sujets au goût du jour. Certains estiment même qu'à la guerre de l'information va succéder la guerre des données. Or ces sujets ne peuvent être débattus sereinement que si, au préalable, on a pris la peine de définir ce que le terme recouvre. Cet ouvrage répond à cette question, s'interrogeant sur le sens de la donnée selon les disciplines (économie, informatique, philosophie), puis sur le rôle de la donnée dans l'espace numérique. Il s'attache ensuite à décrire les différentes stratégies de la donnée, que ce soit dans le secteur privé ou dans le secteur public. Il est constitué des actes d'un colloque organisé à l'École Militaire en mars 2015, augmentés de quelques participations originales.

06/2016

ActuaLitté

Programmation

Le Machine Learning avec Python. De la théorie à la pratique

Ce livre sur le Machine Learning avec le langage Python permet aux lecteurs novices ou étudiants de disposer des connaissances théoriques nécessaires pour une compréhension approfondie du Machine Learning et d'appréhender les outils techniques utiles pour mettre en pratique les concepts étudiés. L'auteur y expose des exemples concrets sur les concepts de l'apprentissage automatique. Des lecteurs plus avertis trouveront dans ce livre une occasion d'aller plus loin dans leur compréhension des algorithmes du Machine Learning et les enseignants pourront y voir une ressource adaptée pour dispenser un cours sur le sujet. Pour commencer, l'auteur explique les enjeux de la Data Science ainsi que les notions fondamentales du Machine Learning avant de présenter la démarche théorique d'une expérimentation en Data Science avec des notions de modélisation d'un problème et les métriques de mesure de performances d'un modèle. Le lecteur peut ensuite passer à la pratique avec le langage Python en manipulant les bibliothèques Numpy et Pandas ainsi que l'environnement Jupyter, et aborder ainsi sereinement les chapitres suivants qui lui feront découvrir les notions mathématiques, et la pratique sous-jacente, relatives aux algorithmes du Machine Learning : statistiques pour la Data Science, régression linéaire et polynomiale, régression logistique, arbres de décision et Random Forest, K-means, Support Vector Machine, analyse en composantes principales et réseaux de neurones. Des éléments complémentaires sont en téléchargement sur le site www. editions-eni. fr.

09/2021

ActuaLitté

Economie (essai)

Big Data et plateformes. La nouvelle économie des données

Du big data aux plateformes, comment les données bouleversent les business models ? Un éclairage essentiel et inédit sur le nouveau capitalisme des données et ses enjeux qu'ils soient techniques, économiques, politiques et sociétaux. Quelles sont les raisons d'une telle montée en puissance des data et comment sont-elles créatrices de valeur en tant que matière première, levier et gain d'opportunité, actif stratégique. Le livre est enrichi de 20 études de cas et 10 cas complémentaires en ligne.

10/2022

ActuaLitté

Cerveau et psychologie

Introduction aux statistiques en sciences du langage. Traitement et analyse de données avec R

Cet ouvrage est le premier ouvrage francophone sur le traitement et les analyses statistiques spécifiquement appliquées aux Sciences du Langage. Il s'adresse aux nombreux universitaires et professionnels travaillant autour de la question du langage. L'ouvrage est constitué d'une première partie sur le traitement des données issues de l'oral et de l'écrit et d'une seconde partie présentant différentes méthodes d'analyse statistique. Ces différentes analyses seront illustrées à travers des exemples concrets en sciences du langage et feront l'objet d'une démonstration " pas à pas " sur le logiciel R. Pour que ces analyses puissent être reproduites de manière autonome, plusieurs jeux de données seront mis à disposition des lecteurs et lectrices et une partie introductive sera consacrée à la prise en main du logiciel R.

10/2023

ActuaLitté

Gestion

Big Data, Smart Data, Stupid Data... Comment (vraiment) valoriser vos données. Petit manuel à l'usage de ceux qui veulent accélerer et réussir

Demain, tout, absolument tout, produira de la data. Les entreprises qui sauront s'en servir réussiront. Les autres disparaîtront. Vous souhaitez décoller et réussir ? Ce livre est fait pour vous ! Pratique et piquant, il vous guidera étape par étape. Pour réussir, il vous faut tout bousculer : vos procédures, vos talents, votre culture... jusqu'à votre proposition de valeur ! Stratégies, exécution, casting, contraintes règlementaires... ce petit manuel traitera de tout, sans tabou, pour vous permettre d'aller droit au but ! N'attendez plus, lancez-vous ! - Le phénomène " Big Data " fait couler beaucoup d'encre, mais engendre, à date, peu de gains business. Pourquoi ? - Quels sont les ingrédients pour réussir ? De la stratégie (" faire mieux, ou faire autrement ? "), à l'exécution (" priorisation des cas d'usage "), en passant par la culture et l'organisation (" profils, positionnements, valeurs "). - Réglementation européenne sur la data (GDPR, en application le mai 2018). Qu'est-ce qu'elle comporte (ex : article 20 sur la portabilité des données ") ? Comment réagir, et la tourner en opportunité ?

01/2018

ActuaLitté

Langages informatiques

Langage R et Data Marketing. Coffret en 2 volumes : Utilisez les statistiques pour l'analyse de données marketing

Ces deux livres offrent au lecteur un maximum d'informations sur le langage R et le Data Marketing pour être en mesure d'utiliser les statistiques pour l'analyse de données. 658 pages par nos experts. Un livre de la collection Ressources informatiques Langage R et statistiques - Initiation à l'analyse de données Extrait du résumé : Que vous soyez débutant, novice ou junior dans la science des données, ce livre est là pour vous accompagner dans l'acquisition des connaissances indispensables pour la réalisation de statistiques et l'analyse de tous types de données avec le langage R... Un livre de la collection Marketing Book Data Marketing - Statistiques appliquées au marketing avec Excel et R Extrait du résumé : Cet ouvrage s'adresse aux managers marketing et commerciaux soucieux de développer une stratégie de data marketing au sein de leur organisation (entreprise, service public ou association). Il aborde de manière simple et pragmatique l'intérêt de la data marketing et explique comment la mettre en oeuvre au quotidien à l'aide d'Excel et de R...

07/2023

ActuaLitté

Sociologie

L'enquête quantitative en sciences sociales. Recueil et analyse des données

Ce livre a pour objectif de répondre à une question souvent formulée : comment produire et traiter des données quantitatives en sciences sociales en tenant compte des conditions particulières du domaine d'étude et de la problématique adoptée ? Destiné à tous les étudiants réalisant une enquête collective, un mini-mémoire ou un mémoire, en licence et master de sciences sociales (sociologie, démographie, histoire, économie, science politique), cet ouvrage leur enseigne comment soumettre à une critique scientifique les données recueillies pour leur permettre de mieux construire leur objet de recherche. Appuyé sur un ensemble d'exemples issus de toutes les disciplines des sciences sociales, le livre de Frédéric Lebaron propose une démarche intégrée (appuyée par l'analyse géométrique des données) qui permet de construire et d'étudier en profondeur un espace social.

01/2006

ActuaLitté

Informatique

Python pour les SHS. Introduction à la programmation pour le traitement de données

Ce manuel propose une introduction à la programmation Python destinée aux étudiants et praticiens en SHS. Python est un langage de programmation simple, libre, multi-plateforme, pédagogique, bénéficiant d'une communauté d'utilisateurs croissante tant dans le domaine universitaire que le secteur privé. Avec la multiplication des données numériques dans les sciences humaines et sociales (SHS), le recours à l'informatique devient indispensable tant pour la collecte, la mise en forme, ou le traitement des données. Le langage Python permet à la fois de réaliser les traitements statistiques habituels des SHS tout en ouvrant aux nouveaux usages liés à l'automatisation des tâches informatiques, le traitement des grands corpus des humanités numériques ou encore la collecte de données sur les réseaux sociaux. Ce manuel se concentre en priorité sur les usages du traitement des données en SHS. Complété avec de nombreux exemples de code et des études de cas concrets, l'ouvrage permet une familiarisation progressive à la programmation, au langage Python et à sa philosophie. Il insiste sur sa flexibilité pour répondre aux besoins de chaque problématique tout en soulignant l'importance de la diffusion et de la reproductibilité des traitements informatiques.

01/2021

ActuaLitté

Informatique

Big Data & Streaming. Le traitement streaming & temps réel des données en Big Data

Le Big Data est désormais bien établi ! Il a atteint son paroxysme ces dernières années avec les objets connectés, l'intégration des capteurs dans les objets de la vie courante (voiture, réfrigérateur, télévision, etc.). Ces objets produisent des données en streaming. Beaucoup de cas d'usage et de modèles économique s'appuient aujourd'hui sur des données générées en streaming. Cet ouvrage est un manuel didactique qui a pour but de vous aider à développer les compétences de base nécessaires pour valoriser les don- nées produites en streaming. Que vous soyez freelance, consultant, Data Scientist, Architecte, Développeur ou Manager, cet ouvrage vous aidera à - Comprendre les concepts et notions essentiels pour aborder avec aisance la gestion des données streaming : - Appréhender et mettre en oeuvre les architectures nécessaires pour ingérer efficacement les données générées en streaming, notamment le Data Lake, les bus d'événements, les architectures Lambda, les architectures kappa, et les architectures hybrides ; Monter en compétence sur les technologies de l'écosystème Hadoop dédiées à l'ingestion et au traitement des données produites en streaming, notamment Apache Kafka, Spark Streaming, Flume, Apache Samza, Apache Storm et S4. Pour faciliter l'atteinte de ces trois objectifs, chaque chapitre s'achève par un rappel des points clés et un guide d'étude.

07/2019

ActuaLitté

Assurances

Appliquer la Data Science à l'assurance

Les capacités technologiques augmentant très vite et les bases de données se multiplient. Face à cette nouvelle masse importante de données, les modèles actuariels classiques deviennent perfectibles grâce à une nouvelle discipline qu'est la " Data Science ". L'idée de Data science recouvre la capacité de traiter un spectre de données plus large que celui couvert généralement par les actuaires. Or, la Data science peut offrir de nouvelles opportunités aux assureurs. Par exemple, en santé, les modèles Data Science, par une étude plus poussée des données à disposition et l'intégration de données externes, permettent d'affiner l'analyse de la consommation médicale et d'identifier de potentielles dérives sur des groupes d'assurés présentant des caractéristiques communes. L'objectif de l'ouvrage est d'expliquer ce qu'est cette nouvelle discipline, complémentaire à l'actuariat ; de présenter le métier de Data scientist qui se développe dans les entreprises d'assurance ; et d'étudier les applications pratiques que cela peut avoir dans le secteur de l'assurance.

03/2021

ActuaLitté

Lecture 6-9 ans

5 aventures de Tata La Panda

Tata la Panda vit à Pandaville dans la maison de ses parents. C'est une petite fille Panda très jolie et très intelligente. Elle mène en apparence une existence normale mais elle a un secret : une créature extraordinaire, le chat magique, lui confie des missions. Personne ne connaît le secret de Tata la Panda, même pas ses parents. Au cours des cinq aventures présentées dans ce livre, Tata la Panda et le chat magique unissent leurs efforts pour sauver un enfant malade, secourir un hérisson perdu, empêcher le maire d'installer partout des caméras de surveillance, éviter l'inondation de Pandaville et redonner confiance à un petit panda qui a peur du noir. Les 5 aventures : Tata la Panda et la vallée des castors ; Tata la Panda et le panda qui avait peur du noir ; Tata la Panda et le hérisson perdu ; Tata la Panda et le diamant bleu ; Tata la Panda et les caméras de surveillance.

08/2020