Tous nos rayons

Déjà client ? Identifiez-vous

Mot de passe oublié ?

Nouveau client ?

CRÉER VOTRE COMPTE
Spark
Ajouter à une liste

Librairie Eyrolles - Paris 5e
Disponible en magasin

Spark

Spark

Valorisez vos données grâce au machine learning

Romain Jouin - Collection InfoPro - Management des systèmes d'information

304 pages, parution le 08/01/2020

Résumé

Depuis 2015, Spark s'impose comme le standard de-facto pour le big data : en apportant simplicité d'usage, puissance de calcul, analyses en temps réel, algorithmes de machine learning et deep learning, le tout accessible en Python. Spark est devenu la porte d'entrée incontournable des projets de valorisation de données.

Alors que vient de sortir Spark 3, les environnements simplifiés "clicks boutons" sont légion. Mais pour les utiliser à bon escient, il vous faudra comprendre le fonctionnement interne de Spark afin de paramétrer correctement votre cluster et vos applications.
C'est ce que propose ce livre : vous emmener dans une compréhension fine des tenants et aboutissants de Spark, depuis son installation et sa configuration jusqu'à l'écriture et l'exécution d'applications.

L'analyse des données n'est utile que dans des cas business précis. C'est pourquoi nous insistons sur une méthode d'analyse des données qui vous permettra de connaître les étapes d'un projet de machine learning, et les questions indispensables à se poser pour réussir une analyse pertinente. Nous l'illustrons via un exemple complet d'une entreprise (virtuelle) de location de vélo en libre service.

Ainsi, en lisant ce livre, vous maîtriserez l'outil et la méthode adéquats pour valoriser vos données de manière éclairée, vous assurant une meilleure efficacité et rentabilité de vos projets data.

Le code du livre est disponible sur Github.

L'auteur - Romain Jouin

Romain Jouin. Romain Jouin est fondateur du cabinet de conseil en data stratégie Mémorandum. Il accompagne les entreprises de toute taille dans leur réflexion stratégique sur l'utilisation de la data. C'est un spécialiste de la valorisation des données.

Autres livres de Romain Jouin

Sommaire


Spark et big data. La fin des bases de données SQL ? L'algorithme MapReduce. Le Directed Acyclic Graph. Les Resilient Distributed Datasets. Concepts de Spark. Installation de Spark. Démarrer le cluster Spark. Démarre le master. Configuration d'une session Spark sur cluster. Présentation et installation de HDFS. Premiers scripts avec Spark Core et Spark SQL. Installer Git et Docker. Spark Streaming. Spark SQL. Introduction au machine learning. Spark ML : étude de cas analyse d'une société de location de Vélib. Comprendre, visualiser et nettoyer les données. Exemple de modélisation. Intégration des étapes de machine learning dans un pipeline.
 
Voir tout
Replier

Caractéristiques techniques

  PAPIER NUMERIQUE
Éditeur(s) Dunod
Auteur(s) Romain Jouin
Collection InfoPro - Management des systèmes d'information
Parution 08/01/2020 08/01/2020
Nb. de pages 304 256
Format 18 x 25 -
Couverture Broché -
Poids 566g -
Intérieur Noir et Blanc -
Contenu - ePub
EAN13 9782100794324 9782100810161

Avantages Eyrolles.com

Livraison à partir de 0,01 en France métropolitaine
Paiement en ligne SÉCURISÉ
Livraison dans le monde
Retour sous 15 jours
+ d'un million et demi de livres disponibles
satisfait ou remboursé
Satisfait ou remboursé
Paiement sécurisé
modes de paiement
Paiement à l'expédition
partout dans le monde
Livraison partout dans le monde
Service clients sav@commande.eyrolles.com
librairie française
Librairie française depuis 1925
Recevez nos newsletters
Vous serez régulièrement informé(e) de toutes nos actualités.
Inscription