APACHE SPARK - DEVELOPPEZ EN PYTHON POUR LE BIG DATA

ENI - EAN : 9782409033780

NASTASIA SABY

Skip to the end of the images gallery

Skip to the beginning of the images gallery

Édition papier

EAN : 9782409033780

Paru le : 17 janv. 2022

39,00 € 36,97 €

Disponible

Pour connaître votre prix et commander, identifiez-vous

Notre engagement qualité

Livraison gratuite
en France sans minimum
de commande
Manquants maintenus
en commande
automatiquement
Un interlocuteur
unique pour toutes
vos commandes
Toutes les licences
numériques du marché
au tarif éditeur
Assistance téléphonique
personalisée sur le
numérique
Service client
Du Lundi au vendredi
de 9h à 18h

Détails

EAN13 : 9782409033780
Réf. éditeur : EISPARK
Collection : EXPERT IT
Editeur : ENI
Date Parution : 17 janv. 2022
Disponibilite : Disponible
Barème de remise : NS
Nombre de pages : 308
Format : 1.60 x 17.80 x 21.60 cm
Poids : 485gr

Résumé

Résumé : Ce livre sur le framework Apache Spark vous permet d’apprendre à développer des applications en Python en vous appuyant sur l’analyse et le traitement de données volumineuses ainsi que sur la notion d’apprentissage automatique.

Après quelques définitions de termes liés au domaine de la data, vous découvrez les fondements de Spark. Vous appréhendez l’architecture logicielle du framework, ses composants et les différents langages avec lesquels il est possible de développer.

Vous entrez ensuite concrètement dans la transformation de données. Fonctions numériques, alphanumériques, ajouts d’information, suppressions, agrégations de premier ordre et plus complexes sont à l’honneur. Des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs sont étudiées et les nombreuses API de Spark parcourues, tout en étant illustrées par des exemples.

Dans la suite du livre, l’auteur dévoile l’apprentissage machine. Apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de concepts détaillés. Vous découvrez les différents algorithmes présents dans Spark, les manières de préparer des données à l’entraînement ainsi que les possibilités d’évaluation d’un système prédictif au travers de plusieurs mises en pratique. Les notions d’arbres de décision, de forêts aléatoires, de réseaux de neurones, de régressions linéaires et de factorisation de matrices vous sont expliquées ainsi que le traitement des informations numériques et la vectorisation de textes.

Pour finir, un chapitre met en avant l’industrialisation de Spark. Déployer, déboguer et tester son application ainsi que les subtilités de l’outil pour assurer une performance optimale sont autant d’éléments cruciaux détaillés.

Si les exemples de code du livre sont en Python, langage aujourd’hui le plus utilisé avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision complète du framework.
Biographie : Nastasia SABY est ingénieur en Machine Learning. Après avoir débuté sa carrière en tant que développeuse back-end, elle a suivi la révolution de la data et s’est notamment spécialisée dans le développement avec le framework Apache Spark. Elle est
aujourd’hui experte de la mise en production de systèmes prédictifs dans le domaine du streaming. Conférencière et rédactrice d’articles de blog, elle aime partager son savoir au plus grand nombre.