Introduction à l'ingénierie des données sur Google Cloud
- Référence GO9093
- Durée 1 Jour
Modalité pédagogique
Classe inter en présentiel Prix
Nous contacter
Demander une formation en intra-entreprise S'inscrireAller à:
Modalité pédagogique
La formation est disponible dans les formats suivants:
-
Classe inter à distance
Depuis n'importe quelle salle équipée d'une connexion internet, rejoignez la classe de formation délivrée en inter-entreprises.
-
Classe inter en présentiel
Formation délivrée en inter-entreprises. Cette méthode d'apprentissage permet l'interactivité entre le formateur et les participants en classe.
-
Intra-entreprise
Cette formation est délivrable en groupe privé, et adaptable selon les besoins de l’entreprise. Nous consulter.
Demander cette formation dans un format différent
Résumé
Haut de pageDans ce cours, vous découvrirez l'ingénierie des données sur Google Cloud, les rôles et responsabilités des ingénieurs de données, et comment ceux-ci correspondent aux offres fournies par Google Cloud.
Vous apprendrez également des manières de relever les défis de l'ingénierie des données.
Mis à jour 10/02/2026
Prochaines dates
Haut de pagePublic
Haut de page- Ingénieurs de données
- Administrateurs de bases de données
- Administrateurs système
Objectifs de la formation
Haut de pageA l'issue de la formation, les participants seront capables de :
- Comprendre le rôle d'un ingénieur de données.
- Identifier les tâches d'ingénierie des données et les composants principaux utilisés sur Google Cloud.
- Comprendre comment créer et déployer des pipelines de données de divers modèles sur Google Cloud.
- Identifier et utiliser diverses techniques d'automatisation sur Google Cloud.
Programme détaillé
Haut de pageTâches et composants de l'ingénierie des données
- Expliquer le rôle d'un ingénieur de données.
- Comprendre les différences entre une source de données et un récepteur de données.
- Expliquer les différents types de formats de données.
- Expliquer les options de solution de stockage sur Google Cloud.
- Apprendre les options de gestion des métadonnées sur Google Cloud.
- Comprendre comment partager facilement des ensembles de données avec Analytics Hub.
- Comprendre comment charger des données dans BigQuery en utilisant la console Google Cloud ou la CLI gcloud
Réplication et Migration de données
- Expliquer l'architecture de base de réplication et de migration de données de Google Cloud.
- Comprendre les options et les cas d'utilisation de l'outil de ligne de commande gcloud.
- Expliquer la fonctionnalité et les cas d'utilisation du Service de transfert de stockage.
- Expliquer la fonctionnalité et les cas d'utilisation de Transfer Appliance.
- Comprendre les fonctionnalités et le déploiement de Datastream
Modèle de Pipeline d'extraction et de chargement de données
- Expliquer le diagramme d'architecture de base d'extraction et de chargement.
- Comprendre les options de l'outil de ligne de commande bq.
- Expliquer la fonctionnalité et les cas d'utilisation du Service de transfert de données BigQuery.
- Expliquer la fonctionnalité et les cas d'utilisation de BigLake en tant que modèle sans extraction-chargement.
Modèle de Pipeline d'extraction, de chargement et de transformation de données
- Expliquer le diagramme d'architecture de base d'extraction, de chargement et de transformation.
- Comprendre un pipeline ELT courant sur Google Cloud.
- Apprendre les capacités de scripting SQL et de planification de BigQuery.
- Expliquer la fonctionnalité et les cas d'utilisation de Dataform.
Modèle de Pipeline d'extraction, de transformation et de chargement de données
- Expliquer le diagramme d'architecture de base d'extraction, de transformation et de chargement.
- Apprendre les outils graphiques de Google Cloud utilisés pour les pipelines de données ETL.
- Expliquer le traitement de données par lots avec Dataproc.
- Apprendre à utiliser Dataproc Serverless pour Spark pour l'ETL.
- Expliquer les options de traitement de données en continu.
- Expliquer le rôle que joue Bigtable dans les pipelines de données.
Techniques d'automatisation
- Expliquer les modèles et les options d'automatisation disponibles pour les pipelines.
- Apprendre sur Cloud Scheduler et Workflows.
- Apprendre sur Cloud Composer.
- Apprendre sur les fonctions Cloud Run.
- Expliquer la fonctionnalité et les cas d'utilisation d'automatisation pour Eventarc.
Pré-requis
Haut de page- Expérience préalable de Google Cloud au niveau fondamental en utilisant Cloud Shell et en accédant aux produits depuis la console Google Cloud.
- Maîtrise de base d'un langage de requête courant tel que SQL.
- Expérience de la modélisation de données et des activités ETL (extraire, transformer, charger).
- Expérience du développement d'applications à l'aide d'un langage de programmation courant tel que Python.
Certification
Haut de pageEt après
Haut de page- Ingénierie des données sur Google Cloud (GO5975)
Bon à savoir
Haut de page- Un support de cours officiel Google en anglais sera fourni aux participants.