Guide de démarrage rapide: Créer un lac

Cette page explique comment commencer à utiliser Dataplex dans la console Google Cloud en vous guidant tout au long de la création d'un lac, de l'ajout d'une zone et de l'association d'un élément.

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300��$ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  4. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery et Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Accéder à IAM
    2. Sélectionnez le projet.
    3. Cliquez sur Accorder l'accès.
    4. Dans le champ Nouveaux comptes principaux, saisissez votre identifiant utilisateur. Il s'agit généralement de l'adresse e-mail d'un compte Google.

    5. Dans la liste Sélectionner un rôle, sélectionnez un rôle.
    6. Pour attribuer des rôles supplémentaires, cliquez sur Ajouter un autre rôle et ajoutez chaque rôle supplémentaire.
    7. Cliquez sur Enregistrer.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Vérifiez que la facturation est activée pour votre projet Google Cloud.

    10. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery et Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Accéder à IAM
      2. Sélectionnez le projet.
      3. Cliquez sur Accorder l'accès.
      4. Dans le champ Nouveaux comptes principaux, saisissez votre identifiant utilisateur. Il s'agit généralement de l'adresse e-mail d'un compte Google.

      5. Dans la liste Sélectionner un rôle, sélectionnez un rôle.
      6. Pour attribuer des rôles supplémentaires, cliquez sur Ajouter un autre rôle et ajoutez chaque rôle supplémentaire.
      7. Cliquez sur Enregistrer.
      8. Créez un bucket Cloud Storage :
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Créer un lac

Les étapes suivantes vous expliquent comment créer un lac à l'aide de la console Google Cloud.

  1. Accédez à Dataplex dans la console Google Cloud.

    Accéder à Dataplex

  2. Accédez à la vue Gérer.

  3. Cliquez sur Créer.

  4. Saisissez un nom à afficher.

  5. L'ID du lac est généré automatiquement pour vous.

  6. Spécifiez la Région dans laquelle créer l'instance.

    Pour les lacs créés dans une région donnée (par exemple, us-central1), les données d'une seule région (us-central1) et les données multirégionales (us multi-region) peuvent être associées en fonction des paramètres de la zone.

  7. Cliquez sur Créer.

Ajouter une zone à votre lac

Après avoir créé votre lac, vous pouvez y ajouter des zones. Les zones sont des regroupements logiques de données non structurées et structurées.

  1. Dans la vue Manage (Gérer), cliquez sur le nom du lac auquel vous souhaitez ajouter une zone.

  2. Cliquez sur Ajouter une zone.

  3. Saisissez le nom à afficher pour votre zone.

  4. Cliquez sur la liste déroulante Type. Sélectionnez Zone brute ou Zone sélectionnée. En savoir plus sur les types de zones

  5. Sous Emplacements des données, sélectionnez Régional ou Multirégional. Vous ne pourrez plus le modifier par la suite. Les données régionales et multirégionales ne peuvent pas être mélangées dans la même zone.

  6. Cliquez sur Créer.

La création de la zone peut prendre quelques minutes.

Joindre un asset

Les données peuvent être stockées dans des buckets Cloud Storage ou des ensembles de données BigQuery, et peuvent être associées en tant qu'éléments à des zones de données dans un lac Dataplex.

Procédez comme suit pour associer le bucket Cloud Storage que vous avez créé précédemment en tant qu'élément.

  1. Dans la vue Gérer, cliquez sur le nom du lac auquel vous souhaitez associer un bucket Cloud Storage.

  2. Dans l'onglet Zones, cliquez sur la zone à laquelle ajouter l'élément.

  3. Dans l'onglet Assets, cliquez sur Add Assets (Ajouter des éléments).

  4. Cliquez sur Ajouter un composant.

  5. Sous Type, sélectionnez Bucket de stockage.

  6. Sous Nom à afficher, saisissez un nom pour l'asset.

  7. Dans le champ Bucket, cliquez sur Parcourir. Si vous disposez d'un bucket Cloud Storage, recherchez-le et cliquez sur Sélectionner. Si vous n'avez pas de bucket Cloud Storage, vous pouvez en créer un en cliquant sur le bouton .

    1. Saisissez un nom unique pour le bucket. Cliquez sur Continuer.

    2. Sélectionnez un Type d'emplacement. Cliquez sur Continuer.

    3. Choisissez une classe de stockage par défaut pour vos données. Cliquez sur Continuer.

    4. Choisissez un niveau de contrôle des accès. Cliquez sur Continuer.

    5. Sélectionnez une option de protection des données ou Aucune. Cliquez sur Continuer.

    6. Cliquez sur Créer.

    7. Cliquez sur Sélectionner.

  8. Cliquez sur OK.

  9. Cliquez sur Continuer.

  10. Sous Paramètres de découverte, sélectionnez Hériter pour hériter des paramètres de découverte au niveau de la zone.

  11. Cliquez sur Continuer.

  12. Sous Ajouter des éléments, cliquez sur Envoyer.

Attendez la fin de la création de l'asset.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

Vous pouvez également supprimer les ressources utilisées dans ce tutoriel. Les lacs ne peuvent être supprimés que si toutes les ressources de zone de données qu'ils contiennent ont été supprimées. De même, une zone de données ne peut être supprimée que si toutes les ressources d'éléments sous-jacentes ont été supprimées:

Dissocier le bucket de stockage

Les étapes suivantes vous expliquent comment dissocier l'élément Dataplex que vous avez créé.

  1. Accédez à Dataplex dans la console Google Cloud.

    Accéder à Dataplex

  2. Dans la vue Gérer, cliquez sur le nom du lac que vous avez créé.

  3. Dans l'onglet Zones, cliquez sur le nom de la zone que vous avez créée.

  4. Dans l'onglet Éléments, sélectionnez l'élément à dissocier en cochant la case située à gauche du nom du bucket.

  5. Cliquez sur Supprimer l'élément.

  6. Cliquez sur Supprimer pour confirmer la dissociation.

Supprimer la zone

Les étapes suivantes vous expliquent comment supprimer la zone Dataplex que vous avez créée.

  1. Accédez à Dataplex dans la console Google Cloud.

    Accéder à Dataplex

  2. Dans la vue Manage (Gérer), cliquez sur le lac que vous avez créé.

  3. Dans l'onglet Zones, sélectionnez la zone à supprimer en cochant la case située à gauche du nom de la zone de données.

  4. Cliquez sur Supprimer la zone.

  5. Cliquez sur Delete (Supprimer) pour confirmer la suppression.

Supprimer le lac

Les étapes suivantes vous expliquent comment supprimer le lac Dataplex que vous avez créé.

  1. Accédez à Dataplex dans la console Google Cloud.

    Accéder à Dataplex

  2. Dans la vue Manage (Gérer), cliquez sur le lac que vous avez créé.

  3. En haut de la page, cliquez sur Supprimer.

  4. Confirmez la suppression en saisissant "delete" dans la zone de texte.

  5. Cliquez sur Supprimer le lac pour confirmer la suppression.

Étapes suivantes

Après avoir créé votre lac, vos zones et vos éléments, vous pouvez: