Kurzanleitung: Lake erstellen

Auf dieser Seite werden die ersten Schritte mit Dataplex in der Google Cloud Console beschrieben. Sie werden durch das Erstellen eines Lakes, das Hinzufügen einer Zone und das Anhängen eines Assets geführt.

Hinweise

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

  4. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery und Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Zu IAM
    2. Wählen Sie das Projekt aus.
    3. Klicken Sie auf Zugriff erlauben.
    4. Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Dies ist in der Regel die E-Mail-Adresse eines Google-Kontos.

    5. Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
    6. Wenn Sie weitere Rollen hinzufügen möchten, klicken Sie auf Weitere Rolle hinzufügen und fügen Sie weitere Rollen hinzu.
    7. Klicken Sie auf Speichern.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

    10. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery und Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Zu IAM
      2. Wählen Sie das Projekt aus.
      3. Klicken Sie auf Zugriff erlauben.
      4. Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Dies ist in der Regel die E-Mail-Adresse eines Google-Kontos.

      5. Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
      6. Wenn Sie weitere Rollen hinzufügen möchten, klicken Sie auf Weitere Rolle hinzufügen und fügen Sie weitere Rollen hinzu.
      7. Klicken Sie auf Speichern.
      8. Erstellen Sie einen Cloud Storage-Bucket:
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Lakes erstellen

In den folgenden Schritten erfahren Sie, wie Sie einen Lake mit der Google Cloud Console erstellen.

  1. Rufen Sie Dataplex in der Google Cloud Console auf.

    Zu Dataplex

  2. Rufen Sie die Ansicht Verwalten auf.

  3. Klicken Sie auf Erstellen.

  4. Geben Sie einen Anzeigenamen ein.

  5. Die Lake-ID wird automatisch für Sie generiert.

  6. Geben Sie die Region an, in der die Instanz erstellt werden soll.

    Für Lakes, die in einer bestimmten Region (z. B. us-central1) erstellt wurden, können je nach Zoneneinstellungen sowohl Daten mit einer einzelnen Region (us-central1) als auch Daten aus mehreren Regionen (us multi-region) angehängt werden.

  7. Klicken Sie auf Erstellen.

Zone zum Lake hinzufügen

Nachdem Sie den Lake erstellt haben, können Sie ihm Zonen hinzufügen. Zonen sind logische Gruppen von unstrukturierten und strukturierten Daten.

  1. Klicken Sie in der Ansicht Verwalten auf den Namen des Lakes, dem Sie eine Zone hinzufügen möchten.

  2. Klicken Sie auf Zone hinzufügen.

  3. Geben Sie einen Anzeigenamen für die Zone ein.

  4. Klicken Sie auf das Drop-down-Menü Typ. Wählen Sie Rohbereich oder Ausgewählter Bereich aus. Weitere Informationen zu Zonentypen

  5. Wählen Sie unter Speicherorte für Daten entweder Regional oder Multiregional aus. Die Auswahl kann später nicht mehr geändert werden. Daten aus einer einzelnen Region und Daten mit mehreren Regionen können nicht in derselben Zone gemischt werden.

  6. Klicken Sie auf Erstellen.

Es kann einige Minuten dauern, bis die Zone erstellt ist.

Asset anhängen

Daten können in Cloud Storage-Buckets oder BigQuery-Datasets gespeichert und als Assets an Datenzonen in einem Dataplex-Lake angehängt werden.

Führen Sie die folgenden Schritte aus, um den zuvor erstellten Cloud Storage-Bucket als Asset anzuhängen.

  1. Klicken Sie in der Ansicht Verwalten auf den Namen des Lakes, an den Sie einen Cloud Storage-Bucket anhängen möchten.

  2. Klicken Sie auf dem Tab Zonen auf die Zone, der das Asset hinzugefügt werden soll.

  3. Klicken Sie auf dem Tab Assets auf Assets hinzufügen.

  4. Klicken Sie auf Asset hinzufügen.

  5. Wählen Sie unter Typ die Option Storage-Bucket aus.

  6. Geben Sie unter Anzeigename einen Namen für das Asset ein.

  7. Klicken Sie im Feld Bucket auf Durchsuchen. Wenn Sie einen Cloud Storage-Bucket haben, suchen Sie ihn und klicken Sie auf Auswählen. Wenn Sie keinen Cloud Storage-Bucket haben, können Sie einen erstellen, indem Sie auf die Schaltfläche klicken.

    1. Geben Sie einen eindeutigen Namen für den Bucket ein. Klicken Sie auf Weiter.

    2. Wählen Sie einen Standorttyp aus. Klicken Sie auf Weiter.

    3. Wählen Sie eine Standardspeicherklasse für Ihre Daten aus. Klicken Sie auf Weiter.

    4. Wählen Sie eine Zugriffssteuerungsebene aus. Klicken Sie auf Weiter.

    5. Wählen Sie eine Datenschutzoption oder Keine aus. Klicken Sie auf Weiter.

    6. Klicken Sie auf Erstellen.

    7. Klicken Sie auf Auswählen.

  8. Klicken Sie auf Fertig.

  9. Klicken Sie auf Weiter.

  10. Wählen Sie unter Erkennungseinstellungen die Option Übernehmen aus, um die Erkennungseinstellungen von der Zonenebene zu übernehmen.

  11. Klicken Sie auf Weiter.

  12. Klicken Sie unter Assets hinzufügen auf Senden.

Warten Sie, bis die Erstellung des Assets abgeschlossen ist.

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

Alternativ können Sie die in dieser Anleitung verwendeten Ressourcen löschen. Lakes können nur gelöscht werden, wenn alle untergeordneten Datenzonenressourcen gelöscht wurden. Ebenso können Datenzonen nur gelöscht werden, wenn alle ihr untergeordneten Asset-Ressourcen gelöscht wurden:

Storage-Bucket trennen

In den folgenden Schritten erfahren Sie, wie Sie das von Ihnen erstellte Dataplex-Asset trennen.

  1. Rufen Sie Dataplex in der Google Cloud Console auf.

    Zu Dataplex

  2. Klicken Sie in der Ansicht Verwalten auf den Namen des von Ihnen erstellten Lakes.

  3. Klicken Sie im Tab Zonen auf den Namen der von Ihnen erstellten Zone.

  4. Wählen Sie auf dem Tab Assets das zu trennende Asset aus. Klicken Sie dazu auf das Kästchen links neben dem Bucket-Namen.

  5. Klicken Sie auf Asset löschen.

  6. Klicken Sie auf Löschen, um das Trennen zu bestätigen.

Bereich löschen

Die folgenden Schritte zeigen, wie Sie die von Ihnen erstellte Dataplex-Zone löschen.

  1. Rufen Sie Dataplex in der Google Cloud Console auf.

    Zu Dataplex

  2. Klicken Sie in der Ansicht Verwalten auf den Lake, den Sie erstellt haben.

  3. Wählen Sie auf dem Tab Zonen die zu löschende Zone aus. Klicken Sie dazu auf das Kästchen links neben dem Namen der Datenzone.

  4. Klicken Sie auf Zone löschen.

  5. Klicken Sie zur Bestätigung noch einmal auf Löschen.

Lake löschen

Die folgenden Schritte zeigen, wie Sie den von Ihnen erstellten Dataplex-Lake löschen.

  1. Rufen Sie Dataplex in der Google Cloud Console auf.

    Zu Dataplex

  2. Klicken Sie in der Ansicht Verwalten auf den Lake, den Sie erstellt haben.

  3. Klicken Sie oben auf der Seite auf Löschen.

  4. Bestätigen Sie das Löschen, indem Sie „delete“ in das Textfeld eingeben.

  5. Klicken Sie auf Lake löschen, um den Löschvorgang zu bestätigen.

Nächste Schritte

Nachdem Sie den Lake, Zonen und Assets erstellt haben, können Sie: