Werken met Data Export Service data

Werken met Data Export Service data

NotesLet op: De Data Export Service moet eerst worden geactiveerd en geconfigureerd. Lees op onze portal hoe je de Data Export Service kunt activeren en daarna configureren.


Je dataset verkennen

Zodra je geabonneerd bent, zie je een dataset genaamd spend_cloud_[jouw_omgeving] in je BigQuery-verkenner. Als je deze dataset uitvouwt, zie je meerdere weergaven (views) die je kunt bevragen alsof het standaardtabellen zijn.


Basisprincipes van databronnen

raw_ weergaven (views)

Deze weergaven bevatten de ruwe, onbewerkte data precies zoals deze is gestructureerd in de brondatabases van de Spend Cloud.

info_ weergaven (views)

Deze weergaven bevatten voorbewerkte informatie en inzichten. Ze zijn gebouwd bovenop de ruwe data met behulp van vooraf gedefinieerde query's om rapportage eenvoudiger te maken.


Spend Cloud-module voorvoegsels

Ruwe tabellen gebruiken specifieke numerieke voorvoegsels om aan te geven tot welke module ze behoren. Je ziet alleen tabellen voor modules die actief zijn in jouw omgeving.

VoorvoegselModuleBelangrijkste tabellen
raw_00_*Algemene administratie
raw_01_*Facturatiemoduleraw_01_invoice, raw_01_invoice_line
raw_02_*Kas- en Pasmoduleraw_02_entry, raw_02_card
raw_03_*Declaratiesraw_03_declaration, raw_03_declaration_line
raw_04_*Contractenmoduleraw_04_contract, raw_04_contract_version
raw_05_*Verplichtingenmodule (Commitments)raw_05_commitment, raw_05_commitment_line
raw_06_*Inkoopmodule (Procurement)raw_06_order, raw_06_orderline
raw_config_*Spend Cloud Configuratie

Let op: Kolommen kunnen worden toegevoegd of verwijderd uit weergaven tijdens platformupdates. Vermijd daarom het gebruik van SELECT * FROM view. Selecteer in plaats daarvan expliciet de kolomnamen die je nodig hebt, bijvoorbeeld:

sql SELECT id, name FROM view


Systeemkolommen en incrementeel laden

Veel tabellen bevatten specifieke systeemkolommen die zeer nuttig zijn:

KolomBeschrijving
__db_name__Bevat de naam van je Spend Cloud-omgeving.
_date_created_Geeft aan wanneer een record is aangemaakt.
_date_changed_Geeft aan wanneer een record voor het laatst is gewijzigd.

Tip: Je kunt de kolom _date_changed_ gebruiken om efficiënt incrementeel data op te halen, in plaats van elke keer de volledige dataset op te halen. Deze velden zijn altijd van het type integer in het formaat Unix timestamp seconds (het aantal seconden vanaf 1-1-1970).


Data gebruiken buiten Google en BigQuery

Nu je verbonden bent, kun je deze data inladen in verschillende analytische tools of andere doelsystemen. Hoe je BigQuery-data laadt in jouw doelsysteem, is afhankelijk van de mogelijkheden van het doelsysteem. Veel systemen hebben een standaard connector voor BigQuery — als deze bestaat, heeft dit de voorkeur. Hieronder staan algemene richtlijnen voor populaire platforms.

Google Sheets

  1. Open een nieuwe Google Sheet terwijl je bent ingelogd met je gekoppelde Google-account.
  2. Navigeer in het menu naar Gegevens > Gegevens connectors > Verbinden met BigQuery.
  3. Selecteer je Google Project.
  4. Kies ervoor om aangepaste SQL te schrijven of selecteer je spend_cloud-dataset direct.
  5. Selecteer de gewenste view en klik op Verbinden (Connect).

IdeaTip: Gebruik de "Vernieuwingsopties" (Refresh Options) om automatische data-updates te plannen.

Microsoft Excel

Om een verbinding te creëren waarbij je op "Vernieuwen" kunt klikken in Excel om de nieuwste BigQuery-gegevens op te halen, moet je Google's officiële ODBC-stuurprogramma (Open Database Connectivity) gebruiken.

1. Download en installeer het stuurprogramma

  • Ga naar de officiële Google Cloud-documentatie en download de Simba ODBC Driver for Google BigQuery (kies de 64-bit of 32-bit versie).
  • Voer het installatieprogramma uit op je Windows-machine.

2. Configureer de ODBC-gegevensbron

  • Open de app ODBC-gegevensbronnen op je Windows-pc (zoek hiernaar in het Startmenu).
  • Ga naar het tabblad Systeem-DSN.
  • Als die tab leeg is, druk Toevoegen en selecteer Simba ODBC Driver for Google BigQuery en klik op Voltooien. Als er al Google BigQuery stond, kan deze stap worden overgeslagen.
  • Kies in het configuratievenster voor User Authentication of Service Authentication (User is het makkelijkst voor persoonlijke accounts; Service is het beste voor zakelijke/geautomatiseerde setups).
  • Volg de aanwijzingen om in te loggen met je Google Cloud-account om het refresh token te verkrijgen, en selecteer je specifieke GCP Catalog (Project) en Dataset.

3. Koppel Excel aan de ODBC-bron

  • Open Excel en ga naar het tabblad Gegevens.
  • Klik op Gegevens ophalen > Uit andere bronnen > Uit ODBC.
  • Selecteer in de vervolgkeuzelijst de naam van de gegevensbron (DSN) die je zojuist hebt aangemaakt (bijv. "Google BigQuery").
  • Klik op OK. Je ziet nu het Navigator-venster waar je jouw BigQuery-tabellen kunt selecteren en deze direct in Excel of Power Query kunt laden.

Microsoft Power BI

  1. Klik in Power BI Desktop op Gegevens ophalen > Meer... (Get Data > More...).
  2. Zoek naar en selecteer Google BigQuery, en klik vervolgens op Verbinden.
  3. Log in met je Google-organisatieaccount.
  4. Vouw in het Navigator-venster je project uit, selecteer je dataset en de views die je wilt inladen.
  5. Klik op Laden (Load) (of Gegevens transformeren) en selecteer de Import- of DirectQuery-modus.

AlertLet op: Power BI heeft een experimentele BigQuery-connector gelanceerd die alleen werkt voor data die zich in de V.S. bevindt. Aangezien alle Spend Cloud-data veilig in de E.U. blijft, zal deze experimentele connector niet werken. In de Power BI-instellingen kan deze connector worden uitgeschakeld, waarna de koppeling wel werkt.

Tableau

  1. Ga in Tableau Desktop naar het Verbinden-paneel (Connect).
  2. Selecteer onder "Naar een server" (To a Server) Google BigQuery.
  3. Volg de OAuth-prompt om in te loggen met je Google-account.
  4. Selecteer je Google Project in de dropdown en selecteer vervolgens de Spend Cloud-dataset.
  5. Sleep de tabellen die je wilt analyseren naar het canvas.

Integratie via programmeertalen / REST API

Heeft jouw doelsysteem geen standaard connector, dan is er altijd de mogelijkheid om data uit BigQuery te halen via de REST API. Google stelt in verschillende programmeertalen client libraries beschikbaar die feitelijk de REST API benaderen, maar eenvoudiger en betrouwbaarder werken. Lees daarover meer op deze pagina van Google. Mocht je toch graag de REST API gebruiken, lees daar dan meer over op deze pagina van Google.

De onderstaande proof-of-concept geeft weer hoe de data kan worden opgehaald met Python:

#Python library: google-cloud-bigquery

  1. from google.cloud import bigquery

    import os



    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = {filepath_to_service_account_file}



    class BigQueryClient:

       def __init__(self, default_project_id: str):

           self.default_project_id = default_project_id

           self.client = bigquery.Client()


       def get_table_names_in_dataset(self, dataset_name: str, project_id: str = None) -> list[str]:

           project_id = self.default_project_id if project_id is None else project_id

           return [t.table_id for t in self.client.list_tables(f"{project_id}.{dataset_name}")]


       def get_query_result(self, full_table_name: str, query_field_names: list) -> list[dict]:

           sql = f"select {','.join(query_field_names)} from `{full_table_name}`"


           query_job = self.client.query(sql)

           data = query_job.result()


           return [{field_name: row[i] for i, field_name in enumerate(query_field_names)} for row in data]



    bq = BigQueryClient(f"{project_id}")

    print(bq.get_query_result(f"{project_id}.{dataset_id}.{view_id}", ["_name_"]))

Info
Heb je vragen of loop je ergens tegenaan? Neem dan contact op met ons supportteam.

    • Related Articles

    • Configureer de Data Export Service in Google Cloud Platform

      Let op: De Data Export Service moet eerst worden geactiveerd. Lees in dit artikel hoe je daarmee van start kunt gaan. Introductie Dit artikel helpt je bij het verbinden met je Spend Cloud-data. Onze Data Export Service maakt gebruik van Google ...
    • Waarom onze Data Export Service via Google verloopt

      Het klinkt in eerste instantie misschien als extra beheerlast: het toevoegen van wéér een platform. Wanneer je leest dat de authenticatie voor onze Data Export Service via Google verloopt, ontstaan er wellicht begrijpelijke zorgen over extra ...
    • Ontdek de voordelen van de Data Export Service

      Vanaf nu bieden we de mogelijkheid om Spend Cloud data schaalbaar en flexibel te ontsluiten voor rapportage- of andere doeleinden. Dit noemen we de Data Export Service. De Spend Cloud wordt gehost op Google Cloud platform. Door een bestaand ...
    • Authenticatie voor geautomatiseerde data pipelines

      Om scripts of geautomatiseerde systemen veilig te verbinden met je BigQuery-dataset, gebruik je vaak niet direct je gebruikersaccount. Het is in de systemen niet altijd mogelijk om in te loggen en data pipelines draaien vaak 's nachts, waardoor multi ...