Aan de slag met Databricks

Databricks-concepten

Kevin Barlow

Data Practitioner

Compute-cluster opfrissen

Cloudcomputing-diagram

Databricks-concepten

Maak je eerste cluster

De eerste stap is een cluster maken voor je dataverwerking!

Configuratie-opties:

Cluster-UI

Databricks-concepten

Maak je eerste cluster

De eerste stap is een cluster maken voor je dataverwerking!

Configuratie-opties:

  • Clusterbeleid en toegang

Cluster-UI - Toegang

Databricks-concepten

Clustertoegang

Cluster-toegangsdiagram

Databricks-concepten

Maak je eerste cluster

De eerste stap: maak een cluster voor je dataverwerking!

Configuratie-opties:

  • Clusterbeleid en toegang
  • Databricks Runtime
  • Photon-acceleratie

Cluster-UI - Runtime

Databricks-concepten

Maak je eerste cluster

De eerste stap: maak een cluster voor je dataverwerking!

Configuratie-opties:

  • Clusterbeleid en toegang
  • Databricks Runtime
  • Photon-acceleratie
  • Node-instantietypen en aantal
  • Auto-scaling / auto-terminatie

Cluster-UI - Nodes

Databricks-concepten

Data Explorer

Maak kennis met de Data Explorer! In deze UI kun je:

  1. Door catalogi/schemas/tabellen bladeren
  2. Voorbeelddata en samenvattingstatistieken bekijken
  3. Datalijn en geschiedenis zien

Je kunt ook nieuwe data uploaden via het pluspictogram!

Data-exploratie

1 Foto door Jakub Zerdzicki: https://www.pexels.com/photo/magnifier-loupe-17284804/
Databricks-concepten

Maak een notebook

Databricks-notebooks:

  • Standaardinterface voor Databricks
  • Verbeteringen op open-source Jupyter
  • Ondersteuning voor meerdere talen
    • Python, R, Scala, SQL
    • Magic-commands (%sql)
  • Ingebouwde visualisaties
  • Realtime reageren en samenwerken

Notebook maken in Workspace

Databricks-concepten

Laten we oefenen!

Databricks-concepten

Preparing Video For Download...