Databricks_Projects/Databricks-Workspace-Setup.md at main · DarrenDavy12/Databricks_Projects

Databricks Workspace Setup and Data Loading

Objective: Setted up a cluster, create a notebook, and load sample data

Step 1: Created a cluster (done via UI, ensure it's running)

Step 2: Loaded sample data (e.g., NYC Taxi dataset)

data_path = "dbfs:/databricks-datasets/nyctaxi/tripdata/yellow/yellow_tripdata_2019-01.csv.gz" df = spark.read.csv(data_path, header=True, inferSchema=True)

Step 3: Saved to DBFS

df.write.mode("overwrite").parquet("/mnt/sample-data/nyc-taxi")

Step 4: Displayed sample data

display(df.limit(10))

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Databricks Workspace Setup and Data Loading

Objective: Setted up a cluster, create a notebook, and load sample data

Step 1: Created a cluster (done via UI, ensure it's running)

Step 2: Loaded sample data (e.g., NYC Taxi dataset)

Step 3: Saved to DBFS

Step 4: Displayed sample data

FilesExpand file tree

Databricks-Workspace-Setup.md

Latest commit

History

Databricks-Workspace-Setup.md

File metadata and controls

Databricks Workspace Setup and Data Loading

Objective: Setted up a cluster, create a notebook, and load sample data

Step 1: Created a cluster (done via UI, ensure it's running)

Step 2: Loaded sample data (e.g., NYC Taxi dataset)

Step 3: Saved to DBFS

Step 4: Displayed sample data