Running Spark on Azure Databricks

This file contains code from the demos in Cloud Academy's Running Spark on Azure Databricks course.

Introduction

Notebooks

%fs ls
%fs ls databricks-datasets
%fs head --maxBytes=1000 dbfs:/databricks-datasets/Rdatasets/data-001/csv/Ecdat/Computers.csv

DROP TABLE IF EXISTS computers;

CREATE TABLE computers
  USING csv
  OPTIONS (path "/databricks-datasets/Rdatasets/data-001/csv/Ecdat/Computers.csv", header "true", inferSchema "true")

Training a Machine Learning Model

MNIST notebook: https://docs.databricks.com/_static/notebooks/decision-trees.html

Print decision tree accuracy:

import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
val evaluator = new MulticlassClassificationEvaluator().setLabelCol("indexedLabel").setMetricName("weightedPrecision")
val prediction = model.transform(test)
println(s"accuracy = ${evaluator.evaluate(prediction)}")

Deploying a Trained Model

The archive file containing sample AzureML notebooks that was previously at https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/azure-databricks/Databricks_AMLSDK_1-4_6.dbc is no longer available. You can now find the individual sample notebooks at https://github.com/cloudacademy/azure-databricks/tree/master/amlsdk.

Conclusion

Azure Databricks documentation: https://docs.azuredatabricks.net/
Support: support@cloudacademy.com

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
amlsdk		amlsdk
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

amlsdk

amlsdk

README.md

README.md

Repository files navigation

Running Spark on Azure Databricks

Introduction

Notebooks

Training a Machine Learning Model

Deploying a Trained Model

Conclusion

About

Releases

Packages

Languages

leonarbe/azure-databricks

Folders and files

Latest commit

History

amlsdk

amlsdk

README.md

README.md

Repository files navigation

Running Spark on Azure Databricks

Introduction

Notebooks

Training a Machine Learning Model

Deploying a Trained Model

Conclusion

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages