2.4.0

Overview
Programming Guides
API Docs
- Scala
- Java
- Python
- R
- SQL, Built-in Functions
Deploying
More

MLlib: Main Guide

Basic statistics
Data sources
Pipelines
Extracting, transforming and selecting features
Classification and Regression
Clustering
Collaborative filtering
Frequent Pattern Mining
Model selection and tuning
Advanced topics

MLlib: RDD-based API Guide

Data types
Basic statistics
Classification and regression
Collaborative filtering
Clustering
Dimensionality reduction
Feature extraction and transformation
Frequent pattern mining
Evaluation metrics
PMML model export
Optimization (developer)

Decision trees

This section has been moved into the classification and regression section.