shap.datasets.diabetes

shap.datasets.diabetes(n_points: int | None = None) → tuple[DataFrame, ndarray]

Return the diabetes data in a nice package.

Used in predictive regression tasks.

Parameters:

n_pointsint, optional: Number of data points to sample. If provided, randomly samples the specified number of points.

Returns:

Notes

Feature Columns in X:

Target y:

The diabetes dataset is a subset of the larger diabetes dataset from scikit-learn. More details: sklearn.datasets.load_diabetes()

Examples

To get the processed data and target labels:

data, target = shap.datasets.diabetes()