Scikit-learn (o sklearn) es una librería de Python utilizada para implementar modelos de ciencia de datos. Con esta librería podrás realizar:

En las siguientes secciones podrás conocer más detalles sobre qué es Scikit-learn y cómo podemos utilizarla.

Puedes seguir el sitio web oficial para la instalación. En resumen, puedes utilizar herramientas como pip o conda para instalar la librería, utilizando los siguientes comandos en una consola:

Usando pip:

pip install -U scikit-learn

Usando conda:

  1. Crea un entorno e instala la librería:

conda create -n sklearn-env -c conda-forge scikit-learn

  1. Activa el entorno para utilizar la librería:

conda activate sklearn-env

Durante el proceso de machine learning utilizarás objetos de diferentes tipos, que comparten estructuras similares:

Generalmente importarás herramientas específicas para cada una de las etapas del proceso de machine learning. En ese sentido, Scikit-learn está estructurada para que puedas importar bloques particulares de acuerdo a la etapa en la que te encuentres. Veremos algunas importaciones básicas:

from sklearn.preprocessing import StandardScaler

from sklearn.linear_model import LinearRegression

from sklearn.metrics import accuracy_score

Como puedes ver, existen diferentes módulos para diferenciar clases y métodos en todas las etapas de un proceso de machine learning. Sin embargo, siempre se mantendrá la estructura from sklearn.<> import <>

Scikit-learn mantiene su consistencia en los atributos de los estimadores, en la representación de los datos y en la reutilización de componentes. Específicamente, esta librería tiene las siguientes características: