Ciencia de datos con python

José Padilla & Leonardo Contreras

José Padilla & Leonardo Contreras
Ciencia de datos con python [PDF ebook]
Transformación y selección de variables

Apoio

Capa do José Padilla & Leonardo Contreras: Ciencia de datos con python (PDF)

Este libro ofrece una visión general sobre los conceptos de Machine Learning y los fundamentos del análisis de datos mediante el lenguaje Python, haciendo uso de herramientas como Num Py, Pandas y Matplotlib. Se hace hincapié en las técnicas que permiten acondicionar un conjunto de datos, desde la detección y corrección de errores hasta el análisis estadístico para comprender el conjunto de datos en cuestión. Además, aborda las etapas de transformación de datos y la selección de características, aspectos cruciales para el éxito de un proyecto de analítica de datos y Machine Learning.
Aborda temas clave para estudiantes o docentes que buscan realizar trabajos o investigaciones que requieran analizar datos y que carezcan de conocimientos sobre cómo preparar la información antes de aplicar algoritmos de Machine Learning. Así pues, la preparación adecuada de los datos es fundamental para determinar el valor de la variable de salida o visualizar patrones dentro de los datos.

€17.99

Tabela de Conteúdo

Prólogo
Introducción
Capítulo I. Explorando el aprendizaje automático
1.1. Una introducción a la clasificación de Machine Learning
1.2. Proceso de Machine Learning
Capítulo II. Ciencia de datos en educación
2.1. Analítica de datos educativos
Capítulo III. Fundamentos de análisis de datos PYTHON
3.1. Configurando el entorno PYTHON
3.2. Librerías básicas de PYTHON
3.3. Básico de sintaxis del lenguaje PYTHON.
3.3.1. Strings y numéricos
3.3.2. Booleanos
3.3.3. Aritmética
3.3.4. Listas
3.3.5. Tuplas
3.3.6. Diccionarios
3.3.7. Variables
3.3.8. Conversión de tipos de datos
3.3.9. Condicional IF
3.3.10. Condicional ELSE
3.3.11. Condicional ELIF
3.3.12. Ciclo con FOR
3.3.13. Función RANGE ( )
3.3.14. Ciclo con WHILE
3.3.15. Iterar con Zip
3.3.16. Iterar con Enumerate
3.3.17. Funciones
3.4. Básico de NUMPY 67
3.4.1. Aspectos de Num Py
3.4.2. Matrices de Num Py
3.4.3. Atributos de los array de Num Py
3.4.4. Operaciones de Num Py
3.4.5. Indexaciones de Num Py
3.5. Básico de pandas
3.5.1. Aspectos de Pandas
3.5.2. Dataframe en Pandas
3.5.3. Atributos de los dataframe de Pandas
3.5.4. Manipular un dataframe de Pandas
3.5.5. Seleccionar filas o columnas de Dataframe
3.5.6. Selección de elementos del Dataframe
3.6. Básico de Matplotlib
3.6.1. Aspectos de Matplotlib
3.6.2. Atributos de un gráfico en Matplotlib
3.6.3. Tipos de gráficos en Matplotlib
Capítulo IV. El poder de los datos
4.1. Fuente de datos
4.2. Proceso de carga de los datos
4.3. Preparación de los datos
4.3.1. Identificación de columnas con varianza cero
4.3.2. Identificación de filas con datos duplicados
4.3.3. Identificación de outliers
4.3.4. Identificación de outliers puntuales por método de desviación estándar
4.3.5. Identificación de outliers puntuales por método de inter cuartiles
4.3.6. Identificación de valores nulos o datos faltantes (Na N)
4.3.7. Manejo de valores nulos (Na N)
4.3.8. Codificar una variable categórica (One hot enconder)
4.3.9. Codificar una variable categórica (Codificación de enteros)
4.4. Estadísticas de los datos 137
4.4.1. Funciones y estadísticas de un dataframe de Pandas
4.4.2. Agrupar datos de un dataframe
4.4.3. Gráfico de los datos
4.4.4. Gráfico entre variables
Capítulo V. Explorando métodos para transformación de los datos
5.1. Reescala de datos
5.2. Estandarización de datos
5.3. Normalización de datos
5.4. Transformación robusta o estandarización robusta
5.5. Transformación de BOX – COX
5.6. Transformación de YEO-JOHNSON
Capítulo VI. Explorando métodos para selección de características
6.1. Métodos de filtro
6.1.1. Correlación de Pearson
6.1.2. Anova
6.1.3. Chi Cuadrado
6.1.4. Información mutua
6.2. Métodos de envoltura (Wrapper) o envolventes
6.2.1. Eliminación de Características Recursivas (RFE)
6.2.2. Eliminación hacia atrás (Backward Selection)
6.2.3. Selección hacia adelante (Forward Selection)
6.2.4. Eliminación bidireccional (Bi-directional elimination)
6.3. Métodos embebidos
6.3.1. Regresión Lineal
6.3.2. Regularización Lasso
6.3.3. Regularización Ridge
6.4. Metodos de ensamble
6.4.1. Árboles de decisión (CART)
6.4.2. Ramdom Forest (Bosque aleatorio)
6.4.3. Extra Trees Classifier (Árboles extremadamente aleatorios)
6.4.4. Eliminación de características recursivas RFECV con métodos de ensamble
6.4.5. XGBoost
6.4.6. Cat Boost
6.4.7. Light GBM
Referencias bibliográficas

Sobre o autor

LEONARDO EMIRO CONTRERAS BRAVO
Ingeniero Mecánico, Magíster ingeniería, Ph D. en ingeniería. Docente de planta Uni¬versidad Distrital Francisco José de Caldas. Director del Grupo de Investigación en Di¬seño, Modelamiento y Simulación – DIMSI. Áreas del conocimiento: diseño, manufactura, análisis de datos, aprendizaje automático. [email protected]
JORGE EDUARDO PADILLA BELTRÁN
Licenciado en Ciencias de la Educación, Magister en Evaluación en Educación, Ph D. en Educación. Docente de planta Universidad Militar Nueva Granada. Director del Gru¬po de Investigación en Pedagogía y didáctica en la educación superior – PYDES. Áreas del conocimiento: ciencias Sociales, ciencias de la Educación, análisis de datos.
[email protected]

Compre este e-book e ganhe mais 1 GRÁTIS!

Língua Espanhol ● Formato PDF ● Páginas 286 ● ISBN 9789587927634 ● Tamanho do arquivo 24.4 MB ● Editora Ediciones de la U ● Cidade Bogotá ● País CO ● Publicado 2024 ● Edição 1 ● Carregável 24 meses ● Moeda EUR ● ID 10077895 ● Proteção contra cópia Adobe DRM

Requer um leitor de ebook capaz de DRM