Lección 1.1: ¿Qué son NumPy y Pandas?
NumPy (Numerical Python)
NumPy es una biblioteca especializada en cálculos numéricos de alto rendimiento. Su estructura central, el array multidimensional (ndarray), permite almacenar grandes volúmenes de datos en una sola estructura compacta, eficiente y vectorizada.
Características clave:
- Procesamiento rápido de grandes volúmenes de datos numéricos.
- Soporte para operaciones matemáticas y estadísticas avanzadas.
- Interfaz con código en C/C++ y Fortran (ideal para aplicaciones científicas).
- Base para muchas otras bibliotecas de ciencia de datos como TensorFlow y Scikit-learn.
Ejemplo:
Pandas
Pandas está diseñada para facilitar el análisis y manipulación de datos estructurados (como hojas de cálculo o bases de datos).
Su estructura principal es el DataFrame, una tabla de datos con etiquetas para filas y columnas.
Características clave:
- Lectura y escritura en múltiples formatos: CSV, Excel, JSON, SQL.
- Limpieza y transformación de datos de forma intuitiva.
- Operaciones de filtrado, agrupación, agregación y combinación de tablas.
- Ideal para análisis exploratorio, ETL y preparación de datos para machine learning.
Ejemplo:
Comparación básica:
Lección 2: Instalación de bibliotecas con pip
¿Qué es pip?
pip es el sistema de gestión de paquetes oficial de Python. Permite instalar bibliotecas adicionales desde PyPI.
Instalación básica
Verifica que tienes pip instalado:
Instala NumPy y Pandas:
Verifica la instalación
Recomendación: instalar Jupyter también
Lección 1.3: Uso de entornos virtuales para proyectos de datos
¿Por qué usar entornos virtuales?
Evitan conflictos entre bibliotecas instaladas en diferentes proyectos. Cada entorno tiene su propia instalación de Python y sus propias dependencias.
Crear y activar un entorno virtual
En Windows:
En macOS/Linux:
Instalar bibliotecas dentro del entorno:
Desactivar el entorno:
Consejo: Usa un entorno virtual por cada proyecto para mantener tu sistema limpio y organizado.
Lección 4: Configuración y uso de Jupyter Notebook
¿Qué es Jupyter Notebook?
Es una aplicación web interactiva que permite combinar código, texto, gráficos y resultados en un solo documento. Muy utilizado en ciencia de datos, machine learning y documentación técnica.
Instalar y lanzar Jupyter:
Esto abrirá una interfaz en tu navegador.
Crear un notebook nuevo:
- Haz clic en "New" > "Python 3".
- Se abrirá un cuaderno en blanco donde puedes ejecutar código en "celdas".
Tipos de celdas:
- Code: Para escribir código Python.
- Markdown: Para escribir texto enriquecido (títulos, listas, ecuaciones, etc.)
Ejemplo de celda Markdown:
Lección 5: Importación de bibliotecas y prueba inicial
Ahora que todo está instalado y configurado, vamos a importar las bibliotecas y realizar una prueba rápida.
Esto confirma que tu entorno está correctamente configurado y listo para comenzar con las siguientes secciones del curso.
