1
Introducción al lenguaje Python
- Los principales tipos de datos: cadenas, booleanos, números, listas, tuplas y diccionarios.
- Estructuras de control: bucles for y while, pruebas if/elif/else.
- Funciones: creación, paso de parámetros, valores por defecto, argumentos variables.
- Crear y utilizar bibliotecas.
- Los principales escollos de Python: tipos mutables y no mutables, asignación por referencia/dirección.
- El entorno de desarrollo Python/Anaconda.
Trabajo práctico
Manejo de Python con la distribución Anaconda, uso de un IDE, pequeños ejercicios algorítmicos para familiarizarse con el lenguaje. Manejo de fechas.
2
Información adicional sobre la lengua
- Comprensión de la sintaxis orientada a objetos.
- Creación de una clase: atributos de clase, atributos de instancia, métodos, funciones especiales.
- Lee y escribe archivos en formato de texto.
- Utilizar bibliotecas estándar: bases de datos relacionales y expresiones regulares.
Trabajo práctico
Conexión a una base de datos relacional y análisis de los registros mediante expresiones regulares, para crear un archivo CSV que puedan utilizar las bibliotecas científicas.
3
Presentación del ecosistema científico Python
- Visión general del ecosistema científico de Python: las bibliotecas esenciales.
- Saber dónde encontrar nuevas librerías y evaluar su sostenibilidad.
- Las principales herramientas y software de código abierto para la ciencia de datos.
- Por qué utilizar una distribución científica como Anaconda.
- Comprender las ventajas de un entorno virtual y saber cómo utilizarlo.
- El intérprete iPython y el servidor Jupyter!
- Prácticas recomendadas para empezar con buen pie un proyecto de ciencia de datos con Python.
- Formatos de archivos científicos y bibliotecas para manipularlos.
Trabajo práctico
Configuración del entorno de desarrollo. Creación de un entorno virtual, exportación y duplicación de un entorno, uso de cuadernos Jupyter.
4
La pila SciPy
- La base de las bibliotecas científicas esenciales en las que se basan todas las demás: la pila SciPy.
- Numpy: cálculo numérico y álgebra lineal (vectores, matrices, imágenes).
- Scipy, basado en Numpy para: estadística, análisis funcional y geoespacial, procesamiento de señales...
- Pandas: análisis de datos tabulares (CSV, Excel, etc.), estadísticas, pivotes, filtros, búsquedas, etc.
- Matplotlib: la biblioteca de visualización de datos esencial para empezar.
Trabajo práctico
Tratamiento de imágenes con Numpy. Primeros gráficos. Análisis estadístico de ficheros CSV. Primeros elementos de mapeo. Transformadas de Fourier.