Formación : Big Data, métodos y soluciones prácticas para el análisis de datos

Big Data, métodos y soluciones prácticas para el análisis de datos

Descargar en formato pdf Compartir este curso por correo electrónico 2


Este curso le permitirá comprender los retos y las aportaciones de los macrodatos o Big Data, así como las tecnologías para implementarlos. Aprenderá a integrar volúmenes masivos de datos estructurados y no estructurados a través de un ETL y a analizarlos con modelos estadísticos y cuadros de control dinámicos.


Abierta
In-company
A medida

Curso práctico presencial o en clase a distancia

Ref. BID
Precio : 2470 € I.E.
  5d - 35h00




Este curso le permitirá comprender los retos y las aportaciones de los macrodatos o Big Data, así como las tecnologías para implementarlos. Aprenderá a integrar volúmenes masivos de datos estructurados y no estructurados a través de un ETL y a analizarlos con modelos estadísticos y cuadros de control dinámicos.

Objetivos pedagógicos
Una vez finalizada la formación, el participante podrá:
  • Comprender los conceptos y la contribución de los Big Data a los problemas de la empresa
  • Comprender el ecosistema tecnológico necesario para llevar a cabo un proyecto de Big Data
  • Adquirir competencias técnicas para gestionar flujos masivos de datos complejos, no estructurados
  • Implementar modelos de análisis estadísticos para responder a las necesidades de la empresa
  • Comprender una herramienta de visualización de datos para reproducir análisis dinámicos

Público afectado
Minería de datos, investigadores estadísticos, desarrolladores, gestores de proyecto y consultores de inteligencia empresarial.

Requisitos previos
Conocimientos básicos de modelos relacionales, estadística y lenguajes de programación. Conocimientos básicos de los conceptos de la Inteligencia Empresarial (Business Intelligence).

Programa de la formación

Comprender los conceptos y los retos de los Big Data

  • Orígenes y definición de Big Data.
  • Las cifras clave del mercado en el mundo y en Francia.
  • Los retos de los Big Data: Rendimiento de la inversión, organización y confidencialidad de los datos.
  • Un ejemplo de arquitectura de Big Data.

Tecnologías de Big Data

  • Descripción de la arquitectura y componentes de la plataforma Hadoop.
  • Modos de almacenamiento (NoSQL, HDFS).
  • Principios de funcionamiento de MapReduce, Spark, Storm...
  • Principales distribuciones del mercado (Hortonworks, Cloudera, MapR, Elastic Map Reduce y Biginsights).
  • Instalar una plataforma Hadoop.
  • Las tecnologías del datascientist.
  • Presentación de tecnologías específicas para Big Data (Tableau, Talend, Qlikview, etc.).
Ejercicio
Instalación de una plataforma Big Data Hadoop (a través de Cloudera QuickStart u otra).

Gestionar datos estructurados y no estructurados

  • Principios de funcionamiento del sistema de archivos distribuido Hadoop (HDFS por su sigla en inglés).
  • Importar datos externos a HDFS.
  • Realizar consultas SQL con HIVE.
  • Usar PIG para procesar datos.
  • El principio de ETL (Talend...).
  • Gestión de streaming de datos masivo (NIFI, Kafka, Spark, Storm, etc.)
Ejercicio
Implementación de flujos de datos masivos.

Técnica y métodos de análisis de Big Data

  • El aprendizaje automático, un componente de la inteligencia artificial.
  • Descubrir las tres familias: Regresión, clasificación y agrupación.
  • Preparación de datos (preparación de datos, ingeniería de características).
  • Generar modelos en R o Python.
  • Aprendizaje por conjuntos.
  • Descubrir las herramientas disponibles en el mercado: Jupyter Notebook, Dataïku, Amazon Machine Learning, etc.
Ejercicio
Realización de análisis con una de las herramientas estudiadas.

Visualización de datos y casos de uso concretos

  • Definir la necesidad de la visualización de datos.
  • Análisis y visualización de datos.
  • ¿Pueden utilizarse todos los tipos de datos en DataViz?
  • Las herramientas DataViz del mercado.
Ejercicio
Instalación y utilización de una herramienta de visualización de datos para crear análisis dinámicos.

Conclusión

  • Lo que hay que recordar.
  • Síntesis de buenas prácticas.
  • Bibliografía.


Modalidades prácticas
Ejercicio
Configurar una plataforma Hadoop y sus componentes básicos, utilizar un ETL para gestionar los datos, crear modelos de análisis y cuadros de control.

Fechas y lugares
Selecciona tu ubicación u opta por la clase remota y luego elige tu fecha.
Clase a distancia