Formación : Big Data, métodos y soluciones prácticas para el análisis de datos

Big Data, métodos y soluciones prácticas para el análisis de datos




Este curso le permitirá comprender los retos y las aportaciones de los macrodatos o Big Data, así como las tecnologías para implementarlos. Aprenderá a integrar volúmenes masivos de datos estructurados y no estructurados a través de un ETL y a analizarlos con modelos estadísticos y cuadros de control dinámicos.


ABIERTA
IN-COMPANY
A MEDIDA

Formación en tus instalaciones, en nuestro centro o a distancia

Ref. BID
  5d - 35h00
Duración, formato, fechas y lugar: ¡Tú decides, nosotros nos encargamos de organizarlo!

Descargar en formato pdf

Compartir este curso por correo electrónico




Este curso le permitirá comprender los retos y las aportaciones de los macrodatos o Big Data, así como las tecnologías para implementarlos. Aprenderá a integrar volúmenes masivos de datos estructurados y no estructurados a través de un ETL y a analizarlos con modelos estadísticos y cuadros de control dinámicos.


Objetivos pedagógicos
Una vez finalizada la formación, el participante podrá:
Comprender los conceptos y la contribución de los Big Data a los problemas de la empresa
Comprender el ecosistema tecnológico necesario para llevar a cabo un proyecto de Big Data
Adquirir competencias técnicas para gestionar flujos masivos de datos complejos, no estructurados
Implementar modelos de análisis estadísticos para responder a las necesidades de la empresa
Comprender una herramienta de visualización de datos para reproducir análisis dinámicos

Público afectado
Minería de datos, investigadores estadísticos, desarrolladores, gestores de proyecto y consultores de inteligencia empresarial.

Requisitos previos
Conocimientos básicos de modelos relacionales, estadística y lenguajes de programación. Conocimientos básicos de los conceptos de la Inteligencia Empresarial (Business Intelligence).

Modalidades prácticas
Ejercicio
Configurar una plataforma Hadoop y sus componentes básicos, utilizar un ETL para gestionar los datos, crear modelos de análisis y cuadros de control.

Programa de la formación

1
Comprender los conceptos y los retos de los Big Data

  • Orígenes y definición de Big Data.
  • Las cifras clave del mercado en el mundo y en Francia.
  • Los retos de los Big Data: Rendimiento de la inversión, organización y confidencialidad de los datos.
  • Un ejemplo de arquitectura de Big Data.

2
Tecnologías de Big Data

  • Descripción de la arquitectura y componentes de la plataforma Hadoop.
  • Modos de almacenamiento (NoSQL, HDFS).
  • Principios de funcionamiento de MapReduce, Spark, Storm...
  • Principales distribuciones del mercado (Hortonworks, Cloudera, MapR, Elastic Map Reduce y Biginsights).
  • Instalar una plataforma Hadoop.
  • Las tecnologías del datascientist.
  • Presentación de tecnologías específicas para Big Data (Tableau, Talend, Qlikview, etc.).
Ejercicio
Instalación de una plataforma Big Data Hadoop (a través de Cloudera QuickStart u otra).

3
Gestionar datos estructurados y no estructurados

  • Principios de funcionamiento del sistema de archivos distribuido Hadoop (HDFS por su sigla en inglés).
  • Importar datos externos a HDFS.
  • Realizar consultas SQL con HIVE.
  • Usar PIG para procesar datos.
  • El principio de ETL (Talend...).
  • Gestión de streaming de datos masivo (NIFI, Kafka, Spark, Storm, etc.)
Ejercicio
Implementación de flujos de datos masivos.

4
Técnica y métodos de análisis de Big Data

  • El aprendizaje automático, un componente de la inteligencia artificial.
  • Descubrir las tres familias: Regresión, clasificación y agrupación.
  • Preparación de datos (preparación de datos, ingeniería de características).
  • Generar modelos en R o Python.
  • Aprendizaje por conjuntos.
  • Descubrir las herramientas disponibles en el mercado: Jupyter Notebook, Dataïku, Amazon Machine Learning, etc.
Ejercicio
Realización de análisis con una de las herramientas estudiadas.

5
Visualización de datos y casos de uso concretos

  • Definir la necesidad de la visualización de datos.
  • Análisis y visualización de datos.
  • ¿Pueden utilizarse todos los tipos de datos en DataViz?
  • Las herramientas DataViz del mercado.
Ejercicio
Instalación y utilización de una herramienta de visualización de datos para crear análisis dinámicos.

6
Conclusión

  • Lo que hay que recordar.
  • Síntesis de buenas prácticas.
  • Bibliografía.


Fechas y lugares
Selecciona tu ubicación u opta por la clase remota y luego elige tu fecha.
Clase a distancia