Programa del Curso
Sección 1: Data Management en HDFS
- Diversos Formatos de Datos (JSON / Avro / Parquet)
- Estrategias de Compresión
- Masqueo de Datos
- Laboratorios: Análisis de diferentes formatos de datos; habilitando compresión
Sección 2: Pig Avanzado
- Funciones Definidas por el Usuario
- Introducción a las Bibliotecas de Pig (ElephantBird / Data-Fu)
- Carga de Datos Estructurados Complejos usando Pig
- Ajuste de Pig
- Laboratorios: scripting avanzado en Pig, análisis de tipos de datos complejos
Sección 3 : Avanzado Hive
- Funciones Definidas por el Usuario
- Tablas Comprimidas
- Ajuste de Rendimiento en Hive
- Laboratorios: creación de tablas comprimidas, evaluación de formatos y configuraciones de tabla
Sección 4 : HBase Avanzado
- Diseño de Esquemas Avanzados
- Compresión
- Ingesta Masiva de Datos
- Comparación de Tablas Anchas y Altas
- HBase y Pig
- HBase y Hive
- Ajuste de Rendimiento en HBase
- Laboratorios: ajuste de HBase; acceso a datos de HBase desde Pig & Hive; Uso de Phoenix para modelado de datos
Requerimientos
- familiaridad con el lenguaje de programación Java (la mayoría de los ejercicios de programación están en Java)
- comodidad en un entorno Linux (debe ser capaz de navegar por la línea de comandos de Linux, editar archivos usando vi / nano)
- conocimiento práctico de Hadoop.
Entorno de laboratorio
Instalación cero: No es necesario instalar software de Hadoop en las máquinas de los estudiantes. Se proporcionará un clúster de Hadoop funcional para los estudiantes.
Los estudiantes necesitarán lo siguiente
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Durante los ejercicios, James me explicó cada paso en detalle donde me estaba atascando. Yo era completamente nuevo en NIFI. Él explicó el propósito real de NIFI, incluso conceptos básicos como ser código abierto. Cubrió todos los conceptos de Nifi, desde nivel principiante hasta nivel desarrollador.
Firdous Hashim Ali - MOD A BLOCK
Curso - Apache NiFi for Administrators
Traducción Automática
Preparación y organización del formador, y calidad de los materiales proporcionados en GitHub.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
Traducción Automática
Que lo tuviera en primer lugar.
Peter Scales - CACI Ltd
Curso - Apache NiFi for Developers
Traducción Automática
cosas prácticas de hacer, también teoría fue bien servida por Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Traducción Automática