Programa del Curso

Introducción

  • Descripción general de Databricks y Apache Spark
  • Comprensión de la arquitectura Databricks

Empezar

  • Configuración del entorno
  • Instalación y configuración Databricks
  • Navegación por la interfaz de usuario Databricks
  • Creación de un Databricks espacio de trabajo

Trabajar con datos en Databricks

  • Conexión a una fuente de datos Apache Spark
  • Descripción de los conceptos básicos, las columnas y los tipos de datos
  • Administración del sistema de archivos en blocs de notas

Administración de trabajos y clústeres

  • Creación y configuración de clústeres
  • Creación de trabajos con Notebook
  • Trabajos en ejecución
  • Visualización de trabajos y detalles de trabajos

Uso de Delta Lake en Databricks

  • Carga de datos en Delta Lake
  • Administración de datos en Delta Lake

Aseguramiento Databricks

  • Gestión de Databricks la seguridad
  • Gestión de copias de seguridad y recuperación

Solución de problemas

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de análisis de datos
  • Conocimiento de Apache Spark

Audiencia

  • Ingenieros de datos
  • Científicos de datos
  • Desarrolladores
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas