Programa del Curso

Introducción a Reinforcement Learning

  • ¿Qué es el aprendizaje por refuerzo?
  • Conceptos clave: agente, entorno, estados, acciones y recompensas
  • Desafíos en el aprendizaje por refuerzo

Exploración y Explotación

  • Equilibrio entre la exploración y la explotación en modelos de RL
  • Estrategias de exploración: épsilon-greedy, softmax y más

Q-Learning y Q-Networks profundas (DQN)

  • Introducción al Q-learning
  • Implementación de DQN mediante TensorFlow
  • Optimización del Q-learning con repetición de experiencias y redes de destino

Métodos basados en políticas

  • Algoritmos de gradiente de políticas
  • Algoritmo REINFORCEMENT y su implementación
  • Métodos actor-crítico

Trabajar con OpenAI Gimnasio

  • Configuración de entornos en OpenAI Gimnasio
  • Simulación de agentes en entornos dinámicos
  • Evaluación del rendimiento de los agentes

Técnicas avanzadas Reinforcement Learning

  • Aprendizaje por refuerzo multiagente
  • Gradiente de política determinista profundo (DDPG)
  • Optimización de políticas proximales (PPO)

Implementación de Reinforcement Learning modelos

  • Aplicaciones del aprendizaje por refuerzo en el mundo real
  • Integración de modelos RL en entornos de producción

Resumen y próximos pasos

Requerimientos

  • Experiencia con Python programación
  • Comprensión básica de los conceptos de aprendizaje profundo y aprendizaje automático
  • Conocimiento de algoritmos y conceptos matemáticos utilizados en el aprendizaje por refuerzo

Audiencia

  • Científicos de datos
  • Profesionales del aprendizaje automático
  • Investigadores de IA
 28 Horas

Número de participantes


Precio por Participante​

Testimonios (4)

Próximos cursos

Categorías Relacionadas