logo móvil
Contáctanos

Revisión sobre redes generativas adversarias: enfocándose en visión por computadora y sus aplicaciones

Autores: Park, Sung-Wook; Ko, Jae-Sub; Huh, Jun-Ho; Kim, Jong-Chan

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo
GAN
Modelado generativo
Aprendizaje automático
BERT
GPT-3

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
La aparición del modelo de aprendizaje profundo GAN (Redes Generativas Adversarias) es un punto de inflexión importante en la modelización generativa. GAN es más potente en el aprendizaje de características y expresiones en comparación con los algoritmos de modelos generativos basados en aprendizaje automático. Hoy en día, también se utiliza para generar datos no de imágenes, como voz y lenguaje natural. Las tecnologías típicas incluyen BERT (Representaciones de Codificador Bidireccional de Transformadores), GPT-3 (Generative Pretrained Transformer-3) y MuseNet. GAN difiere del modelo generativo basado en aprendizaje automático y la función objetivo. El entrenamiento se realiza mediante dos redes: el generador y el discriminador. El generador convierte ruido aleatorio en una imagen realista, mientras que el discriminador distingue si la imagen de entrada es real o sintética. A medida que avanza el entrenamiento, el generador aprende técnicas de síntesis más sofisticadas, y el discriminador se convierte en un diferenciador más preciso. GAN tiene problemas, como el colapso del modo, la inestabilidad del entrenamiento y la falta de una matriz de evaluación, y muchos investigadores han intentado resolver estos problemas. Por ejemplo, se han propuesto soluciones como el suavizado de etiquetas unilaterales, la normalización de instancias y la discriminación de minibatches. El campo de aplicación también se ha expandido. Este trabajo proporciona una visión general de GAN y soluciones de aplicación para investigadores del campo de la visión por computadora e inteligencia artificial en el ámbito de la salud. Se analizaron la estructura y el principio de funcionamiento de GAN, los modelos centrales de GAN propuestos hasta la fecha y la teoría de GAN. A continuación, se presentaron ejemplos de aplicación de GAN como clasificación e regresión de imágenes, síntesis e inpainting de imágenes, traducción de imagen a imagen, superresolución y registro de puntos. La discusión abordó los problemas y soluciones de GAN, y finalmente se propuso la dirección de investigación futura.

Otros recursos que podrían interesarte

    Temas Virtualpro