Revisión sobre redes generativas adversarias: enfocándose en visión por computadora y sus aplicaciones

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Revisión sobre redes generativas adversarias: enfocándose en visión por computadora y sus aplicaciones

Autores: Park, Sung-Wook; Ko, Jae-Sub; Huh, Jun-Ho; Kim, Jong-Chan

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Revisión sobre redes generativas adversarias: enfocándose en visión por computadora y sus aplicaciones

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo

GAN

Modelado generativo

Aprendizaje automático

BERT

GPT-3

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones

La aparición del modelo de aprendizaje profundo GAN (Redes Generativas Adversarias) es un punto de inflexión importante en la modelización generativa. GAN es más potente en el aprendizaje de características y expresiones en comparación con los algoritmos de modelos generativos basados en aprendizaje automático. Hoy en día, también se utiliza para generar datos no de imágenes, como voz y lenguaje natural. Las tecnologías típicas incluyen BERT (Representaciones de Codificador Bidireccional de Transformadores), GPT-3 (Generative Pretrained Transformer-3) y MuseNet. GAN difiere del modelo generativo basado en aprendizaje automático y la función objetivo. El entrenamiento se realiza mediante dos redes: el generador y el discriminador. El generador convierte ruido aleatorio en una imagen realista, mientras que el discriminador distingue si la imagen de entrada es real o sintética. A medida que avanza el entrenamiento, el generador aprende técnicas de síntesis más sofisticadas, y el discriminador se convierte en un diferenciador más preciso. GAN tiene problemas, como el colapso del modo, la inestabilidad del entrenamiento y la falta de una matriz de evaluación, y muchos investigadores han intentado resolver estos problemas. Por ejemplo, se han propuesto soluciones como el suavizado de etiquetas unilaterales, la normalización de instancias y la discriminación de minibatches. El campo de aplicación también se ha expandido. Este trabajo proporciona una visión general de GAN y soluciones de aplicación para investigadores del campo de la visión por computadora e inteligencia artificial en el ámbito de la salud. Se analizaron la estructura y el principio de funcionamiento de GAN, los modelos centrales de GAN propuestos hasta la fecha y la teoría de GAN. A continuación, se presentaron ejemplos de aplicación de GAN como clasificación e regresión de imágenes, síntesis e inpainting de imágenes, traducción de imagen a imagen, superresolución y registro de puntos. La discusión abordó los problemas y soluciones de GAN, y finalmente se propuso la dirección de investigación futura.

Descripción

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro