¿Cuáles son algunos problemas de investigación en las redes adversas generativas?

Solo he leído algunos documentos relacionados con las GAN, así que tome lo que digo con un granito de arena. Aquí hay algunos problemas en los que la gente está trabajando:

  • Super resolución de imagen. Usando GAN para cambiar el tamaño de una imagen a una resolución más grande con detalles más nítidos. El resultado debería ser al menos mejor que la interpolación bicúbica.
  • Traducción de imagen a imagen:

    • Dada una imagen de satélite, conviértala en un mapa y viceversa. Muy útil para ciudades de nueva construcción.
    • Dada una imagen de contorno / boceto, conviértala en un diseño real. Se puede aplicar para crear conceptos rápidos en películas, juegos, etc.
  • Generación de sonido. Cosas como canciones o discursos específicos de género.
  • Generar imágenes de texto:

  • Generar texto Actualmente, el resultado es mixto porque la propia GAN no puede generar salidas discretas. VAE puede sin embargo. Algunas personas intentaron usar el aprendizaje de refuerzo GAN + para generar una secuencia de texto llamada SeqGAN, pero creo que el resultado no es realmente innovador.
  • Usando GAN para afinar tu entrenamiento. GAN puede generar muestras bien hechas y siempre se pueden alimentar a un clasificador para entrenamiento.

Los anteriores son problemas en los que puede usar GAN para producir resultados empíricos visibles. Para problemas en un aspecto más teórico, recientemente se publicó un documento llamado Wasserstein GAN, que presenta una nueva función objetivo para una mejor capacitación en GAN. Si lo desea, siempre puede seguir esa ruta, pero creo que es mucho más riguroso.