Keep it Simple: Neuer Ansatz zur Bildeditierung vorgestellt

23 Juli 2022

Mit Hilfe von semantischer Bildverarbeitung können Benutzer ganze Bildattribute mit nur wenigen Klicks gezielt verändern. In den meisten Ansätzen wird für diese Aufgabe ein Generative Adversarial Network (GAN) verwendet, um die korrekte Darstellung im Raum und die attributspezifischen Transformationen zu lernen.

Während bisherige Ansätze häufig Probleme mit verschränkten Attributmanipulationen haben, wird dieses Problem bei neueren Ansätzen durch den Einsatz separater spezialisierter Netzwerke für die Attributextraktion behoben. Eine Möglichkeit, verschränkungsarme Attributvektoren zu finden, bieten iterative Optimierungsalgorithmen auf Basis von Backpropagation. Dies erfordert jedoch neben einer erheblichen GPU-Rechenleistung auch die Differenzierbarkeit der verwendeten Modelle. Als weiterer Nachteil können Instabilitäten beim Training auftreten.

Um diese Problematik zu lösen, schlagen Andreas Meißner, Andreas Fröhlich und Michaela Geierhos einen Ansatz vor, der für die Editierung des latenten Raums auf eine lokale Suche setzt. In ihrem Paper "Keep it Simple: Local Search-based Latent Space Editing"  können sie zeigen, dass dieser Ansatz die gleiche Leistung wie herkömmliche Algorithmen erbringt und dabei gleichzeitig die oben genannten Nachteile vermeidet. Der Beitrag wurde nun bei der 14th International Conference on Neural Computation Theory and Applications (NCTA 2022) angenommen, wo die Ergebnisse Ende Oktober in Valletta, Malta vorgestellt werden.

Weitere Informationen zur NCTA: https://ncta.scitevents.org/Home.aspx


Bildquelle: AdobeStock/supakritleela/icons gate/Andrii Symonenko/vectorsanta/Daniel Berkmann

 

< Zur Newsübersicht