Keep it Simple: Veröffentlicht in der Zeitschrift SN Computer Science
21 Oktober 2023
Die semantische Bildverarbeitung ermöglicht die kontrollierte Veränderung ganzer Bildattribute mit wenigen Klicks. Die meisten Ansätze verwenden für diese Aufgabe ein sogenanntes Generative Adversarial Network (GAN), um eine geeignete latente Raumrepräsentation und attributspezifische Transformationen zu erlernen. Die Verschachtelung von Attributen war ein limitierender Faktor für frühere Ansätze zur Attributmanipulation. Neuere Ansätze haben jedoch in dieser Hinsicht erhebliche Verbesserungen erzielt, indem sie separate Netzwerke für die Attributextraktion verwenden. Iterative Optimierungsalgorithmen basierend auf Backpropagation können verwendet werden, um Attributvektoren mit minimaler Verschränkung zu finden, aber diese benötigen große Mengen an GPU-Speicher, können zu Trainingsinstabilität führen und erfordern differenzierbare Modelle. Um diese Probleme zu umgehen, stellen Andreas Meißner und Andreas Fröhlich von der Zentralstelle für Informationstechnik im Sicherheitsbereich (ZITiS) zusammen mit Michaela Geierhos (Universität der Bundeswehr München) einen auf lokaler Suche basierenden Ansatz zur Verarbeitung des latenten Raums vor, der eine vergleichbare Performance wie bestehende Algorithmen erreicht und gleichzeitig die oben genannten Nachteile vermeidet. Darüber hinaus führen sie eine neue Bewertungsmetrik ein, die einfacher zu interpretieren ist als bestehende Metriken.
SN Computer Science ist eine breit gefächerte, peer-reviewed Zeitschrift, die Originalarbeiten aus allen Bereichen der Informatik, einschließlich verschiedener interdisziplinärer Aspekte, veröffentlicht.
Mehr zu diesem Beitrag: https://doi.org/10.1007/s42979-023-02272-4
Bildquelle: AdobeStock/supakritleela/icons gate/Andrii Symonenko/vectorsanta/Daniel Berkmann