Fotografie & Bildbearbeitung

Fotos verlustfrei vergrößern – mit KI von 1,2 auf 19,4 Megapixel!

Um es ein für alle mal zu sagen: Fotos können theoretisch nicht verlusftfrei vergrößert werden - Informationen die nicht da sind, sind nicht da. Punkt. Aaaaber: Bilder können praktisch sehr wohl vergrößert werden, ohne, dass man es sieht. Was Ihr nicht könnt: Ein Foto von einem weit entferntem Auto NCIS-mäßig vergrößern, um das Nummernschild zu erkennen - die Infos sind einfach nicht vorhanden. Was Ihr sehr wohl könnt: Ein zehn Jahre altes Portrait im "winzigen" 2-Megapixel-Format auf sagen wir 32 Megapixel vergrößern - ohne sichtbare Effekte. Nun, wenn Ihr genug zoomt ...

Gestern vs. Heute

Es gab schon immer Tools, die das Blaue vom Himmel versprochen haben und beispielsweise JPGs um das Zehnfache vergrößern wollten - ohne (ernsthafte) Verluste. Die Ergebnisse waren meist verrauschte Dinge, die kaum anders aussahen, als hätte man schlicht zehn mal auf die Zoom-Taste gedrückt. Dann gibt es noch die manuelle Skalierung über Vektoren: Das ist wirklich verlustfrei - für Zeichnungen und dergleichen. Bei Fotos funktioniert das gar nicht.

Heute werden derlei Dinge via künstlicher Intelligenz gelöst - die Schlagwörter KI, AI und neuronales Netz werdet Ihr immer wieder dazu lesen. Wenn Mathematiker, Informatiker und AI-Hobbyisten mal kurz weghören: Im Grunde heißt KI doch nur, dass Daten statistisch ausgewertet werden. Bei Bildern heißt das zum Beispiel: Im so genannten Training füttert man einen Algorithmus/ein Programm mit ein paar Tausend guten (!) Bildern, sagen wir mal von Burgern, Food Porn geht immer. Das Programm guckt sich dann an, welche Eigenschaften so typische Burger-Bilder haben, speichert sie und kann diese Daten dann auf ein neu eingespeistes Bild anwenden, um zum Beispiel überhaupt einen Burger zu erkennen oder die Eigenschaften anzupassen. Man kann noch so viel Blabla drum herum packen, am Ende bleibt es simple Statistik; nur, dass sich die Algorithmen mehr oder weniger selbst mit Daten versorgen und neue Zusammenhänge finden und berücksichtigen können. Aber klar, im Detail ist das alles wahnwitzig komplex.

Bilder skalieren

In der Praxis könnt Ihr zum Beispiel den Dienst bigjpg verwenden: Ihr ladet einfach ein Bild hoch und bestimmt, ob es zwei- oder verfach vergrößert werden soll, legt das Maß der Rauschreduzierung fest und wartet - je nach Auslastung und Bildgröße kann es mal ein paar Minuten dauern oder gar abbrechen. Die Gratisversion ist auf Bilder bis 3000x3000 Pixel und maximal vierfache Skalierung begrenzt. Das Ganze basiert auf dem Open-Source-Werkzeug waifu2x, das vor allem zum Vergrößern von Anime-Bildern gedacht ist. Auf dessen Github-Seite könnt Ihr Euch den Quellcode anschauen, um zu sehen, wie das Teil im Detail funktioniert. Nun, Ihr könnt, wenn Ihr könnt ...

bigjpg
Die Optionen der Gratisversion - viel zu tun gibt es nicht.

Aber hey, vermutlich interessiert Euch das alles nicht die Bohne, Ihr wollt eher wissen: Wie gut funktioniert das? Nun, schaut selbst: Ausgangspunkt ist das linke Bild mit Nahrung und einer Größe von 1280x949 Pixeln, rechts daneben das vierfach vergrößerte und maximal entrauschte Ergebnis. Kleines Mimimi: Die Bilder werden von unserer Wordpress-Installation automatisch komprimiert, was in diesem Fall etwas ärgerlich ist - aber die Unterschiede in den Vorher-/Nachher-Bildern sollten nachvollziehbar bleiben. Skaliert wird hier von 1,2 auf 19,4 Megapixel.

bigjpg-beispielbilder
Links das Original, rechts die Vergrößerung - nix zu sehen, oder?
bigjpg-beispielbilder
Auch in dieser Zoomstufe ist kaum ein Unterschied zu erkennen.
bigjpg-beispielbilder
Achtet auf die weißen Stellen/die Reflexionen - hier lassen sich erste Unterschiede sehen.
bigjpg-beispielbilder
Hier wird es deutlich: Die weißen Stellen haben deutlich klarere Ränder.
bigjpg-beispielbilder
Hier sollte klar werden, wie das Prozedere arbeitet: Bereiche werden erkannt und dann glattgebügel.

Ihr könnt ganz gut erahnen, wie die Software funktioniert. Ganz klar seht Ihr das bei den Lichtreflexionen, also den kleinen weißen Bereichen auf dem Essen. Wenn Ihr nur weit genug rein zoomt erkennt Ihr, dass die Bereiche deutlich klarere Umrisse haben, fast so, als hätte man diese per Hand vektorisiert. Das sieht im großen Maßstab natürlich viel besser und schärfer aus, aber es ist eben ein Verlust. Stellt Euch mal Norwegens berühmte Küste vor, die auch für ihre theoretische unendliche Länge bekannt ist. Die ganzen kleinen Kanten, der ausgefranste Rand sind das eigentliche Markenzeichen. Würde man die Küste mit einem (rieeeeesigen ...) Laser gerade abschneiden, wäre das sogar ein enormer Verlust. Und das gilt auch für jede Franse, jede Kante, jedes Pixel eines Bilds.

Durch die Skalierung gehen Dinge verloren. Je nach Verwendung sieht man diese Details im skalierten Bild aber überhaupt nicht - und das Weglassen (quasi) nicht sichtbarer Details ermöglicht eben eine größere Darstellung, die für das menschliche Auge "verlustfrei" erscheint. Und genau darum funktioniert der Nummernschild-Vergrößerungs-Quatsch in Krimis nicht - diese Details sind nämlich eben gerade nicht quasi unsichtbar. Und mit ein wenig Nachschärfen ist es natürlich auch nicht getan, aus einem Nummernschild, das durch vielleicht nur 20 Pixel dargestellt wird, kann auch die beste KI nicht allzuviel ableiten. Aber hey, es sind Krimiserien mit TV-Prämissen: Nein, Abby kann sich nicht in 5 Minuten ins Pentagon hacken, und nein, McGee kann keine AES-256-Verschlüsselung an einem Nachmittag knacken. Oder innerhalb eines Lebens.

Aber KI-Skalierung ist real und ziemlich großartig!

Mehr zur Bildbearbeitung findet Ihr hier.

Mirco Lang

Freier Journalist, Exil-Sauerländer, (ziemlich alter) Skateboarder, Dipl.-Inf.-Wirt, Einzelhandelskaufmann, Open-Source-Nerd, Checkmk-Handbuchschreiber. Ex-Saturn'ler, Ex-Data-Becker'ler, Ex-BSI'ler. Computer-Erstkontakt: ca. 1982 - der C64 des großen Bruders eines Freunds. Wenn Ihr hier mehr über Open Source, Linux und Bastelkram lesen und Tutonaut unterstützen möchtet: Über Kaffeesponsoring via Paypal.freue ich mich immer. Schon mal im Voraus: Danke! Nicht verpassen: cli.help und VoltAmpereWatt.de. Neu: Mastodon

7 Kommentare

  1. Verlustfrei zu vergößern ist eigentlich keine Kunst, da beim Vergrößern keine Verluste auftreten. Was das Programm macht ist die vergrößerten Bilder zu verbesssern, so dass sie auch vergrößert noch gut aussehen (und in der ursprünglichen Größe dabei fast keine Änderungen zu sehen sind). Trotzdem coole Sache, danke für den Tipp!

  2. Kleine Korrektur: Das ist nur ML, nicht KI.

    Ändert natürlich nichts am Ergebnis :) Ich frage mich nur, ob sich das später bei der Ladezeit der Seite nicht rächen wird.

  3. Ganz spannend finde ich, dass die typischen JPEG-Artefakte praktisch total eliminiert werden. Links sind sie gut zu sehen, rechts sind sie weg. Allein dafür lohnt es sich schon, die Bilder hier durch laufen zu lassen.

    Danke für den Tip !

  4. Respekt. Ich bin erstaunt. Habe ein Bild einer Grafikkarte hochgeladen und mit der einfachen Lupenfunktion in der Vorschau gegen getestet. Klar, die Schrift konnte er nicht vergrößern, aber hat die KI wesentlich feinere Details an den Beinchen der Chips generiert. Klar, die Beinchen sind „ausgedacht“, aber sie werden hervorragend nachgebildet. Ebenso alle Rundungen und die Farbverläufe.

    Wie Du gesagt hast, wird das Bild nicht schärfer und bekommt auch nicht mehr Informationen oder Strukturen (außer der errechneten), aber man könnte so Bilder auf alten Webseiten wenigstens neu skalieren, sodass man bei einem zeitgemäßen Relaunch mit größeren Bildformaten wenigstens nicht das kalte Grauen bekommt.

    Danke für den Bericht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Schaltfläche "Zurück zum Anfang"