Künstliche Intelligenz kann Gesichter, Objekte und Schriftzeichen trotz Verpixelung und Weichzeichnung erkennen. Schon lange werden Bilddaten nicht mehr nur von menschlichen Augen verarbeitet. Eine Studie der Universität Cornell zeigt, dass künstliche neuronale Netzwerke auf Bildern mehr erkennen können als Menschen.
Wissenschaftler untersuchten verschiedene Verpixelungsmethoden – Verpixelung, Weichzeichnung und die P3-Methode – und testeten diese an unterschiedlichen Datenbanken.
Wie funktionieren Weichzeichnen und Verpixelung?
Wird ein Teil eines Bildes verpixelt, wird der Bildausschnitt in kleine Quadrate unterteilt. Die Durchschnittsfarbe der jeweiligen Quadrate wird ermittelt und die Quadrate eingefärbt.
Weichzeichnung wird verwendet, um Teile eines Bildes oder Text mithilfe eines Filters zu trüben und somit unkenntlich zu machen.
Die Privacy Preserving Photo Sharing Methode (P3) teilt jedes Bild in ein öffentliches und ein geheimes Bild. Das öffentliche Bild enthält keine sensiblen Informationen mehr und kann zum Beispiel auf Social-Media-Plattformen hochgeladen werden. Das geheime Bild, welches die sensiblen Informationen enhält, wird verschlüsselt und z. B. auf den Server eines Online-Speicherplatzanbieters hochgeladen. Besitzt man beide Bildteile, kann man diese einfach zum Original zusammensetzen. Über einen Grenzwert kann der Nutzer selbst bestimmen, welche Menge an Informationen aus dem Originalbild entfernt wird.
Auch die automatische Weichzeichnungsmethode von Youtube wurde getestet. Das Unternehmen bietet seit 2012 die Möglichkeit, automatisch alle Gesichter in einem Video unkenntlich zu machen. Damit sollte die Privatsphäre für Videos verbessert werden um beispielsweise Material von Protesten und Demonstrationen veröffentlichen zu können, ohne die Identität der Aktivisten preiszugeben.
Im alltäglichen Gebrauch, zur Unkenntlichmachung von sensiblen Daten auf Bildern und in Videos, erfüllen diese Methoden sicherlich ihren Zweck. Wenn überhaupt sind noch Umrisse eines Nummernschildes oder Gesichtes zu sehen. Das Lesen des Kennzeichens oder die Identifizierung einer Person sind unmöglich, zumindest ohne maschinelle Hilfe.
Für ihre Studie nutzen die Wissenschaftler vier verschiedene Datenbanken:
- MINST eine Sammelung handgeschriebener Zahlen,
- CIFAR-10 eine Sammlung verschiedener Tiere und Fahrzeuge,
- AT&T eine Sammlung von Gesichtern,
- FaceScrub eine Sammelung von Gesichtern von Prominenten

aus: https://arxiv.org/abs/1609.00408
Diese unbearbeiteten Bilder ließen sie künstliche neuronale Netzwerke lernen. Danach wendeten sie die genannten Methoden an, um Informationen aus den Bildern zu entfernen. Dann wurden die bearbeiteten Bilder in die künstlichen neuronalen Nezwerke eingespeist und mit den Originalbildern abgeglichen.
Maschinen sehen, was den Augen verborgen bleibt
Im Fall von Youtubes Weichzeichnungsmethode erkannte das künstliche neuronale Netzwerk die Identität der gezeigten Personen mit 57 Prozent Wahrscheinlichkeit richtig. Auch Verpixelung und P3 schnitten beim Verschleiern von Bildern eher schlecht ab. Bilder, die mit der P3-Methode unkenntlich gemacht worden waren wurden mit bis zu 95 Prozent Wahrscheinlichkeit richtig erkannt und verpixelte Bilder aus der AT&T‑Datenbank sogar mit 98 Prozent Wahrscheinlichkeit.
Anhand der Erfolgsquoten bei der richtigen Zuordnung durch die Netzwerke wird deutlich, dass die jetzigen Methoden nicht ausreichen, um sensible Informationen auch für künstliche Intelligenz unsichtbar zu machen. Jedoch muss die künstliche Intelligenz immer noch das Originalbild kennen, ein „Zurückrechnen“ der Verpixelung ist nicht möglich.
