Legal and Data Protection Officer
1. Wie wird KI eingesetzt?
KI-Modelle werden bei Yokoy eingesetzt, um Prozesse im Ausgabenmanagement zu vereinfachen und zu verbessern. Derzeit umfasst dies in erster Linie den Einreichungsprozess, bei dem KI verwendet wird, um automatisch Informationen aus dem Beleg und der Rechnung zu extrahieren und das Einreichungsformular „automatisch auszufüllen“, aber dies kann in naher Zukunft auch auf andere Prozesse ausgeweitet werden.
2. Welche Daten werden von der KI extrahiert?
Im Zusammenhang mit dem „automatischen Ausfüllen“ des Spesenformulars (die folgenden Grundsätze gelten auch für andere Bereiche) werden die KI-Modelle ausschließlich dazu verwendet, objektive Informationen aus Dokumenten zu extrahieren (z. B. für Spesen das Land, die Währung, den Gesamtbetrag, Steuerposten und mehr) und nicht, um persönliche Informationen über den App-Nutzer zu extrahieren oder zu sammeln.
3. Die KI von Yokoy trifft keine Entscheidungen oder Beurteilungen über den Benutzer
Die KI-Modelle treffen keine sensiblen Entscheidungen oder Urteile über App-Nutzer. Sollte Yokoy zu irgendeinem Zeitpunkt in der Zukunft beschließen, KI-Modelle hinzuzufügen, die in irgendeiner Form das Nutzerverhalten beurteilen oder personenbezogene Daten bei der Entwicklung der KI-Modelle verwenden, würde die Aktivierung dieser Modelle nur mit der ausdrücklichen und protokollierten Zustimmung unserer Kunden erfolgen.
4. Kein KI-Training mit personenbezogenen Daten
Der Begriff „Training eines KI-Modells“ bezieht sich auf den Prozess, bei dem einem KI-Modell eine Reihe historischer Eingaben und Ausgaben zur Verfügung gestellt werden, so dass das Modell seine eigene Logik und eine Reihe von Regeln ableiten kann, um die wahrscheinlichste Ausgabe mit einer gegebenen zukünftigen Eingabe zu verknüpfen.
Bei Yokoy erhalten die KI-Modelle niemals persönliche Daten des App-Nutzers als Input und werden auch nicht auf persönlichen Daten trainiert. Dies wird durch einen Vorverarbeitungsschritt vor der Anwendung der KI-Modelle erreicht, der die digitalisierten Bilder (die in bestimmten Situationen personenbezogene Daten enthalten können) in rein technische Merkmale umwandelt, die völlig anonym sind. Die KI-Modelle werden trainiert und machen Vorhersagen nur auf der Grundlage dieser anonymen Daten / technischen Merkmale. Die Informationen über den Einreicher der Ausgaben werden den KI-Modellen nur als Benutzerkennung (ein zufällig gewählter Text) zur Verfügung gestellt, um die Genauigkeit der Extraktion bestimmter Felder auf der Grundlage zuvor hochgeladener und eingereichter Dokumente zu verbessern.
5. Informationen über die Logik der KI
Es gibt zwei Arten von Modellen: „reine“ KI-Modelle und heuristische Modelle.
Während die heuristischen Modelle auf menschlicher/geschäftlicher Logik beruhen (z. B. zur Erkennung des Datums oder der Uhrzeit) und für den Menschen „leicht“ zu verstehen sind, ist die interne Logik der „reinen“ KI-Modelle für den Menschen nicht leicht zu verstehen, weshalb sie oft als „Black Boxes“ bezeichnet werden. Um die Vertrauenswürdigkeit der reinen KI-Modelle zu gewährleisten, wird jedes Modell einem umfangreichen Backtesting unterzogen, d. h. es wird anhand historischer Daten und in manuellen Tests getestet, bevor es in Betrieb geht. Regelmäßige Rekalibrierungen und Überwachungen der KI-Modelle stellen sicher, dass die KI-Modelle aktuell und voll funktionsfähig sind. Die Ursachenanalyse fehlerhafter Modellvorhersagen im Rahmen regelmäßiger Modellüberprüfungen wird genutzt, um das Bewusstsein für die Grenzen des Modells zu schärfen und die Leistung des Modells zu verbessern.
6. Schlussfolgerung
In Anbetracht des Zwecks (Extraktion objektiver Dokumenteninformationen) und der Konzeption (kein Zugriff auf personenbezogene Daten) der verwendeten KI-Modelle werden die oben beschriebenen Maßnahmen als ausreichend erachtet, um die Datenschutzanforderungen und -vorschriften zu erfüllen. Die rechtlichen Entwicklungen in diesem Bereich werden genau beobachtet, und bei Bedarf werden Anpassungen vorgenommen.
Zuletzt aktualisiert am 19.1.2024