Warum die Wahrung der Privatsphäre synthetischer Daten ein Schlüsselinstrument für Unternehmen ist

Treffen Sie sich vom 11. bis 12. Juli mit Top-Führungskräften in San Francisco, um zu erfahren, wie Führungskräfte KI-Investitionen für den Erfolg integrieren und optimieren. Erfahren Sie mehr


Die greifbare Welt, in die wir hineingeboren wurden, wird immer mehr mit der von uns geschaffenen digitalen Welt homogenisiert. Vorbei sind die Zeiten, in denen Ihre sensibelsten Informationen, wie Ihre Sozialversicherungsnummer oder Bankkontodaten, lediglich in einem Safe in Ihrem Schlafzimmerschrank eingeschlossen waren. Nun können private Daten angreifbar werden, wenn sie nicht richtig gepflegt werden.

Dies ist das Problem, mit dem wir heute in der Landschaft konfrontiert sind, die von Karriere-Hackern bevölkert ist, deren Vollzeitjobs sich in Ihre Datenströme einklinken und Ihre Identität, Ihr Geld oder Ihre geschützten Informationen stehlen.

Obwohl uns die Digitalisierung große Fortschritte gebracht hat, bringt sie auch neue Probleme in Bezug auf Datenschutz und Sicherheit mit sich, selbst für Daten, die nicht ganz „echt“ sind.

Tatsächlich war das Aufkommen synthetischer Daten zur Information von KI-Prozessen und zur Rationalisierung von Arbeitsabläufen in vielen Branchen ein großer Sprung. Aber synthetische Daten sind, ähnlich wie echte Daten, nicht so verallgemeinert, wie Sie vielleicht denken.

Fall

Transformation 2023

Besuchen Sie uns vom 11. bis 12. Juli in San Francisco, wo Top-Führungskräfte berichten, wie sie KI-Investitionen für den Erfolg integriert und optimiert und häufige Fallstricke vermieden haben.

Jetzt registrieren

Was sind synthetische Daten und warum sind sie nützlich?

Synthetische Daten bestehen, wie es sich anhört, aus Informationen, die durch Muster echter Daten erzeugt werden. Es ist eine statistische Vorhersage aus realen Daten, die massenhaft generiert werden können. Seine Hauptanwendung besteht darin, KI-Technologien zu informieren, damit sie ihre Funktionen effizienter ausführen können.

Lesen Sie auch  Die Schwester von Honey Boo Boo, Anna „Chickadee“ Cardwell, stirbt im Alter von 29 Jahren – National

Wie jedes Muster kann KI reale Ereignisse erkennen und Daten basierend auf historischen Daten generieren. Die Fibonacci-Folge ist ein klassisches mathematisches Muster, bei dem jede Zahl in der Folge die beiden vorherigen Zahlen in der Folge addiert, um die nächste Zahl abzuleiten. Wenn ich Ihnen zum Beispiel die Folge „1,1,2,3,5,8“ gebe, könnte ein trainierter Algorithmus die nächsten Zahlen in der Folge anhand der von mir eingestellten Parameter intuitiv erkennen.

Dies ist effektiv ein vereinfachtes und abstraktes Beispiel für synthetische Daten. Wenn der Parameter lautet, dass jede folgende Zahl gleich der Summe der beiden vorherigen Zahlen sein muss, dann sollte der Algorithmus „13, 21, 34“ usw. ausgeben. Der letzte Zahlensatz sind die synthetischen Daten, die von der KI abgeleitet werden.

Unternehmen können begrenzte, aber aussagekräftige Daten über ihr Publikum und ihre Kunden sammeln und ihre eigenen Parameter festlegen, um synthetische Daten zu erstellen. Diese Daten können alle KI-gesteuerten Geschäftsaktivitäten informieren, z. B. die Verbesserung der Vertriebstechnologie und die Steigerung der Zufriedenheit mit den Anforderungen an Produktfunktionen. Es kann Ingenieuren sogar dabei helfen, zukünftige Fehler bei Maschinen oder Programmen vorherzusehen.

Es gibt unzählige Anwendungen für synthetische Daten, und sie können oft nützlicher sein als die echten Daten, aus denen sie stammen.

Wenn es sich um gefälschte Daten handelt, müssen sie sicher sein, oder?

Nicht ganz. So geschickt synthetische Daten auch erstellt werden, sie können genauso leicht rückentwickelt werden, um personenbezogene Daten aus den realen Proben zu extrahieren, die zu ihrer Erstellung verwendet wurden. Dies kann leider zum Türsteher werden, den Hacker brauchen, um die persönlichen Informationen von Benutzerproben zu finden, zu manipulieren und zu sammeln.

Hier kommt das Problem der Sicherung synthetischer Daten ins Spiel, insbesondere für in der Cloud gespeicherte Daten.

Mit Cloud Computing sind viele Risiken verbunden, die alle eine Bedrohung für die Daten darstellen können, aus denen ein synthetisierter Datensatz stammt. Wenn eine API manipuliert wird oder durch menschliches Versagen Daten verloren gehen, können alle sensiblen Informationen, die aus den synthetisierten Daten stammen, gestohlen oder von einem Angreifer missbraucht werden. Der Schutz Ihrer Speichersysteme ist von größter Bedeutung, um nicht nur proprietäre Daten und Systeme, sondern auch die darin enthaltenen personenbezogenen Daten zu bewahren.

Lesen Sie auch  Die lustigsten/aufschlussreichsten Kommentare der Woche bei Techdirt

Die wichtige Beobachtung ist, dass selbst praktische Methoden zur Anonymisierung von Daten die Privatsphäre eines Benutzers nicht garantieren. Es besteht immer die Möglichkeit einer Lücke oder eines unvorhergesehenen Lochs, durch das Hacker auf diese Informationen zugreifen können.

Praktische Schritte zur Verbesserung des Datenschutzes bei synthetischen Daten

Viele Datenquellen, die Unternehmen verwenden, können identifizierende personenbezogene Daten enthalten, die die Privatsphäre der Benutzer gefährden könnten. Aus diesem Grund sollten Datennutzer Strukturen implementieren, um personenbezogene Daten aus ihren Datensätzen zu entfernen, da dies das Risiko verringert, sensible Daten bösartigen Hackern preiszugeben.

Differenzierte Datensätze sind eine Methode, um echte Daten von Benutzern zu sammeln und sie mit „Rauschen“ zu vernetzen, um anonyme synthetisierte Daten zu erstellen. Diese Interaktion übernimmt die realen Daten und erstellt Interaktionen, die der ursprünglichen Eingabe ähneln, sich aber letztendlich von ihr unterscheiden. Das Ziel ist es, neue Daten zu erstellen, die der Eingabe ähneln, ohne den Besitzer der echten Daten zu gefährden.

Sie können synthetische Daten durch ordnungsgemäße Sicherheitspflege von Unternehmensdokumenten und -konten weiter sichern. Die Verwendung eines Passwortschutzes für PDFs kann verhindern, dass unbefugte Benutzer auf die darin enthaltenen privaten Daten oder vertraulichen Informationen zugreifen. Darüber hinaus können Unternehmenskonten und Cloud-Datenbanken mit einer Zwei-Faktor-Authentifizierung gesichert werden, um das Risiko eines missbräuchlichen Zugriffs auf Daten zu minimieren. Diese Schritte mögen einfach sein, aber sie sind wichtige Best Practices, die einen großen Beitrag zum Schutz aller Arten von Daten leisten können.

Alles zusammenfügen

Synthetische Daten können ein unglaublich nützliches Werkzeug sein, um Datenanalysten und KI dabei zu helfen, fundierte Entscheidungen zu treffen. Es kann Lücken schließen und helfen, zukünftige Ergebnisse vorherzusagen, wenn es von Anfang an richtig konfiguriert ist.

Lesen Sie auch  George Galloway wird vor dem Parlament vereidigt – bevor er Israel sofort mit den Nazis vergleicht: Der neue Abgeordnete von Rochdale beschuldigt Netanyahu des „Holocaust“ in Gaza, nennt Hamas eine „legitime Regierung“ und sagt, dass es bei der „nächsten Wahl um Muslime gehen wird“.

Es erfordert jedoch ein wenig Fingerspitzengefühl, um echte persönliche Daten nicht zu kompromittieren. Die schmerzhafte Realität ist, dass viele Unternehmen bereits viele Vorsichtsmaßnahmen missachten und private Daten eifrig an Drittanbieter verkaufen, von denen einige von böswilligen Akteuren kompromittiert werden könnten.

Aus diesem Grund sollten Geschäftsinhaber, die vorhaben, synthetisierte Daten zu entwickeln und zu nutzen, die richtigen Grenzen festlegen, um private Benutzerdaten im Voraus zu sichern, um das Risiko des Verlusts sensibler Daten zu minimieren.

Berücksichtigen Sie die Risiken, die mit der Synthese Ihrer Daten verbunden sind, um so ethisch wie möglich zu bleiben, wenn Sie private Benutzerdaten berücksichtigen und ihr scheinbar grenzenloses Potenzial maximieren.

Charlie Fletcher ist ein freiberuflicher Autor, der sich mit Technik und Wirtschaft befasst.

DatenEntscheider

Willkommen in der VentureBeat-Community!

DataDecisionMakers ist der Ort, an dem Experten, einschließlich der technischen Mitarbeiter, die mit Daten arbeiten, datenbezogene Erkenntnisse und Innovationen austauschen können.

Wenn Sie über innovative Ideen und aktuelle Informationen, Best Practices und die Zukunft von Daten und Datentechnologie lesen möchten, besuchen Sie uns bei DataDecisionMakers.

Vielleicht denken Sie sogar darüber nach, einen eigenen Artikel beizusteuern!

Lesen Sie mehr von DataDecisionMakers

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.