Angesichts immer komplexerer Datenvorschriften wird es immer wichtiger, wo die Daten herkommen, wohin sie gehen und wer sie verarbeitet. In vielen Teilen der Welt verlangen Datenschutzbestimmungen, dass die Daten in ihrer Ursprungsregion bleiben, es sei denn, externe Organisationen können die Einhaltung dieser lokalen Vorschriften nachweisen. Dieses Konzept wird als Datensouveränität bzw. Datenhoheit bezeichnet: der Gedanke, dass Daten den Gesetzen des Landes oder der Region unterliegen, in der sie verarbeitet werden.
Doch selbst wenn der Standort oder der Anbieter, an den die Daten übertragen werden, selbst konform ist, können grenzüberschreitende Datentransfers zu Verstößen führen. So sind Regierungsbehörden in einigen Ländern möglicherweise befugt, Daten zu überprüfen, die ihre Grenzen überschreiten, was gegen die Datenschutzbestimmungen anderer Länder verstoßen würde.
Unternehmen, die Daten ohne angemessenen Schutz aus ihrer Herkunftsregion heraus übertragen, müssen mit schwerwiegenden rechtlichen und finanziellen Konsequenzen rechnen. Zum Beispiel erhielt Meta 2023 eine Geldstrafe von 1,3 Mrd. US-Dollar für die Übermittlung personenbezogener Daten aus der EU in die USA, ohne dass die Privatsphäre der übermittelten Daten angemessen geschützt wurde.
Aus dem oben Gesagten ist das Konzept der Datenlokalisierung hervorgegangen: Um die Einhaltung von Datenvorschriften und das Vertrauen der Verbraucher zu gewährleisten, sind Unternehmen häufig gezwungen, Daten in ihrer eigenen Region zu speichern.
Die Idee der Datenlokalisierung besteht darin, dass Daten innerhalb eines bestimmten Landes oder einer bestimmten Region gespeichert werden, anstatt über Grenzen hinweg übertragen und auf Servern in abgelegenen Gebieten verarbeitet oder gespeichert zu werden. Allerdings macht dieser Ansatz das Cloud-Computing und die Nutzung von externen Diensten von Drittanbietern komplexer, da solche Dienste in der Regel nicht auf diese Weise lokalisiert sind. Cloud-Rechenzentren befinden sich auf der ganzen Welt, unabhängig davon, wo die von ihnen unterstützten Dienste angesiedelt sind.
Das bedeutet, dass die Notwendigkeit, Daten zu lokalisieren, für viele Unternehmen in Konflikt mit einem der wichtigsten heute verfügbaren Cloud-basierten Dienste geraten kann: künstliche Intelligenz (KI).
In den vergangenen Jahren hat eine Kombination aus leistungsfähigerer Hardware und zunehmend raffinierter Software zu einem explosionsartigen Anstieg der KI-Fähigkeiten geführt. Unternehmen integrieren KI in ihre Prozesse, um sie bei prädiktiver Modellierung, Ideenfindung für Inhalte, Recherche, Stimmungsanalyse und Automatisierung des Kundenservices zu unterstützen. Analystenfirmen wie McKinsey sind nach wie vor optimistisch, was die zunehmende Nutzung von generativer KI (GenAI) in der Wirtschaft angeht. Die meisten Unternehmen haben weder die Zeit noch die Ressourcen, um eigene KI-Modelle zu erstellen, und nutzen daher externe Anbieter, um diese Technologien zu nutzen.
Damit die KI funktioniert, sammelt sie jedoch Daten ein. KI-Modelle basieren auf großen Datensätzen, die zum Training komplexer Algorithmen verwendet werden. Große Datensätze können an einer Vielzahl von Orten gespeichert werden – was zumeist auch der Fall ist. Aufgrund der Skalierbarkeit werden die für KI genutzten Trainingsdaten jedoch fast immer in der Cloud in Rechenzentren auf der ganzen Welt gespeichert. (Aus den FAQs zu OpenAI-Verbraucherdiensten: „Der Inhalt wird auf den Systemen von OpenAI und unseren vertrauenswürdigen Dienstleistern in den USA und auf der ganzen Welt gespeichert [Hervorhebung hinzugefügt].“)
Das bedeutet, dass Daten, die in die KI hochgeladen oder zum Trainieren von GenAI-Modellen verwendet werden, außerhalb der Kontrolle der Organisation liegen, die ursprünglich über die Daten verfügte, und höchstwahrscheinlich auch außerhalb der geografischen Region, aus der sie stammen.
Wenn die Modelle mehr Eingaben erhalten, werden sie weiter verfeinert. Das bedeutet, dass Eingaben zukünftige Outputs beeinflussen können oder sogar als zukünftige Outputs wieder auftauchen (letzteres stellt ein Risiko für sensible Daten dar, weshalb einige Unternehmen die Verwendung von GenAI durch ihre Mitarbeitenden verbieten). Oft geschieht dies ohne großen Einblick, denn KI-Nutzer wissen möglicherweise nicht, wo sich die Maschinen befinden, die von ihnen bereitgestellten Daten verarbeiten. Grund zur Sorge ist auch Schatten-KI – die nicht genehmigte Nutzung von KI-Tools ohne die Sichtbarkeit oder Genehmigung von IT-Teams.
In vielen Ländern kann dies Unternehmen potenziell mit den Anforderungen an die Datenhoheit in Konflikt bringen. Zu den Risiken eines Verstoßes gegen solche Anforderungen gehören Geldstrafen (von kleinen bis zu den massiven Geldbußen, die gegen Meta verhängt werden), Sanktionen sowie ein Verlust des öffentlichen Ansehens und des Vertrauens der Kunden.
Andererseits stellen die Risiken, KI nicht zu nutzen und hinter der Konkurrenz zurückzufallen, eine ähnliche Bedrohung für Unternehmen dar.
Fassen wir zusammen: KI ist äußerst nützlich, kann aber für Unternehmen, die strengen Datenschutzvorschriften unterliegen, auch ein Risiko darstellen, es sei denn, sie finden einen Ansatz, der die Wahrung der Datensouveränität erlaubt.
Wie können Unternehmen KI nutzen und gleichzeitig das Risiko vermeiden, dass Daten geografische Grenzen überschreiten? Was wir brauchen, ist ein Ansatz, der eine Rechenleistung bietet, die komplexe KI-Modelle unterstützt, aber auf lokaler Ebene. Unternehmen müssen auch sicherstellen, dass sie die Kontrolle darüber haben, wo ihre Daten gespeichert und verarbeitet werden, sowohl während der Übertragung als auch im Ruhezustand.
Der beste Weg ist daher eine Datenlokalisierung in Kombination mit lokalen KI-Instanzen, die entweder auf einer Plattform eines Drittanbieters aufgebaut sind oder vorgefertigt von einem Anbieter angeboten werden. Eine vollständige Datenlokalisierung beinhaltet die volle Kontrolle darüber, wo die Daten gespeichert werden, von wo aus die Nutzer bedient werden und wo kryptografische Schlüssel gespeichert werden (da damit festgelegt wird, wo die Daten in entschlüsselter Form vorliegen). Diese Fähigkeiten müssen in ein leistungsstarkes globales KI-Netzwerk mit lokaler Präsenz integriert werden, das über eine ausreichende Rechenleistung verfügt, die bei Bedarf für den Betrieb von KI-Modellen zur Verfügung steht.
Unternehmen, die gleichzeitig mit der Notwendigkeit konfrontiert sind, KI einzusetzen und Daten zu lokalisieren, brauchen einen Partner, der diese Anforderungen versteht und sie unterstützen kann. Cloudflare bietet eine Datenlokalisierungs-Suite, die alle Unternehmen unterstützt, die Anforderungen an die Datensouveränität erfüllen müssen. Noch wichtiger ist jedoch, dass Cloudflare for AI Zugang zu GPUs überall auf der Welt bietet und Entwicklern und Entwicklerinnen schnelle Möglichkeiten bietet, beliebte KI-Modelle zu integrieren.
Dieser Beitrag ist Teil einer Serie zu den neuesten Trends und Themen, die für Entscheidungsträger aus der Tech-Branche heute von Bedeutung sind.
Folgende Informationen werden in diesem Artikel vermittelt:
Wie die Datenlokalisierung zur Einhaltung der gesetzlichen Bestimmungen beiträgt
Der Konflikt zwischen KI-Diensten und der regionalen Lokalisierung von Daten
Technologische Lösung, um Daten bei der Verwendung von KI lokal zu halten
Mehr darüber, wie Sie KI-Initiativen vereinfachen und sichern können, erfahren Sie im E-Book „Die Connectivity Cloud: So bringen Sie IT und Sicherheit wieder unter Kontrolle“.