Con las normativas de datos cada vez más complejas, cada vez es más importante saber de dónde proceden los datos, adónde van y quién los procesa. En muchas partes del mundo, las normativas de datos exigen que los datos permanezcan en su región de origen a menos que organizaciones externas puedan demostrar la conformidad con esas normativas. Este concepto se denomina "soberanía de los datos" — la idea de que los datos están regulados por las leyes del país o región en el que se procesan.
Sin embargo, incluso si la ubicación o el proveedor al que se transfieren los datos cumplen la normativa, las transferencias de datos transfronterizas pueden dar lugar a infracciones. Por ejemplo, las agencias gubernamentales de algunos países pueden estar facultadas para examinar los datos que cruzan sus fronteras, lo que infringiría la normativa de datos de otros países.
Las organizaciones que transfieren datos fuera de su región de origen sin una protección adecuada pueden enfrentarse a graves consecuencias legales y financieras. Por ejemplo, en 2023 Meta recibió una multa de 1300 millones de dólares por transferir datos personales de la UE a Estados Unidos sin las protecciones de privacidad adecuadas para los datos transferidos.
Lo anterior ha dado lugar al concepto de localización de datos. Para garantizar la conformidad normativa con los datos y la confianza de los consumidores, las organizaciones a menudo se enfrentan a la necesidad de mantener los datos dentro de sus propias regiones.
La idea de la localización de datos es que los datos se mantengan dentro de un país o región determinados, en lugar de transferirse a través de fronteras y procesarse o almacenarse en servidores en áreas remotas. Sin embargo, este enfoque eleva la complejidad de la informática en la nube y el uso de servicios externos de terceros, ya que estos servicios no suelen estar localizados de esta manera. Los centros de datos en la nube están ubicados en todo el mundo, independientemente de dónde se basen los servicios a los que dan soporte.
Esto significa que la necesidad de localizar los datos, para muchas organizaciones, puede entrar en conflicto con uno de los servicios basados en la nube más importantes disponibles en la actualidad: la inteligencia artificial (IA).
En los últimos años, la combinación de un hardware más potente y un software mejorado ha llevado a una explosión de las capacidades de la IA. Las organizaciones están incorporando la IA en sus procesos para ayudar con el modelado predictivo, la ideación de contenidos, la investigación, el análisis de opiniones y la automatización del servicio al cliente. Firmas de analistas como McKinsey siguen siendo optimistas acerca de la expansión de los usos empresariales de la IA generativa (GenAI). La mayoría de las empresas no tienen tiempo ni recursos para crear sus propios modelos de IA, por lo que dependen de proveedores externos para utilizar estas tecnologías.
Sin embargo, la IA recaba datos para funcionar. Los modelos de IA se basan en grandes conjuntos de datos que se utilizan para entrenar algoritmos complejos. Los grandes conjuntos de datos se pueden almacenar, y lo hacen, en una variedad de lugares. Sin embargo, debido a su escalabilidad, los datos de entrenamiento para la IA casi siempre se almacenan en la nube, en centros de datos de todo el mundo. (De las preguntas frecuentes sobre los servicios al consumidor de OpenAI: "El contenido se almacena en los sistemas de OpenAI y en los sistemas de nuestros proveedores de servicios de confianza en Estados Unidos y en todo el mundo [cursiva añadida]").
Esto significa que los datos cargados a la IA o utilizados para entrenar modelos de GenAI pasan fuera del control de la organización que originalmente tenía los datos, y lo más probable es que estén fuera de la región geográfica de la que se originan.
A medida que los modelos reciben más información, se siguen perfeccionando. Esto significa que la introducción de datos puede influir en la salida de información futura, o incluso reaparecer como salidas futuras de datos (este último es un riesgo para los datos confidenciales que llevó a algunas organizaciones a prohibir a sus empleados el uso de la GenAI). A menudo, esto ocurre con muy poca visibilidad. Es posible que los usuarios de la IA no sepan dónde están las máquinas que procesan los datos que proporcionan. También es motivo de preocupación la Shadow AI (IA paralela), o el uso no autorizado de herramientas de IA que se produce sin la visibilidad o la aprobación de los equipos informáticos.
En muchas jurisdicciones, esto puede generar un conflicto con los requisitos de soberanía de datos de las empresas. Los riesgos de entrar en conflicto con estos requisitos incluyen multas (desde multas pequeñas hasta la multa masiva impuesta a Meta), sanciones y una disminución de la reputación pública y la confianza de los clientes.
Por otro lado, los riesgos de no utilizar la IA y quedar rezagados con respecto a la competencia plantean una amenaza similar para las empresas.
En resumen, la IA es muy útil, pero puede plantear riesgos a las organizaciones que operan bajo estrictas regulaciones en materia de datos, a menos que puedan encontrar un enfoque favorable a la soberanía de los datos para la IA.
¿Cómo pueden las empresas utilizar la IA y evitar el riesgo de que los datos crucen fronteras geográficas? Lo que se necesita es un enfoque que ofrezca potencia computacional capaz de admitir modelos complejos de IA, pero de forma localizada. Las organizaciones también deben asegurarse de controlar dónde se almacenan y procesan sus datos, tanto en tránsito como en reposo.
Por lo tanto, el mejor camino a seguir es la localización de datos combinada con instancias locales de IA, ya sea creadas en una plataforma de terceros u ofrecidas previamente por un proveedor. La localización completa de los datos implica un control total sobre dónde se almacenan los datos, desde dónde se sirve a los usuarios y dónde se almacena la clave criptográfica (ya que esto dicta dónde existen los datos en forma desencriptada). Estas capacidades se deben integrar con una potente red global de IA con presencia local, una red con suficiente potencia computacional disponible bajo demanda para operar modelos de IA.
Las empresas que se enfrentan simultáneamente a la necesidad de utilizar la IA y a la necesidad de localizar los datos, necesitan un socio que comprenda estos requisitos y pueda ayudarles. Cloudflare ofrece un conjunto de soluciones de localización de datos para ayudar a todas las organizaciones que tienen requisitos de soberanía de datos que cumplir. Pero lo que es más importante, Cloudflare for AI ofrece acceso a GPU en cualquier parte del mundo y formas rápidas para que los desarrolladores integren modelos populares de IA.
Este artículo forma parte de un conjunto de publicaciones sobre las últimas tendencias y temas que afectan a los responsables de la toma de decisiones sobre tecnología en la actualidad.
Después de leer este artículo podrás entender:
Cómo la localización de datos ayuda a garantizar la conformidad de los marcos normativos
El conflicto entre los servicios de IA y la localización regional de los datos
La solución tecnológica para mantener los datos a nivel local mientras se utiliza la IA
Más información sobre cómo simplificar y proteger las iniciativas de IA en el libro electrónico "Conectividad cloud, una forma de recuperar el control de la informática y la seguridad".