Com os regulamentos de dados aumentando em complexidade, a origem dos dados, para onde vão e quem os processa é cada vez mais importante. Em muitas partes do mundo, os regulamentos de dados exigem que os dados permaneçam na sua região de origem, a menos que organizações externas possam demonstrar conformidade com esses regulamentos. Este conceito é chamado "soberania de dados": a ideia de que os dados são regulamentados pelas leis do país ou da região em que são processados.
No entanto, mesmo que o local ou fornecedor para o qual os dados estão sendo transferidos esteja em conformidade, as transferências de dados internacionais podem resultar em violações. Por exemplo, as agências governamentais em alguns países podem ter poderes para examinar dados que atravessem suas fronteiras, o que violaria os regulamentos de dados de outros países.
As organizações que transferem dados para fora de sua região de origem sem proteção adequada podem enfrentar sérias consequências legais e financeiras. A título de exemplo, em 2023 a Meta recebeu uma multa de US$ 1,3 bilhão por transferir dados pessoais da UE para os EUA sem proteções de privacidade adequadas para os dados transferidos.
Isso deu origem ao conceito de localização de dados: para manter a conformidade regulatória de dados e a confiança do consumidor, as organizações geralmente enfrentam a necessidade de manter os dados dentro de suas próprias regiões.
A ideia da localização de dados é que os dados sejam mantidos dentro de um determinado país ou região, em vez de serem transferidos além das fronteiras e processados ou armazenados em servidores em áreas remotas. No entanto, essa abordagem torna a computação em nuvem e o uso de serviços externos de terceiros mais complexos, pois esses serviços geralmente não são localizados dessa forma. Os data centers em nuvem estão localizados em todo o mundo, independentemente de onde os serviços aos quais eles oferecem suporte estão baseados.
Isso significa que a necessidade de localizar dados, para muitas organizações, pode entrar em conflito com um dos serviços baseados em nuvem mais importantes disponíveis hoje: a inteligência artificial (IA).
Nos últimos anos, uma combinação de hardware mais potente e software cada vez mais refinado levou a uma explosão nos recursos de IA. As organizações estão incorporando a IA em seus processos para ajudar na modelagem preditiva, idealização de conteúdo, pesquisa, análise de sentimentos e automação de atendimento ao cliente. Empresas de análises como a McKinsey continuam otimistas sobre a expansão dos usos da IA generativa (GenAI) nas empresas. A maioria das empresas não tem tempo nem recursos para criar os seus próprios modelos de IA, por isso depende de fornecedores externos para usar estas tecnologias.
A IA, no entanto, suga dados para funcionar. Os modelos de IA s ão baseados em grandes conjuntos de dados que são usados para treinar algoritmos complexos. Grandes conjuntos de dados podem ser, e são, armazenados em vários lugares. Mas, devido à sua escalabilidade, os dados de treinamento para IA são quase sempre armazenados em nuvem, em data centers ao redor do mundo. (Das Perguntas Frequentes sobre serviços para consumidores da OpenAI: "O conteúdo é armazenado nos sistemas da OpenAI e nos sistemas de nossos provedores de serviços confiáveis nos EUA e em todo o mundo [ênfase adicionada]").
Isso significa que quando se faz upload dos dados para a IA ou quando são usados para treinar modelos de GenAI, eles ficam fora do controle da organização que originalmente tinha os dados e muito provavelmente estão fora da região geográfica de onde se originaram.
À medida que os modelos recebem mais entradas, eles continuam a ser ajustados. Isso significa que as entradas podem influenciar resultados futuros, ou até mesmo reaparecer como resultados futuros (o último dos quais é um risco para dados confidenciais que levou algumas organizações a proibir o uso da GenAI por seus funcionários). Muitas vezes isso acontece com muito pouca visibilidade, os usuários de IA podem não saber onde estão as máquinas que processam os dados que eles fornecem. Também preocupante é a IA oculta, ou uso não autorizado de ferramentas de IA que ocorre sem a visibilidade ou aprovação das equipes de TI.
Em muitas jurisdições, isto possivelmente coloca as empresas em conflito com os requisitos de soberania de dados. Os riscos de conflito com tais requisitos incluem multas (desde pequenas multas até a enorme cobrada contra a Meta), sanções e um declínio na reputação pública e na confiança dos clientes.
Por outro lado, os riscos de não usar a IA e de ficar para trás na concorrência representam uma ameaça semelhante para as empresas.
Para resumir: a IA é extremamente útil, mas pode ser arriscada para as organizações que operam sob regulamentações de dados rígidas, a menos que possam encontrar uma abordagem de IA favorável à soberania de dados.
Como as empresas podem usar a IA e evitar o risco de os dados cruzarem as fronteiras geográficas? O que é necessário é uma abordagem que ofereça um poder computacional capaz de suportar modelos de IA complexos, mas de forma localizada. As organizações também precisam garantir que controlam onde seus dados são armazenados e processados, tanto em trânsito quanto em repouso.
O melhor caminho a seguir é, portanto, a localização de dados combinada com instâncias locais de IA, criadas em uma plataforma de terceiros ou oferecidas pré-construídas por um fornecedor. A localização completa de dados envolve controle total sobre onde os dados são armazenados, onde os usuários são atendidos e onde as chaves criptográficas são armazenadas (uma vez que isso determina onde os dados existem em forma descriptografada). Estas capacidades devem ser integradas em uma poderosa rede global de IA com presença local, uma com poder computacional suficiente disponível sob demanda para operar modelos de IA.
As empresas que enfrentam simultaneamente a necessidade de usar a IA e a necessidade de localizar dados precisam de um parceiro que entenda esses requisitos e possa suportá-los. A Cloudflare oferece um pacote de localização de dados para apoiar todas as organizações que têm requisitos de soberania de dados a cumprir. Porém, o mais importante é que o Cloudflare para IA oferece acesso a GPUs em qualquer lugar do mundo e maneiras rápidas para os desenvolvedores integrarem modelos populares de IA.
Este artigo é parte de uma série sobre as tendências e os assuntos mais recentes que influenciam os tomadores de decisões de tecnologia hoje em dia.
Após ler este artigo, você entenderá:
Como a localização de dados ajuda a manter a conformidade com as estruturas regulatórias
O conflito entre os serviços de IA e a manutenção de dados localizados regionalmente
Solução tecnológica para manter os dados locais enquanto usa a IA
Saiba mais sobre como simplificar e proteger iniciativas de IA no e-book A nuvem de conectividade: uma maneira de recuperar o controle da TI e da segurança.