No início dos anos 90, o rápido desenvolvimento de computadores com processadores capazes de proporcionar melhor desempenho e maior capacidade de armazenamento contribuíram para o início da chamada "economia da informação". Os frutos da sociedade da informação são facilmente constatados por meio dos smartphones, computadores e dos sistemas de tecnologia da informação cada vez mais presentes em pequenas, médias e grandes empresas (MAYER-SCHÖNBERGER;CUKIER, 2013, p.4). Big Data representa uma revolução de dados relativamente recente, que tem sua grandeza confirmada pelos números que a acompanham, é de rápido crescimento exponencial em todo o mundo, com imensas consequências para a sociedade, independentemente de classe social, e que é caracterizada pela coleta e processamento de um grande volume de dados e obtenção de informações a uma velocidade quase impossível de se imaginar (BAGNOLI, 2016, p.7). Assim, tratar de Big Data é enfrentar um dilúvio informacional.

O termo Big Data refere-se aos conjuntos de dados cujo tamanho está além da capacidade de uma ferramenta tradicional de base de dados capturar, armazenar, gerenciar e analisar, representando a próxima fronteira para inovação, concorrência e produtividade. O volume (grande volume), a velocidade (rápida geração e processamento de dados), a variedade (de dados e fontes), o valor (patrimônio imaterial), a veracidade (precisão) e a validação (compreensão e compliance), ou os "6V's", são virtuosas características atreladas ao Big Data (BAGNOLI, 2017, p.397) e que compõe seu conceito.

A ubiquidade da coleta de dados presente na sociedade atual, viabilizada pelo constante uso de aparelhos conectados à Internet, os menores custos de armazenamento, o poder cada vez maior de captação e da capacidade dos computadores, estimula a exploração cada vez mais ampla dos benefícios proporcionados pelo Big Data. A diversidade de meios e equipamentos conectados à internet é tamanha que o termo "Internet of Things" (IoT) vem sendo substituído por "Internet of Everything" (IoE). Estima-se que no ano de 2020 haverá 30 bilhões de equipamentos permanentemente conectados à internet e outros 200 bilhões de equipamentos intermitentemente conectados, cada um deles produzindo dados (MENDES, 2017, p.22), cujo procedimento de extração de informações relevantes ao mundo dos negócios ou ao Estado seria objeto de processos de identificação, organização, deleção, seleção, compreensão, mineração, interpretação e armazenamento dos dados coletados.

Há duas características fundamentais inerentes ao Big Data que trazem grandes desafios à sua legítima exploração. A primeira delas se deve ao fato de que a análise de Big Data frequentemente revela a possibilidade de se utilizar os dados coletados para uma finalidade diversa daquela proposta inicialmente. A segunda está relacionada ao volume de dados coletados, que não raramente se mostram amplamente melhores e mais valiosos do que aqueles encontrados tradicionalmente em bases de dados estruturados (KALYVAS; OVERLY, 2015, p.33). Há, consequentemente, impactos econômicos e sociais decorrentes do Big Data, posto que viabiliza previsões sem precedentes sobre a vida privada e deslocam ou fortalecem o poder daqueles que detêm as informações (HIJMANS, 2016, p.98). Tais características desafiam princípios a serem observados no tratamento de dados pessoais e o direito à privacidade, que acabam impondo limites à exploração de Big Data em decorrência de sua íntima capacidade de interferir na efetivação de direitos individuais fundamentais.

O General Data Protection Regulation (GDPR), em vigor na Comunidade Europeia desde 25 de maio de 2018, elenca em seu artigo 5, seis princípios básicos para tratamento de dados pessoais, que se traduzem em: Lawfulness, Fairness, and Transparency; Purpose Limitation; Data Minimisation; Accuracy; Storage Limitation; Integrity and Confidentiality. Dentre outras questões importantes, o princípio da finalidade, previsto no artigo 5.1 (b) do General Data Protection Regulation (GDPR), indica que dados pessoais devem ser "recogidos con fines determinados, explícitos y legítimos, y no serán tratados ulteriormente de manera incompatible con dichos fines".

Eis um dos grandes obstáculos a serem enfrentados, quando se trata de Big Data. Isso porque muitas das ferramentas utilizadas em Big Data são exatamente baseadas na reunião e vinculação de dados coletados das mais diferentes formas, origens, momentos, contextos e para finalidades diversas muitas vezes sequer conhecidas no momento da coleta dos dados. Não raramente, a finalidade ou mesmo a utilidade dos dados são conhecidas apenas após a sua coleta e tratamento, tornando a observância de tais princípios uma tarefa bastante difícil de ser completada e talvez contrária à própria essência de Big Data.

No Brasil, a Lei 13.709 de 14 de agosto de 2018, também conhecida como Lei Geral de Proteção de Dados (LGPD), contou com contribuições da comunidade acadêmica, da sociedade civil e de representantes do setor privado para sua elaboração. Recentemente promulgada pelo Presidente da República, embora vetados alguns dispositivos constantes no texto original, a LGPD altera o cenário jurídico e econômico do país de maneira significativa. Assim como no caso da legislação europeia, a LGPD impõe uma série de obrigações e regras a serem atendidas por aqueles que pretendem explorar atividades relacionadas à coleta e tratamento de dados pessoais. Traz disposições bastante similares àquelas previstas na legislação europeia, dentre as quais, os princípios a serem observados nas atividades de tratamento de dados pessoais, quais sejam: Finalidade; Adequação; Necessidade; Livre Acesso; Qualidade dos Dados; Transparência; Segurança; Prevenção; Não Discriminação; Responsabilização e Prestação de Contas.

Guardando certa similaridade com o artigo 83 da GDPR, a norma brasileira, em seu artigo 52, traz um rol de sanções às infrações cometidas ao regulamento, a possibilidade de aplicação de multa simples ou diária de até 2% do faturamento da pessoa jurídica de direito privado, grupo ou conglomerado no Brasil no seu último exercício fiscal, excluídos os tributos, limitando-a, no total, a R$50.000.000,00 por infração, além de outras penalidades como a publicização da infração e o bloqueio ou eliminação de dados pessoais. A LGPD estabelece ainda parâmetros e critérios para aplicação das sanções, que devem ser proporcionais à gravidade da infração. Tais critérios e parâmetros consistem na análise da gravidade e natureza das infrações e direitos pessoais afetados; da boa-fé, condição econômica e da vantagem auferida ou pretendida pelo infrator e do grau do dano causado. Além disso, a reincidência e cooperação do infrator; a adoção reiterada e demonstrada de mecanismos e procedimentos de segurança e capazes de minimizar os danos; a existência de políticas de compliance e a pronta adoção de medidas corretivas diante do incidente ocorrido, são questões a serem observadas para aplicação das prováveis penalidades decorrentes de incidentes envolvendo dados pessoais no Brasil.

A promulgação da Lei Geral de Proteção de Dados brasileira insere o país do rol daqueles que possuem adequada proteção aos dados pessoais, embora ainda seja necessário superar um período de vacância da lei de 18 meses contados a partir de sua publicação oficial para sua efetiva entrada em vigor, prevista para fevereiro de 2020. Deve-se lembrar ainda que normas previstas na Constituição Federal, especialmente no que tange aos direitos individuais fundamentais, incluindo a privacidade, na legislação consumerista (e.g. Lei 8.078/90; Lei 12.414/2011), na legislação que regulamenta a Internet (e.g. Lei 12.965/2014; Decreto 8.771/2016) também asseguram certos limites e o respeito aos direitos e garantias fundamentais dos titulares dos dados pessoais, devendo assim ser integralmente respeitadas.

Seguindo uma tendência mundial, a regulamentação das atividades de tratamento de dados pessoais no Brasil trará maior segurança ao mercado, exigindo, no entanto, uma completa adequação à LGPD por parte dos agentes econômicos interessados nas vantagens obtidas por meio do tratamento dados pessoais e em muitos dos modelos de negócios que integram aquilo que se tem denominado 4ª Revolução Industrial. Esse tratamento de dados pessoais, aliás, somente poderá ser realizado nas hipóteses previstas no artigo 7º da LGPD, dentre as quais estão incluídos o consentimento, o cumprimento de obrigação legal, a realização de estudos, o exercício regular de direitos, a proteção da vida e do crédito, a tutela da saúde, o legítimo interesse do controlador e para questões especificas, no caso da administração pública.

Assim, não havendo dúvidas quanto às vantagens proporcionadas pelo Big Data e pelo tratamento de dados pessoais aos agentes econômicos para atuação no mercado e ao Estado para o melhor desenvolvimento de políticas públicas, no que se refere à proteção de dados pessoais no Brasil, cabe aguardar e se preparar para a efetiva entrada em vigor da Lei Geral de Proteção de Dados, a partir da qual as atividades envolvendo o tratamento e a exploração de dados pessoais deverão ser orientadas.

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.