jusbrasil.com.br
20 de Novembro de 2018

Big Data e acesso à informação - A legalidade do uso de Bots (Robôs)

Análise do uso de robôs para busca de informações governamentais frente à Lei de Acesso à Informação e ao Marco Civil da Internet

Oliver Alexandre Reinis, Advogado
há 5 meses

RESUMO

A internet apresenta, atualmente, um grande volume de informações disponibilizadas de maneira descentralizada na rede, sendo que serviços denominados Big Data nasceram para buscar, organizar filtrar e disponibilizar essa informação ao usuário final, de maneira mais palatável. Todavia, os websites de órgãos governamentais fazem uso de sistemas de captcha, para bloquear o acesso de sistemas automatizados de busca destas informações. O presente artigo analisa a legalidade deste bloqueio, em face da Lei de Acesso a Informacao e do Marco Civil da Internet.

Palavras-chave: Internet; Informação; Marco Civil da Internet; Lei de Acesso a Informacao; Robôs; CAPTCHA, Administração Pública.

INTRODUÇÃO

A internet tem sua origem no final da década de 90 e início do século XXI, sendo que, com base em pesquisa realizada pelo IBOPE em 2013, tem-se que atualmente o País já conta com mais de 102,3 milhões de usuários da internet.

Vale esclarecer, neste ínterim, que a internet é um conjunto de redes de computadores ligados entre si através de roteadores e gateways, cujo principal objetivo é transmitir informações diminuindo as distâncias e dissipando as fronteiras traçadas pela geografia. Com isso, criou-se um processo de globalização da informação e facilitação da comunicação, e a possibilidade de armazenamento de dados industriais e individuais, dados relativos a contas bancárias, números de cartões de crédito, senhas de acesso, trocas de experiências interpessoais, criação e difusão do comércio eletrônico.

Isso levou, com o passar dos anos, a um volume absurdo de armazenamento de informações na rede, e à criação de inúmeros serviços - muitos dos quais públicos - de disponibilização destas mesmas informações.

No Brasil, podemos trazer à lume, ainda, a Lei de Acesso a Informacao (Lei nº 12.527/11), que regulamentou a obrigação dos Poderes Públicos em disponibilizar suas informações de forma clara, transparente e de fácil acesso a qualquer cidadão. E nada mais fácil do que disponibilizá-las online.

Tais fatos levaram à criação de um novo mercado digital, formado por empresas que criam sistemas de captura, tratamento e administração de informações em grande volume, conhecida no meio informático como big data.

Em resumo, tais empresas trabalham com a criação de programas de computador que buscam grandes volumes de informação na rede, em diversas fontes diferentes, filtram essa informação, e apresentam a mesma ao usuário final de forma organizada.

Para tanto, elas se utiliza de robôs, que são programas que fazem pesquisas automáticas em sites que disponibilizam dados públicos fornecidos, em sua grande parte, pelo governo, e trazem esses dados para seu sistema de filtros e disponibilização.

Muitas vezes, entretanto, as fontes originais das informações são protegidas contra a ação destes robôs e, para conseguir obter a informação, os mesmos fazem uso de sistemas de automatização ou desvio dos sistemas de captcha, utilizados por alguns sites públicos.

O presente artigo visa discutir, justamente, a legalidade destes sistemas de automatização ou desvio dos sistema de captcha.

CAPTCHA

Captcha é um acrônimo da expressão "Completely Automated Public Turing test to tell Computers and Humans Apart" (teste de Turing público completamente automatizado para diferenciação entre computadores e humanos): um teste de desafio cognitivo, utilizado como ferramenta anti-spam.

A idéia original do captcha é, como diz seu nome, diferenciar humanos de robôs, com o fito de proteger sistemas de hackers, spammers e outros, que teriam como objetivo ações maliciosas contra o sistema ou website.

Todavia, há muito que essa idéia resta ultrapassada. Em 2010, as universidades de Konstanz (Alemanhã) e NUST (Paquistão) publicaram o artigo Breaking e-Banking CAPTCHAS, no qual, utilizando um conjunto de técnicas de processamento de imagens e reconhecimento de padrões, quebraram 3 CAPTCHAS usados para validar transações bancárias e 41 utilizados para login, atingindo taxa próxima a 100% de sucesso.

Em seguida, em 2011, a Universidade de Stanford publicou o artigo Text-based CAPTCHA - Strengths and Weakness, apresentando resultados do uso de uma ferramenta cujo algoritmo quebrou 66% dos CAPTCHAS da Visa, 75% do eBay e 70% da Blizzard, entre outros.

Ou seja, passou o sistema de captcha a ser mais um bloqueio de acesso para empresas de Big Data e assemelhadas, do que um sistema de defesa real. Tornou-se o mesmo, simplesmente, um entrave à livre disseminação e uso de informação pública, o que faz com que, atualmente, todas as empresas que trabalham com Big Data sejam obrigadas a fazer uso de sistemas de quebra ou desvio de captchas.

LIVRE ACESSO À INFORMAÇÃO

É importante ressaltar, neste ponto, que esses robôs não invadem dispositivos informáticos alheios, mediante violação indevida de mecanismo de segurança (o que configuraria o crime previsto no art. 154-A, do Código Penal - com a redação que lhe deu a Lei nº 12.732/12, apelidada de Lei Carolina Dieckmann).

Ao contrário, eles buscam somente informação pública, através dos canais de disponibilização desta informação fornecidos pelo titular da mesma, só que de forma automatizada – o que torna essa busca mais eficaz e rápida.

Da mesma maneira, tal ato não tem o fim de obter, adulterar ou destruir dados ou informações sem autorização expressa ou tácita do titular. Ao contrário, o sistema simplesmente filtra e colaciona essas informações, apresentando-as ipsis literis ao usuário final, só que de modo organizado, de acordo com a pesquisa feita por este.

É o caso, por exemplo, de sistema na internet que, em website, apresenta listas de processos em trâmite no Brasil todo, de políticos. O sistema busca essa informação nas áreas abertas ao público dos sites de cada Tribunal, as agrega, filtra e disponibiliza em lista única ao usuário final.

Ora, isso não só é permitido, como também incentivado pela nossa legislação.

Basta vermos o disposto no art. , § 2º e § 3º, incisos II e III, da Lei de Acesso a Informacao (Lei nº 12.527/11):

Art. 8o É dever dos órgãos e entidades públicas promover, independentemente de requerimentos, a divulgação em local de fácil acesso, no âmbito de suas competências, de informações de interesse coletivo ou geral por eles produzidas ou custodiadas.
(...)
§ 2o Para cumprimento do disposto no caput, os órgãos e entidades públicas deverão utilizar todos os meios e instrumentos legítimos de que dispuserem, sendo obrigatória a divulgação em sítios oficiais da rede mundial de computadores (internet).
§ 3o Os sítios de que trata o § 2o deverão, na forma de regulamento, atender, entre outros, aos seguintes requisitos:
(...)
II - possibilitar a gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações;
III - possibilitar o acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina;
(...)

Ora, a redação de tais dispositivos legais, especialmente do inciso III supra transcrito, é absolutamente clara: os sistemas governamentais, em todas as suas esferas, devem possibilitar o acesso automatizado por sistemas externos a suas informações, legíveis por máquinas.

Ressalte-se que o art. do Decreto nº 7.724/12 repetiu integralmente o disposto na Lei de Acesso a Informacao:

Art. 8o Os sítios na Internet dos órgãos e entidades deverão, em cumprimento às normas estabelecidas pelo Ministério do Planejamento, Orçamento e Gestão, atender aos seguintes requisitos, entre outros:
(...)
III - possibilitar gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações;
IV - possibilitar acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina;
(...)
Assim, a manutenção de sistemas de captcha em websites governamentais que divulgam informações públicas é, no nosso entender, absolutamente ilegal.

Não bastando isso, a Lei nº 12.965/14 - Marco Civil da Internet - fixa que:

Art. 4o A disciplina do uso da internet no Brasil tem por objetivo a promoção:
(...)
III - da inovação e do fomento à ampla difusão de novas tecnologias e modelos de uso e acesso; e
IV - da adesão a padrões tecnológicos abertos que permitam a comunicação, a acessibilidade e a interoperabilidade entre aplicações e bases de dados.

A leitura da mesma é clara: o uso da internet no Brasil tem como objetivo a promoção da inovação e fomento a novos modelos de uso e acesso, e à acessibilidade e interoperabilidade entre aplicações e bases de dados.

E mais, em seu artigo 24, diz:

Art. 24. Constituem diretrizes para a atuação da União, dos Estados, do Distrito Federal e dos Municípios no desenvolvimento da internet no Brasil:
(...)
III - promoção da racionalização e da interoperabilidade tecnológica dos serviços de governo eletrônico, entre os diferentes Poderes e âmbitos da Federação, para permitir o intercâmbio de informações e a celeridade de procedimentos;
IV - promoção da interoperabilidade entre sistemas e terminais diversos, inclusive entre os diferentes âmbitos federativos e diversos setores da sociedade;
V - adoção preferencial de tecnologias, padrões e formatos abertos e livres;

Não há dúvida que sistemas de Big Data e os aplicativos deles decorrentes configuram um novo modelo de uso e acesso à informação constante na internet. Desta feita, os sites governamentais, em obediência ao art. 4º, IV, conjuntamente com o art. 24, incisos III, IV e V, todos da Lei nº 12.965/14, deveriam fomentar e facilitar o uso de suas informações por estas empresas, garantindo a “a acessibilidade e a interoperabilidade entre aplicações e bases de dados”, e não obstá-las através de sistemas de captcha.

CONCLUSÃO

É nítido que a utilização de sistema de captcha, que tem como único objetivo impedir o acesso de informações públicas por robôs, não só faz do art. , § 3º, III, da Lei de Acesso a Informacao letra morta, mas também o viola frontalmente.

Ao mesmo tempo, desrespeita as diretrizes fixadas pelo Marco Civil da Internet (em seus artigos 4º e 24), para a atuação do entes governamentais brasileiros no desenvolvimento da internet nacional.

Ao permitir (e fomentar) a manutenção de tais sistema de captcha, os dirigentes dos órgãos públicos competentes pela divulgação de informações públicas está claramente desrespeitando a Lei de Acesso a Informacao, sendo seu ato, inclusive, passível de contestação através de Mandado de Segurança, eis que configura nítido ato ilegal e coator.

BIBLIOGRAFIA

FERRAZ, Reinaldo. Eu não sou uma máquina. Internet

OLIVEIRA, Andressa Cattafesta de; ZANGANELLI, Margareth Vetis. Compliance, Governança e Transparência na Administração Pública à luz da Lei de Acesso a Informacao Brasileira, in O Direito atual e as novas fronteiras jurídicas. Instituto Politécnico do Cávado e do Ave - Centro de Investigação Jurídica Aplicada - Barcelos, Portugal, 1ª ed., p. 499-520, 2017;

SCHIEFLER, Gustavo Henrique Carvalho. Anotações sobre o regime jurídico aplicável às informações disponibilizadas pela Administração Pública na rede mundial de computadores. Fórum Administrativo - FA, Belo Horizonte, ano 13, n. 146, p. 36-48, abril 2013;

SOARES, Horácio; SPELTA, Lêda. CAPTCHA, herói ou vilão? Internet

3 Comentários

Faça um comentário construtivo para esse documento.

Não use muitas letras maiúsculas, isso denota "GRITAR" ;)

Ótima leitura!! continuar lendo

Muito interessante esse texto, @oareinis !

Já temos dificuldades suficientes relacionadas a falta de interoperabilidade entre os diferentes órgãos judiciários no país. Fica realmente difícil encontrar alguma justificativa para o uso de captchas no fornecimento de dados públicos que não sejam ligados a diminuir o acesso à informação e prejudicar aqueles que precisam desses dados de maneira mais geral.

As empressas que se propõem a trabalhar com jurimetria, por exemplo, enfrentam sérios problemas para conseguir trabalhar com dados globais do judiciário brasileiro e existe todo um sub-setor no ecossistema das legal techs brasileiras que é completamente voltado para o monitoramento de dados públicos. continuar lendo

O uso de robô só faz sentido quando o site/portal não possui API.

Maioria dos sites de prefeitura que conheço possuem API, mas a maioria ou quase todos sites de
tribunais não possuem API e possuem CAPTCHA.

De acordo com o texto no momento que estes sites/portais não optam por usar uma API para permitir o acesso automatizado por sistemas externos estaria configurado o desrespeito ao disposto no art. 8º, § 2º e § 3º, inciso III, da Lei de Acesso a Informacão (Lei nº 12.527/11):

Infelizmente pra eles, neste momento não é possível parar a atividade dos robôs. continuar lendo