Dados abertos
O conceito de dados abertos (open data) corresponde à ideia de que certos dados devem estar disponíveis para que todos usem e publiquem, sem restrições de direitos autorais e patentes ou outros mecanismos de controle. Segundo a Open Definition dados abertos são dados que podem ser livremente utilizados, reutilizados e redistribuídos por qualquer pessoa – sujeitos, no máximo, à exigência de atribuição à fonte original e ao compartilhamento pelas mesmas licenças em que as informações foram apresentadas.[1] Ou seja, a abertura de dados evita que mecanismo restritivos possam ser aplicados para esconder dados, permitindo que tanto pessoas físicas quanto jurídicas possam explorar estes dados de forma livre.
Os objetivos do movimento de dados abertos são semelhantes aos de outros movimentos “abertos”, como o código aberto, conteúdo aberto e acesso livre. A filosofia por trás de dados abertos foi estabelecida há muito tempo, mas o termo “dados abertos” em si é recente, ganhando popularidade com o surgimento da Internet e World Wide Web.
Visão geral
O conceito de dados abertos não é novo, mas a definição formal é relativamente nova. Uma formalização inicial foi dada pela Open Definicion, criada pela Open Knowledge.
Dados abertos geralmente são focados em materiais não textuais, tais como mapas, genomas, compostos químicos, fórmulas científicas e matemáticas, dados e práticas médicas, biociências e biodiversidade. Problemas surgem frequentemente porque esses dados são comercialmente valiosos ou podem ser agregados em obras de valor. O acesso ou reuso dos dados são controladas por organizações, tanto públicas como privadas. O controle pode ser através de restrições de acesso, licenças, direitos autorais, patentes e tarifas de acesso ou reutilização. Os advogados de dados abertos argumentam que estas restrições são contra o bem comum e que esses dados devem ser disponibilizados sem restrição ou taxa. Além disso, é importante que os dados sejam reutilizáveis sem a necessidade de permissão, embora os tipos de reutilização (tais como a criação de trabalhos derivados) possam ser controlados por licença.
Uma descrição típica da necessidade de dados abertos é:
- Vários cientistas têm mostrado a ironia desse direito em momento histórico quando nós temos tecnologias que permitem disponibilidade mundial e processos distribuídos de dados, ampla colaboração e aceleração para o ritmo e a profundidade da descoberta... nós estamos cansados de travar os dados e de prevenir o uso correspondente de tecnologias avançadas para o conhecimento
[2] John Wilbanks, Diretor Executivo, Science Commons.
Criadores de dados muitas vezes não consideram a necessidade de mencionar as condições de licenciamento, propriedade e reutilização. Por exemplo, muitos cientistas não consideram ter controle sobre os dados publicados resultantes de seus trabalhos. No entanto, a falta de uma licença torna difícil determinar o status de um conjunto de dados e podem restringir o uso dos dados oferecidos em um espírito aberto.
Principais fontes de dados abertos
Dados abertos podem vir de qualquer fonte. Esta seção lista alguns dos campos que publicam uma grande quantidade de dados abertos.
Dados abertos na ciência
O conceito de acesso aberto a dados científicos foi institucionalmente estabelecida com a formação do sistema Centro Mundial de Dados, em preparação para o Ano Internacional da Geofísica de 1957-1958.[3] O Conselho Internacional das Uniões Científicas (agora o Conselho Internacional para a Ciência) estabeleceu vários centros de dados mundiais para minimizar o risco de perda de dados e para maximizar a acessibilidade dos dados, ainda em 1955, recomendando que os dados sejam disponibilizados em formato legível por máquina.[4]
Enquanto o movimento de dados científicos abertos antecede em muito a Internet, a disponibilidade de rede alterou significativamente o contexto dos dados científicos abertos, pois publicar ou obter dados tornou-se muito menos dispendioso e demorado.
Em 2004, os Ministros da Ciência de todas as nações da OCDE (Organização para a Cooperação e Desenvolvimento Econômico), que inclui países mais desenvolvidos do mundo, assinaram uma declaração que basicamente afirma que todos os dados de arquivo com financiamento público deve ser disponibilizada ao público.[5] Na sequência de um pedido e uma intensa discussão com as instituições produtora de dados nos Estados membros, a OCDE publicou em 2007 os Princípios e Diretrizes da OCDE para o acesso aos dados da investigação financiada por fundos públicos como uma recomendação jurídica flexível.[6]
Dados abertos no governo
Dados abertos governamentais são ótimos recursos ainda pouco explorados. Muitas pessoas e organizações coletam diferentes tipos de dados para executar suas tarefas. O governo é bastante importante nesse contexto, devido à quantidade dos dados que coleta e pelo fato de tais dados serem públicos, direito garantido no artigo 5º da Constituição Federal brasileira (regula o acesso a informações públicas e está escrita no Projeto de Lei nº 41/2010[7]).
Algumas cidades brasileiras, como Curitiba, São Paulo, Recife, Porto Alegre e Rio de Janeiro disponibilizam seus dados abertos em portais na internet. São páginas que reúnem dados públicos dos municípios para download.[8]
A disponibilização desses dados traz muito valor para sociedade e pequenos grupos de indivíduos e organizações já podem se beneficiar dessa disponibilidade. Hoje podemos notar várias áreas e atividades em que os dados abertos geram valor:
- Participação popular
- Controle da democracia
- Inovação
- Melhora e criação de novos serviços do governo
- Novos conhecimentos ao combinar fontes de dados e padrões
Dados abertos de empresas privadas
A visualização de dados e informações de empresas e grupos privados na Internet também tem sido trabalhado globalmente por diferentes iniciativas, como as plataformas Open Corporate, They Rule, Poderopedia, Open Spending EBR Corp Watch Transnationale, Open Secrets Crunch Base, Semantic XBRL, NBER, Corporation Wiki, Find The Company. No Brasil, a partir do levantamento de dados da Comissão de Valores Mobiliários, foi feito o Ranking dos Proprietários do Brasil elaborado com o levantamento do Índice de Poder Acumulado das empresas no país.
Dados abertos nas universidades
O movimento de abertura de dados de universidades é importante pois permite que dados sejam utilizados para produção de análises, produção de conhecimento, inovação e conhecimento prévio.[9] No Reino Unido, destacam-se a Universidade de Southampton, a Open University e a Universidade de Oxford pelas iniciativas políticas de abertura de dados e aplicação. Na América do Norte, a Universidade de Waterloo, a Universidade de Toronto, a Universidade da Pensilvânia, entre outras.[10]
A partir de experiências de grupos de universitários, a organização Campus Data compilou um livro guia sobre seus desafios com a abertura de dados em suas universidades.
Tecnologias e práticas da transparência
Na sociedade, as tecnologias da informação e comunicação impactam o conceito de transparência. Sendo o digital o espaço onde se manifestam essas possibilidades, e sendo a internet o seu principal meio de proliferação, o conceito de transparência passa a se associar às formas de disponibilizar informação na web.[11]
Esta seção lista alguns conceitos relacionados à transparência de dados na web.
Crowdsourcing
Um exemplo conhecido e bem sucedido de experiência de crowdsourcing é a própria Wikipedia, que começou com um simples convite para que cada pessoa criasse apenas um artigo.
Pode-se dizer que o uso do crowdsourcing para fins públicos ou políticos é bem parecida com outras formas tradicionais de articulação de pessoas em prol de um objetivo comum.[11] O que torna o crowdsourcing como uma prática de transparência é que ela permite que grandes quantidades de dados ganhem sentido, podendo gerar ideias novas para o desenvolvimento de projetos para sociedade.
Mashups
O mashup é uma prática que tem a ver com os princípios da rede – como a abertura, a livre-iniciativa, a colaboração - com a ideia de publicar informações com a intenção de que elas sejam reaproveitadas por desenvolvedores capazes de construírem cruzamentos, aplicativos e visualizações de dados diferenciadas, agregando valor e mais possibilidades de uso a essas informações.[11]
Atualmente existem várias tecnologias para importar e utilizar dados brutos presentes na web. Tais tecnologias estão cada vez mais acessíveis, e requerem cada vez menos conhecimento técnico para tornarem possível a criação de visualizações e cruzamentos de dados.[12]
Os valores gerados pelos mashups no contexto de transparência pública possibilita a aproximação da administração pública da sociedade, possibilitando transformações no governo e na política.
Hacks
Nem sempre as informações públicas estão disponíveis na web de forma estruturada e legível. Isso dificulta a utilização dos dados pelas pessoas, mas ainda sim é possível agregar tais informações para visualização. Isso pode ser feito tanto por pessoas, por meio de experiências de crowdsourcing – que consistam em buscar manualmente dados públicos que estão dispersos pela internet, construindo bases estruturadas –, quanto por máquinas, por meio de técnicas de scraping ou raspagem de dados – que resumidamente são formas de retirar dados com determinada característica de sites da rede por meio de código.[11]
Diante desse cenário, podemos chamar de hacks as ações de pessoas para hackear os dados públicos com o objetivo de usar as informações obtidas para gerar algum valor.
Transparência de dados abertos no Brasil
No Brasil existem alguns programas de transparência pública, como o criado pela Transparência Brasil e pela Open Knowledge Brasil. Ainda assim, ainda são raros os órgãos ou secretarias que deixam a disposição seus dados. Em alguns casos os dados são disponíveis para visualização, mas existem várias barreiras para o uso de tais dados para criação de novos produtos e serviços.
Argumentos a favor e contra dados abertos
O debate sobre dados abertos ainda continua evoluindo. Abaixo seguem alguns argumentos feitos a favor dos dados abertos:
- "Os dados pertencem à raça humana". Exemplos típicos são genomas, dados sobre os organismos, ciência médica, dados ambientais.
- O dinheiro público foi usado para financiar o trabalho e por isso deve ser universalmente disponível.[13]
- Os fatos não podem ser legalmente protegidos.
- Os dados são necessários para boa execução das atividades humanas.
- Na pesquisa científica, a taxa de descoberta é acelerada por um melhor acesso aos dados.[14]
- Informação, apresentada de forma apropriada, é um habilitador de melhoria nos serviços públicos e no governo.[15]
Em contrapartida aos argumentos acima citados, abaixo seguem outros contra tornar todos os dados disponíveis como dados abertos:
- Os governos têm de ser responsáveis para o uso eficiente do dinheiro dos contribuintes: se os fundos públicos são utilizados para agregar os dados e se os dados irão trazer benefícios comerciais (privados) para apenas um pequeno número de usuários, os usuários devem reembolsar os governos pelo custo de fornecer os dados.[carece de fontes]
- A receita obtida pela publicação de dados permite que organizações sem fins lucrativos financiem outras.[carece de fontes]
- Preocupações com a privacidade pode exigir que o acesso aos dados sejam limitadas a usuários específicos ou a subconjuntos dos dados.[carece de fontes]
- Coletar, “limpar”, gerenciar e disseminar dados são tipicamente processos de trabalho e quem fornece esses serviços devem receber remuneração justa pela prestação desses serviços.[carece de fontes]
Referências
- ↑ Isotani, Seiji, Bittencourt, Ig Ibert; Bittencourt, Ig Ibert (2015). Dados Abertos Conectados. São Paulo: Novatec. 176 páginas. ISBN 978-85-7522-449-6
- ↑ Science Commons
- ↑ Committee on Scientific Accomplishments of Earth Observations from Space, National Research Council (2008). Earth Observations from Space: The First 50 Years of Scientific Achievements. [S.l.]: The National Academies Press. 6 páginas. ISBN 0-309-11095-5. Consultado em 24 de novembro de 2010
- ↑ World Data Center System (18 de setembro de 2009). «About the World Data Center System». NOAA, National Geophysical Data Center. Consultado em 24 de novembro de 2010
- ↑ OECD Declaration on Open Access to publicly-funded data
- ↑ OECD Principles and Guidelines for Access to Research Data from Public Funding
- ↑ «Lei de Acesso à Informação Pública». Consultado em 27 de junho de 2012. Arquivado do original em 9 de setembro de 2014
- ↑ http://www.gazetadopovo.com.br/vida-e-cidadania/futuro-das-cidades/aplicativos-sao-aposta-para-cidades-inteligentes-e-mais-proximas-da-populacao-65i1rj088sutwhbvjiujhxly4
- ↑ «Open data in higher education – the 'next big thing'?» (em inglês). Universities UK. 17 de julho de 2013. Consultado em 15 de maio de 2016
- ↑ «Campus Data Rankings» (em inglês). Campus Data. Consultado em 15 de maio de 2016
- ↑ a b c d Transparência na Esfera Pública Interconectada
- ↑ Para citar exemplos, duas tecnologias que permitem a importação de dados brutos e a exportação de cruzamentos e visualizações, sem necessidade de conhecimentos técnicos específicos: Many Eyes (disponível em http://manyeyes.alphaworks.ibm.com/manyeyes/) e Google Fusion (disponível em http:// tables.googlelabs.com/Home?pli=1). Acesso em Fev/2010
- ↑ «On the road to open data, by Ian Manocha». Consultado em 27 de junho de 2012. Arquivado do original em 29 de março de 2012
- ↑ How to Make the Dream Come True[ligação inativa] argues in one research area (Astronomy) that access to open data increases the rate of scientific discovery.
- ↑ http://www.tom-watson.co.uk/2008/03/power-of-information-new-taskforce-and-speech