Avançar para o conteúdo

Deserto de Dados

Discussões sobre algoritmos enviesados, correto tratamento de dados e tecnologias inclusivas tem tomado conta das notícias, podcasts, eventos e conferências online em todo o mundo.

Um dos motivos de termos essa situação problemática no desenvolvimento de tecnologias é o chamado Deserto de Dados.

O que é Deserto de Dados?

Pouco adianta ter tecnologia, profissionais empenhados e recursos para criar inteligências artificiais inovadoras se não temos dados para treiná-las!

O deserto de dados é exatamente isso, a falta de dados confiáveis e completos sobre determinado assunto. Geralmente, quem fica de fora são populações mais vulneráveis e minorias. Também pode existir falta de informação em determinados locais, como bairros mais periféricos.

A existência de desertos de dados significa que há dados que não são contabilizados. Histórias que não são contadas. Realidades que não são retratadas.

Isso também potencializa interpretações incorretas e discriminatórias sobre grupos ou assuntos que se tem pouquíssima ou nenhuma informação.

Essa falha causada por desertos de dados gera conclusões baseadas na generalização de grupos e tem consequências sociais muito sérias. Decisões são tomadas sem considerar esses grupos ou considerando-os de forma incorreta!

O trabalho com dados incorretos e incompletos gera, por exemplo, avanços desiguais no tratamento de doenças, políticas públicas que não compreendem ou solucionam a raiz dos problemas e investimentos em áreas menos prioritárias e acarretar em “falácia/inversão do acidente”.

A subnotificação e os registros incompletos e despadronizados podem impactar a identificação de situações de vulnerabilidade por impedir de se enxergar o panorama real da situação, tornando ainda mais difícil encontrar soluções confiáveis e buscar correlações com outros indicadores sociais.


Leia também:

6 Dimensões de Qualidade de Dados

Infoxication

Metodologias CRISP-DM e SEMMA

Integração de Dados


Por que Desertos de Dados acontecem?

Difícil acesso a serviços digitais e de comunicação por determinados grupos e locais

Sem acesso aos serviços e sistemas que coletam e armazenam dados, esses grupos não podem colaborar oferecendo dados sobre eles próprios. A disparidade de acesso a internet e a tecnologia e o nível de literacia digital devem sempre ser considerados.

É preciso pensar soluções diferentes para realidades diferentes, e que também gerem engajamento desses grupos! Temos que ter a ferramenta adequada e mobilizar para o seu uso, com uma linguagem acessível e que caiba na cultura do grupo que buscamos mais informações. Não podemos deixar que esses grupos sejam esquecidos e tenham dificuldade para se desenvolver devido aos desertos de dados.

Um exemplo interessante é Cocôzap. O Cocôzap se uniu com 2 mobilizadoras que vivem no Complexo da Maré e, partir de comunicações pelo Whatsapp, reúne informações sobre acesso ao saneamento básico, presença de focos de esgoto a céu aberto e acúmulo de lixo no local.

As mobilizadoras conversaram com lideranças locais e moradores para que estes ajudassem na coleta e envio de dados de forma simples, por meio de mensagem de texto, áudio ou vídeo, ou no site do projeto. Agora, os moradores são mais participativos e consciente das condições do local onde moram. Isso é empoderamento!

Entenda mais sobre o processo aqui.

Agregação de dados

Seja por conveniência, desconhecimento ou realmente por falta de dados, muitas informações são guardadas em níveis de agregação/granularidade incompatíveis para a solução com que vão contribuir. Isso pode criar generalização de grupos e discriminação, criando desertos de dados.

Por exemplo, na prevenção de desastres, existem algumas maneiras de realizar a predição de eventos como deslizamentos e enchentes através da análise de eventos anteriores. Entretanto, cada local tem suas características físicas e geológicas, de modo que a predição para uma parte da cidade não pode ser repetida exatamente da mesma forma para outras.

E se imaginássemos uma inteligência artificial que definiria o tipo de programa de assistência a se oferecer para uma pessoa? Vamos supor 2 pessoas: mulheres, pobres, na mesma faixa etária e estrutura familiar semelhante, residentes no mesmo país e compartilhando os mesmos valores. Era de se imaginar que a mesma assistência seria oferecida para para as duas mulheres, não é? Mas, se desagregamos um pouco mais os dados de onde essas mulheres moram, percebemos que uma delas mora numa área rural, com baixo índice de alfabetização e predominantemente agrícola, enquanto a outra habita uma região tecnológica e industrial, com altos índices de empregabilidade… Bom, digamos que a assistência que elas precisam são bem diferentes mesmo…

Também podemos lembrar, tanto para problemas sociais e de negócios, que muitas vezes somos divididos apenas pelo gênero “homem” ou “mulher”, não levando em consideração outros fatores que podem influenciar nossos modelos, como cor, idade, background e outras preferências.

Esse tipo de coleta de dados geralmente consome mais tempo e recursos mas é capaz de reduzir a presença de desertos de dados.

Como evitamos o Deserto de Dados e criamos um Oásis?

Para evitar os desertos e criarmos oásis temos que pensar na gestão de dados, desde a coleta, passando pela limpeza e análise. Algumas soluções dentro da gestão de dados são:




Humanização dos dados

O primeiro passo para evitar desertos de dados é lembrar que por trás de cada linha de informação temos uma pessoa com nome, gênero, cor, sonhos, desejos e ideias; ou um local com características próprias, interações únicas entre sua população e necessidades específicas.

Precisamos humanizar nossas análises e lembrar de que a máquina não tem a nossa capacidade de interpretação e não sabe lidar com informações novas sem ter sido treinada.

Conscientização

Em especial em setores públicos, é preciso aumentar os esforços para a captação de dados de população normalmente sem representação e de difícil acesso. Garantir a representação de toda população ou local é essencial para evitar desertos de dados.

Informar limitações

Ao publicar banco de dados, deixar claro quais são as limitações na coleta e processamento de dados, além de problemas na representatividade. Indicar grupos não representados ou subrepresentados é uma forma de alertar a existência de desertos de dados.

Conversar com grupos subrepresentados

Conheça os grupos que fazem parte do deserto de dados. Entenda sua cultura, seus desejos, seus medos, suas desconfianças. Converse com lideranças comunitárias e descubram como engajar o grupo e inserir a tecnologia no seu dia a dia, de modo que a tecnologia seja uma solução e não um agente de segregação.

Identificar os problemas e avaliar as soluções adotadas

Entenda onde existe falta de informações e quais grupos são abrangidos, além de identificar o que está sendo feito atualmente que não supre as necessidades desses grupos. Busque as metodologias de coleta e perceba o que não está funcionando. Pesquise soluções implantadas em outros locais que deram certo e adapte-as para o seu caso.




Referências:

Datassist

Data Innovation

Data Innovation

Instituto Igarapé

2 comentários em “Deserto de Dados”

  1. Pingback: 5 Livros de Governança de Dados para Inciantes - Diário de Dados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *