Questões éticas do ciclo de vida dos dados

Introdução à ética de dados

Shalini Kurapati, PhD

Co-founder and CEO, Clearbox AI

O ciclo de vida dos dados

  • Em todos os estágios do ciclo de vida dos dados
  • Aquisição de dados: coleta, fornecimento
  • Preparação de dados: limpeza, rotulagem, verificações de qualidade
  • Armazenamento de dados: infraestrutura, segurança, integridade
  • Análise: IA, interpretação, tomada de decisões
  • Retenção/arquivamento
  • Compartilhamento

Ilustração do ciclo de vida dos dados

1 https://www.ibm.com/topics/data-life cycle-management#Data%20life cycle%20management%20and%20IBM 2 Ícone criado por Flat Icons, de www.flaticon.com
Introdução à ética de dados

Aquisição de dados

Ilustração da aquisição de dados de diferentes fontes que fluem para um computador

  • Várias maneiras: pesquisas, aplicativos móveis, sensores, vestíveis, raspagem web, terceiros
  • Permissão para coletar os dados: privacidade, direitos autorais
  • Coleta com propósito: clara sobre o motivo e a quantidade
  • Dados representativos, respeitando o tempo das pessoas
  • Consentimento informado: crucial
  • Verifique seus fornecedores de dados
1 Ícone criado por Parzival 1997, de www.flaticon.com
Introdução à ética de dados

Preparação de dados

Captura de tela de um artigo da revista TIME sobre como os trabalhadores quenianos foram explorados durante a limpeza e rotulagem de dados para melhorar o ChatGPT.

  • Limpeza, rotulagem, anotação: transcrição de arquivos de áudio, rotulagem de texto ou imagens, sinalização de conteúdo inadequado
  • Anotadores humanos: treinamento inadequado, exploração, trabalhadores quenianos para o ChatGPT
  • Inconsistências na qualidade dos dados, rótulos tendenciosos
1 https://time.com/6247678/openai-chatgpt-kenya-workers/
Introdução à ética de dados

Armazenamento de dados

Ilustração de uma configuração de armazenamento seguro de dados

  • Confidencialidade e integridade: evite violações de dados ou perdas acidentais
  • Segurança de dados: sem acesso não autorizado
  • Técnico:
    • Infraestrutura, métodos, técnicas e dispositivos para armazenamento de dados
  • Organizacional:
    • Políticas da empresa, treinamento
1 Ícone criado por HJ studio, de www.flaticon.com
Introdução à ética de dados

Compartilhamento de dados

Mapa indicando os epicentros e a propagação do surto de Covid-19

  • O compartilhamento de dados é necessário para inovação e colaboração, às vezes para monetização
  • Resultado positivo se você for responsável: compartilhamento de dados da Covid
  • Regulamentos de privacidade, direitos individuais
  • Propriedade dos dados, consentimento informado
  • Compartilhamento que preserva a privacidade
1 https://www.ga4gh.org/news/regulatory-ethics-perspective-on-covid-19-data-sharing-an-interview-with-johan-ordish/
Introdução à ética de dados

Vamos praticar!

Introdução à ética de dados

Preparing Video For Download...