Os sistemas de reconhecimento facial são desenvolvidos com fotos reais para oferecerem comparações precisas. Em alguns casos, as fotos são coletadas de serviços como redes sociais sem o consentimento dos usuários. Para alertar sobre a prática, o site Exposing.ai permite verificar se as suas imagens foram usadas em algum desses sistemas.
A ferramenta permite comparar imagens armazenadas no Flickr com os conjuntos de dados usados em reconhecimento facial. Para conferir se sua imagem está em um dos conjuntos, basta acessar um link e usar URL ou ID da foto no Flickr, seu nome de usuário no serviço ou tags usadas na foto.
Em seguida, o site busca correspondentes idênticas nos mais de dez conjuntos que possui informações. A pesquisa não usa armazenamento facial, nem armazena dados pessoais durante a pesquisa.
Conjuntos de dados para reconhecimento facial
Os conjuntos de dados (ou data sets) costumam ser criados por empresas, universidades e governos, e reúnem milhares de imagens públicas coletadas na internet. Em alguns casos, o conteúdo é compartilhado livremente com terceiros.
Um desses casos aconteceu com um conjunto de dados criado em 2015 por professores da Universidade de Washington sem consentimento das pessoas que aparecem nas imagens. O MegaFace, como é chamado, foi criado como material de apoio para uma competição acadêmica relacionada a sistemas de reconhecimento facial.
Depois da competição, porém, o material foi liberado para terceiros desenvolverem as suas soluções de reconhecimento facial. O conteúdo chegou a 6 mil downloads, incluindo tanto alunos, quanto empresas e governos. Entre elas, estão a ByteDance, dona do TikTok, e a Northrop Grumman, que presta serviços de defesa ao governo dos Estados Unidos.
O MegaFace foi descontinuado em junho de 2020 e seus dados não são mais distribuídos pela universidade. No entanto, o alcance que ele continua registrando é incerto. Isso porque o criador dos conjuntos de dados não tem controle sobre cópias e modificações criadas a partir do conteúdo original.
Exposing.ai
Os criadores do Exposing.ai indicam que o site poderá suportar outras fontes de imagens em breve, mas, por enquanto, aceita apenas as do Flickr. O serviço foi escolhido por ter sido um dos mais utilizados para criar os conjuntos de dados para reconhecimento facial que hoje circulam na internet.
O Flickr permite coletar fotos publicadas com a licença Creative Commons, que permite a terceiros usarem o material em seus projetos. Em 2014, algumas dessas imagens foram usadas pelo Yahoo, então proprietário da plataforma, para desenvolver sua ferramenta de visão computacional. Desde 2018, o serviço é da SmugMug.