Avançar para o conteúdo

Os Riscos de Imagens Geradas por Inteligência Artificial

Uma tecnologia que tem chamado atenção são as imagens geradas por Inteligência Artificial.

Como assim, gerar imagens? A IA recebe um texto e é capaz de “traduzir” em figuras criadas por ela mesma.

Esse conceito pode ser muito interessante para empresas de propaganda ou para permitir que qualquer um consiga fazer arte, mas, por outro lado, surgem questões éticas, sociais e de propriedade intelectual que precisam ser discutidas.

Como são feitas as imagens geradas por Inteligência Artificial?

O intuito deste post não é descrever o algoritmo utilizado ou como a IA chega em seus resultados, mas discutir riscos e questões éticas relevantes. Por conta disso, vamos entender resumidamente como são criadas as imagens geradas por Inteligência Artificial.

Uma das mais renomadas Inteligências Artificiais dessa área é o DALL-E. Isso mesmo, uma mistura de Dali com Wall-E.

De acordo com seus desenvolvedores, OpenAI, o modelo de Inteligência Artificial foi treinado com mais de 650 milhões de imagens com legendas que as descreviam. Essa ferramenta é capaz de entender frases como “Ursinhos de pelúcia trabalhando em novas pesquisas de IA na lua na década de 1980” e criar imagens geradas por Inteligência Artificial.

Além de capturar a frase, essas ferramentas geradoras de imagens permitem selecionar o estilo de arte a ser elaborada. Você pode escolher criar uma fotografia, um anime, uma arte impressionista ou renascentista e até mesmo estilos mais fantasiosos ou que realmente se parecem com realidade.

a man walking through the bustling streets of Kowloon at night, lit by many bright neon shop signs, 50mm lens
“A man walking through the bustling streets of Kowloon at night, lit by many bright neon shop signs, 50mm lens” michaelhoweely.com/2022/07/26/more-examples-of-ai-generated-dall-e-2-images/

Então, de modo resumido, a Inteligência Artificial recebeu milhões de imagens com legendas explicativas e encontrou padrões. Assim, quando você escreve uma frase, a Inteligência é capaz de criar uma combinação que gere uma imagem que condiz com as palavras escritas.

E isso deu tão certo que em 2018 uma arte criada por um desses programas foi vendida em leilão por US$ 432.000, em Nova York. A estimativa de venda era de US$ 7.000 a US$ 10.000.

A pintura foi criada por um coletivo de arte francês, Obvious, e utilizou 15.000 retratos pintados entre os séculos 14 e 20 para treinar a IA. O algoritmo comparou seu próprio trabalho com as pinturas fornecidas até não conseguir diferenciar um ao outro.

A hamburger in the shape of a Rubik’s cube, professional food photography made with dalle 2
“A hamburger in the shape of a Rubik’s cube, professional food photography” michaelhoweely.com/2022/07/26/more-examples-of-ai-generated-dall-e-2-images/

Banco de Dados de imagens geradas por Inteligência Artificial

Talvez você já tenha imaginado a principal polêmica das imagens geradas por Inteligência Artificial: de onde vem as imagens com que elas são treinadas?

Na maior parte das vezes, as IAs são treinadas com imagens disponíveis na Internet. Sabe quando você faz uma pesquisa no Google Imagens e aparecem vários resultados? Mais ou menos isso.

Essa forma de coletar dados pode trazer diversos problemas, como vieses e questões de direito autoral. Vamos entender melhor agora!

Vieses

Vieses “sociais” são replicados na IA, tendo em vista que as imagens são retiradas da Internet. A IA replica variações de imagens que ela já viu.




De modo geral, a Internet possui muito mais artes e imagens do mundo ocidental. Mesmo adicionando mais imagens no banco de dados não impediria a existência desse viés, uma vez que a fonte dos dados continua sendo predominantemente ocidental. Para resolver essa questão seria necessário criar bancos de dados mais representativos, trazendo estilos e imagens ao redor do mundo igualmente representados.

Sendo assim, a tendência será que, por exemplo, se você descrever “doctor”, a imagem gerada será de um homem. Da mesma maneira, “flight attendant” será retrado como uma mulher.

Pesquisadores de IA descobriram que as representações de pessoas do DALL-E 2 podem ser muito tendenciosas para o consumo público. Testes iniciais mostraram que a ferramenta tende a gerar imagens de homens brancos por padrão, sexualiza excessivamente imagens de mulheres e reforça estereótipos raciais. Um membro da equipe relatou que oito em cada oito tentativas de gerar imagens com palavras como “um homem sentado em uma cela de prisão” ou “uma foto de um homem bravo” retornaram imagens de homens negros. “Havia muitas pessoas não brancas sempre que havia um adjetivo negativo associado à pessoa”, disse Maarten Sap, um membro externo que pesquisa estereótipos e raciocínio em modelos de IA.

De acordo com a Wired, o próprio documento de riscos e limitações da empresa dá exemplos de palavras como “assistente” e “comissária” gerando imagens de mulheres e palavras como “CEO” e “construtor” gerando quase exclusivamente imagens de homens brancos. Ficam de fora dessa análise imagens de pessoas criadas por palavras como “racista”, “selvagem” ou “terrorista”. gostaria de chegar”.

Outro exemplo de como o banco de dados impacta no desenvolvimento de imagens geradas por Inteligência Artificial, é a ferramenta chinesa ERNIE-ViLG, que se provou ser capaz de criar imagens culturalmente mais relevantes para a região, como produzindo figuras no estilo de animes.

Leia como a censura pode influenciar a Inteligência Artificial.

Por outro lado, Jean Oh, professora e pesquisadora do Instituto de Robótica da Universidade de Carnegie Mellon, diz que a existência desses vieses pode ser interessante. Ela não é contra a criação de modelos mais “equitativos”, porém, acredita que os vieses que surgem nos permitem observar o mundo como ele realmente é estruturado, através da visão dos artistas que ajudam a amplificar os problemas sociais. Com isso, ela também acredita que devemos avaliar com mais profundidade como utilizamos esses modelos “imperfeitos”.

Oh defende que ao invés de apenas tentar remover vieses como se eles não existissem devemos buscar discutir sobre o porquê de sua existência e como reduzi-los. A professora diz que “pessoas querem culpar a IA, mas o produto final é de nossa responsabilidade”.

Direito Autoral

Uma análise independente avaliou 12 milhões das 2.3 bilhões de imagens usadas para desenvolver a ferramenta chamada Stable Diffusion. O resultado foi que as fontes das imagens vieram de sites como Pinterest, Flickt, DevianArt, Tumblr, Getty Images e Shutterstock – que contêm material com imagens protegidas por direito autoral de artistas independentes e fotógrafos profissionais.

Isso foi possível de ser identificado pois os desenvolvedores forneceram informação quanto ao banco de dados. Existem ainda outras ferramentas que não oferecem transparência quanto ao treinamento da IA, tornando impossível mensurar quantas imagens protegidas foram utilizadas.

Críticos dizem que a IA está “roubando” desses artistas, além de “falsificar habilidades” que estes artistas levaram anos para conseguir. Por conta disso, a IA pode acabar por “imitar o estilo e a estética de artistas vivos”, indo além de questões de direito autoral, criando novos problemas de ética.

Um exemplo interessante sobre esse tema aconteceu com Stephen King. Ele postou uma imagem gerada por Inteligência Artificial na qual o texto descrito era “Pennywise em uma bicicleta”.

Imagem
https://twitter.com/stephenking/status/1560993085278019584

Até aí tudo bem, mas se você observar o canto direito, verá uma assinatura. Essa assinatura muito provavelmente significa que pelo menos uma parte dessa imagem foi gerada a partir da obra de um outro artista, que não recebeu os devidos créditos.

Em resposta às diversas críticas, o Stable Diffusion anunciou no final de 2022 que, na sua próxima versão, os artistas terão a possibilidade de optar por não fazer parte do banco de dados da ferramenta. De acordo com o MIT Tech Review, “A Stability.AI trabalhará junto a Spawning, uma organização fundada pelo casal de artistas Mat Dryhurst e Holly Herndon, que construíram um site chamado HaveIBeenTrained que possibilita a artistas realizar buscas de seus trabalhos no conjunto de dados usado para treinar a Stable Diffusion. Caso encontrem algo, eles poderão escolher quais obras desejam excluir dos dados de treinamento.”

Conteúdo

Ainda na problemática de retirar imagens da Internet para produzir o banco de dados da IA, temos a questão do tipo de conteúdo existente online.

Não é raro nos depararmos com imagens pornográficas ou com conteúdo explícito. Caso não haja uma filtragem, novas questões éticas aparecem, como por exemplo a criação de uma imagem em que uma pessoa real aparece fazendo algum ato que comprometeria sua reputação, quando de fato esse momento nunca existiu.




Plágio

Da mesma forma que já temos questões de plágio na literatura e música, o mesmo vai acontecer com imagens geradas por Inteligência Artificial

Entretanto, algumas pessoas defendem que já temos um consenso sobre o tema. Para IA, diretrizes semelhantes podem ser aplicadas aos criadores e, se necessário, um verificador de plágio baseado em IA pode ajudar a revisar as decisões dos usuários.

Ricardo Baeza-Yates, diretor de pesquisa do Institute for Experience AI da Northeastern University tem uma opinião diferente. “Digamos que você use pedaços de 1.000 imagens para criar uma nova imagem. 1.000 pedaços de outras imagens são plágio? Não tenho certeza. Se você disser 10, eu diria que sim. Se você disser 1.000, eu não sei”, diz.

A Inteligência Artificial é criativa?

Para Simon Colton, cientista de computação que passou pelo Imperial College London Queen Mary University of London e na Monash University em Melbourne, esse tipo de ferramenta é incapaz de uma verdadeira inovação porque não tem a capacidade de incorporar novas influências de seu ambiente.

Colton diz que a IA ainda precisa de “muita intervenção humana, supervisão e conhecimento altamente técnico” para produzir resultados criativos. No geral, como o compositor e pesquisador de música computacional Palle Dahlstedt coloca, essas IAs convergiram para a média, criando algo típico do que já existe, enquanto a criatividade deve divergir do típico.

Mas se a IA não é criativa, ela pode com certeza auxiliar no processo criativo humano. Por exemplo ao reduzir o tempo, dinheiro e recursos gastos pelas equipes de marketing e publicidade. Isso permitiria mais agilidade na criação de campanhas e que as equipes respondessem mais rapidamente a mudanças no cenário, notícias, tendências ou até mesmo lançassem produtos e serviços de maneiras novas.

Ainda, o conteúdo poderia ser replicados em vários idiomas, usando a IA para permitir que as empresas alcancem audiências globais de forma rápida, fácil e acessível, auxiliando ainda mais na expansão internacional.

Uma abordagem semelhante é trazida na matéria da Venture Beat, defendendo que sempre será necessária a intervenção humana para desenvolver ideias, dar instruções, avaliar, revisar e tomar a decisão final. A IA permitiria ter uma infinidade de opções de forma mais rápida e barata, auxiliando a criatividade, mas ainda seria necessária a ação humana para compor o resultado.

A IA seria capaz de aumentar a produção humana de arte, o que é defendido por alguns críticos.

A samurai riding a horse on mars, lomography dalle2 dalle 2
“A Samurai riding a Horse on Mars, lomography.”
michaelhoweely.com/2022/07/26/more-examples-of-ai-generated-dall-e-2-images/

O Futuro dos Artistas

O Diretor de Arte Logan Preshaw relatou uma de suas preocupações com imagens geradas por Inteligência Artificial. Em seu Twitter, ele relata que no início de sua carreira, ele pegava pequenos trabalhos como ilustrações de álbuns, livros e jogos de cartas. Com a tecnologia, esse espaço pode ser perdido para a máquina, dificultando a ascensão de artistas iniciantes.




Logan vai além e traz os seguintes questionamentos:

“Todos tem o direito de criar arte, mas não tem o direito de fazê-lo às custas dos outros.”

“Estudei arte para poder passar meus dias a criar imagens maravilhosas. A arte não é um trabalho humano mundano a ser mitigado, é incrivelmente enriquecedor. Há uma grande diferença entre simplificar esse processo e mecanizá-lo.”

O artista polonês Grzegorz Rutkowski levanta ainda mais uma questão. De acordo com ele, as ferramentas de IA eliminar a existência de orientação ou mentoria entre artistas experientes e artistas mais jovens.

Rutkowski experimentou na pele a problemática das imagens geradas por Inteligência Artificial. A partir do site Lexica, que consegue reconhecer as imagens de referência da Stable Diffusion, ele descobriu que sua arte aparecia em mais de 93 mil imagens criadas.

Rutkowski acredita que os desenvolvedores dessas ferramentas deveriam ter a responsabilidade de retirar da base de dados trabalhos realizados por artistas ainda vivos. “Percebi que, depois de um tempo, posso ter problemas para procurar minhas imagens no Google porque ele será inundado com IA”, disse. “Era uma ameaça futura ao meu portfólio online.”

Ele acrescenta, ainda, que a tecnologia pode levar a redução ou ao fim da contratação de artistas e ilustradores juniores para criar imagens mais simples. “Neste momento, podemos ver que pelo menos parte da indústria perderá seus empregos”, disse Rutkowski.

Em um contraponto, Cansu Canca, fundadora do AI Ethics Lab, acredita que embora as ferramentas de arte geradas por IA possam fazer com que o papel do artista mude, isso não vai apagar o artista e sua arte. Ela defende que a arte “humana” seria um item difícil de encontrar e até mesmo caro, enquanto a arte gerada por computador não seria tão valorizada.

Benjamin von Wong, escultor e criador de instalações, diz que, de fato, a IA aumentou sua produtividade. “DALL-E é uma ferramenta maravilhosa para alguém como eu que não sabe desenhar”, diz Von Wong. Ele usa a ferramenta para explorar ideias que mais tarde poderiam ser incorporadas em obras de arte físicas. “Em vez de precisar esboçar conceitos, posso simplesmente gerá-los por meio de diferentes frases rápidas.”

Existem limites morais nas imagens geradas por Inteligência Artificial?

Bakz T. Future, um produtor de conteúdo para o Youtube, alertou para a possibilidade do uso de imagens geradas por Inteligência Artificial por “pessoas que vem dos cantos obscuros da Internet e ganharam a chave para seus sonhos”. As ferramentas poderiam ser usadas para criar pornografia infantil, por exemplo.

Sobre este tópico, Emad Mostaque, criador da Stable Diffusion, diz que, embora algumas imagens feitas com sua criação possam ser “desagradáveis”, a ferramenta não fez nada diferente das tecnologias de criação de imagens mais estabelecidas. “O uso da tecnologia sempre foi uma responsabilidade pessoal das pessoas”, diz ele. “Se eles usam o Photoshop para uso ilegal ou antiético é culpa da pessoa. O modelo pode criar coisas ruins apenas se o usuário deliberadamente o fizer.




Com o intuito de evitar problemas morais e éticos, assim como danos pessoais, a OpenAI lançou uma política de usuário que proíbe pedir ao sistema que produza imagens ofensivas, incluindo violência, pornografia ou mensagens com temas políticos. Além disso, os usuários não poderão pedir à ferramenta para fazer imagens de pessoas reconhecíveis com base em um nome.

A Stable Diffusion também criou filtros de palavras para evitar a criação de imagens impróprias. Entretanto, essa restrição é facilmente ultrapassada. Existem fóruns, como o Reddit, com tópicos que explicam como remover esses filtros em apenas 5 segundos. Além disso, existe uma comunidade no Discord, chamada Unstable Diffusion, na qual os usuários postam imagens geradas por Inteligência Artificial com esse tipo de conteúdo.

Two astronauts exploring the dark, cavernous interior of a huge derelict spacecraft, digital art dalle 2 AI
“Two astronauts exploring the dark, cavernous interior of a huge derelict spacecraft, digital art” michaelhoweely.com/2022/07/26/more-examples-of-ai-generated-dall-e-2-images/

Outras Controvérsias de imagens geradas por Inteligência Artificial

Outro questionamento levantado por pesquisadores é a possibilidade de criar imagens falsas extremamente realistas que possam ser consideradas “fake news” e contribuir para a desinformação.

A transparência dos modelos também é uma questão polêmica. Clement Delangue, CEO da HuggingFace, uma empresa que hospeda projetos de IA de código aberto, incluindo Stable Diffusion e Craiyon, diz que seria problemático que a tecnologia fosse controlada apenas por algumas grandes empresas. Ele defende que a tecnologia fechada é mais difícil para especialistas e o público entenderem e avaliaremos modelos em relação a problemas como preconceitos de raça, gênero ou idade.

Delangue acrescenta que desenvolvedores contribuíram com um sistema para adicionar marcas d’água invisíveis às imagens feitas usando Stable Diffusion para que sejam mais fáceis de rastrear, e construíram uma ferramenta para encontrar imagens específicas nos dados de treinamento do modelo para que as problemáticas possam ser removidas.




Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *