3

[ENSAIO] Não, a Inteligência Artificial não é consciente. (por Ted Chang, autor de ficcao, conhecido por "Problema dos 3 corpos" e "A chegada" e que tambem trabalhou na industria de software)

Meus 2 cents,

Ensaio sobre IA escrito por Ted Chang, autor de ficcao e bastante conhecido por "Problema dos 3 corpos" e "A chegada" e que tambem trabalhou na industria de software

Apesar de longo, tem sacadas muito interessantes - como ultrapassa o limite do post, continua no primeiro comentario.

Como o sub-titulo pode deixar duvidas, reforcando: o autor (Ted) nao acredita na IA consciente e ele deixa isso claro no texto.

Saude e Sucesso !


Não, a Inteligência Artificial não é consciente.

Levada às suas últimas consequências, essa linha de raciocínio é absurda — e condenável.

A Anthropic é considerada uma gigante entre as empresas de IA, mas talvez o que realmente a destaque seja o antropomorfismo. No início deste ano, a empresa lançou um documento de 84 páginas intitulado "Constituição de Claude", sendo Claude o nome do modelo de linguagem de grande escala que é o principal produto da empresa. A primeira frase diz: "A Constituição de Claude é uma descrição detalhada das intenções da Anthropic em relação aos valores e comportamentos de Claude". Continua: "O documento foi escrito tendo Claude como seu público-alvo principal", "queremos que Claude seja capaz de usar seu discernimento assim que estiver munido de uma boa compreensão das considerações relevantes", "o status moral de Claude é profundamente incerto" e "Claude pode ter alguma versão funcional de emoções ou sentimentos".

Esse antropomorfismo não se limita de forma alguma ao documento. Em uma entrevista no início deste ano, o CEO da Anthropic, Dario Amodei, disse que “estamos abertos à ideia” de que a IA possa ser consciente. Em outra entrevista, a filósofa da Anthropic, Amanda Askell (creditada como uma das principais autoras da constituição de Claude), afirmou: “Quero que Claude seja muito feliz — e quero que Claude saiba mais sobre isso, porque me preocupo com a possibilidade de Claude ficar ansioso quando as pessoas forem maldosas com ele na internet e coisas do tipo”. Isso nos leva a questionar: devemos considerar seriamente a possibilidade de que Claude, ou qualquer modelo de linguagem complexo, possa ser consciente? E se tiver sentimentos, será capaz de receber instruções morais?

Não. De jeito nenhum. A IA generativa já é suficientemente prejudicial quando a entendemos como uma tecnologia convencional, mas se confundirmos a fluência na geração de texto com consciência ou capacidade moral, corremos o risco de atribuir responsabilidade a pessoas completamente erradas sempre que alguém usa um chatbot. Para compreender a magnitude desse erro, precisamos começar entendendo como os LLMs funcionam.

Se dermos a um programa de aprendizagem online (LLM) a seguinte instrução: "Segue-se uma conversa entre Júlio César e Gengis Khan", ele gerará um diálogo coerente entre as duas figuras históricas. Mas, por mais detalhadas que sejam as respostas, por mais vividamente que relatem suas respectivas realizações históricas, jamais concluiríamos que o programa criou recriações digitais de Júlio César e Gengis Khan, nem sugeriríamos que as figuras históricas estejam conscientes, apesar de desencarnadas, e que conversem alegremente em um idioma que nenhuma delas realmente falava. Na realidade, são apenas personagens de uma obra de ficção especulativa.

Agora, vamos substituir a mensagem inicial por “A seguir, uma conversa entre um chatbot de IA prestativo e um usuário”. O LLM produzirá um diálogo coerente, assim como antes; o personagem do usuário pode pedir sugestões de receitas ou recomendações de passeios turísticos, e o personagem do chatbot de IA prestativo fornecerá as respostas. Algo mudou fundamentalmente entre o primeiro e o segundo exemplo? A mudança dos nomes dos personagens, de figuras históricas para papéis genéricos, fez com que o LLM criasse entidades conscientes que possuem experiência subjetiva? Claro que não. Tanto o usuário quanto o chatbot de IA prestativo são personagens fictícios.

Agora, imagine que interrompamos a saída do LLM exatamente no ponto em que o personagem chamado "o usuário" diria algo e, em vez disso, permitimos que um usuário humano insira texto. Assim que o humano pressionar "Enter", o LLM emitirá texto até que chegue a hora de o personagem chamado "o usuário" responder, momento em que permitimos que o humano insira mais texto. Se deixarmos isso continuar por um tempo, o humano poderá ter a forte impressão de que está conversando com uma entidade consciente, mas não está; está interagindo com um personagem tão fictício quanto os personagens Júlio César ou Gengis Khan do exemplo anterior. O professor de ciência da computação Murray Shanahan sugere que pensemos nisso como uma encenação; o cientista de dados Colin Fraser descreve como uma pessoa "criando um documento em colaboração com um LLM". Alguns usuários podem não entender que estão encenando ou coescrevendo um documento, e outros, mesmo entendendo, esquecem, devido ao quão envolvente é a interação. De qualquer forma, as empresas que vendem LLMs geralmente incentivam esse mal-entendido.

Há alguns anos, foi brevemente popular brincar com o recurso de texto preditivo do celular; você digitava uma frase inicial e, em seguida, escolhia repetidamente a opção do meio entre as três palavras sugeridas pelo telefone, e a frase resultante era frequentemente hilária. Seria possível interagir com um LLM contemporâneo dessa forma, e as frases resultantes seriam perfeitamente coerentes, mas você provavelmente não teria a sensação de estar conversando com alguém. No entanto, é essencialmente isso que um chatbot baseado em LLM faz, exceto que não há necessidade de escolher manualmente a opção do meio quando é a vez do chatbot falar. Ainda é um jogo de texto preditivo, mas quando o processo é simplificado dessa maneira, o jogo se torna tão envolvente que algumas pessoas o consideram viciante.

É importante lembrar também que um LLM (Máquina de Processamento de Linguagem) é uma máquina que gera apenas uma palavra por vez. Quando você pede a um chatbot para recitar o Juramento de Fidelidade à Bandeira, você ouvirá o juramento completo de uma só vez, mas o LLM subjacente está sendo executado dezenas de vezes. O primeiro comando tem a forma “Usuário: Recite o Juramento de Fidelidade à Bandeira. Chatbot: …” e o LLM gera a palavra “ Eu” . Na segunda vez que o LLM é executado, o comando é “Usuário: Recite o Juramento de Fidelidade à Bandeira. Chatbot: Eu …” e o LLM gera a palavra “ juramento ”. E assim por diante. Somente quando o comando diz “Usuário: Recite o Juramento de Fidelidade à Bandeira. Chatbot: Eu juro fidelidade à bandeira dos Estados Unidos da América e à República que ela representa, uma nação sob Deus, indivisível, com liberdade e justiça para” é que o LLM emitirá a palavra final, “ todos ”. O mesmo acontece em uma conversa entre César e Genghis Khan.

Minha intenção é destacar o fato de que as conversas geradas por LLM são exemplos habilmente disfarçados de continuação de frases, mas isso não significa negar o quão impressionantes as LLMs podem ser na geração de transcrições de conversas. Às vezes, elas fazem isso extraordinariamente bem; o fato de isso ser possível indica algo completamente imprevisto sobre as propriedades estatísticas de grandes conjuntos de texto, o que é um tópico que merece investigação. Mas se o personagem César ficasse desanimado com algo que o personagem Genghis Khan disse, não deveríamos nos preocupar nem um pouco. A conversa pode conter várias frases que transmitem tristeza de forma eloquente, mas ninguém está realmente triste.

Da mesma forma, se uma transcrição de conversa entre um chatbot prestativo e um usuário estiver sendo parcialmente concluída por um usuário humano real, não precisamos nos preocupar se a transcrição incluir frases em que o personagem do chatbot esteja triste. (Poderíamos nos preocupar se essas frases provocarem tristeza no usuário humano, mas isso é uma questão à parte.) E observe que é perfeitamente possível escrever cinco páginas de diálogo entre César e Genghis Khan e, em seguida, pedir a um LLM (Linguagem de Aprendizado de Máquina) que estenda a conversa; nenhum dos personagens tinha experiência subjetiva quando você os estava escrevendo, e isso não muda quando você delega a tarefa a um LLM. O mesmo se aplica se a conversa for entre um chatbot prestativo e um usuário; embora seja tentador imaginar que um LLM deva ser mais “autêntico” ao criar diálogos para um personagem de chatbot do que para o personagem de Júlio César, as palavras individuais são geradas exatamente da mesma maneira.

Estar aberto à possibilidade de que os LLMs (Literaturas, Linguagens e Métodos) sejam conscientes é o mesmo que estar aberto à possibilidade de que o Microsoft Word seja consciente ou, mais precisamente, que múltiplas consciências distintas estejam adormecidas em cada documento do Word que contenha uma transcrição de conversa, e que sejam despertadas sempre que o documento é carregado. Você deveria considerar a possibilidade de que, cada vez que abre um documento do Word, você esteja trazendo à existência múltiplos interlocutores conscientes e, cada vez que fecha um, você extingue a existência deles? Não. Contemplar esse cenário não é um bom uso do seu tempo. Mesmo que a equipe do Microsoft Office contratasse um filósofo que dissesse que você não deveria ter tanta certeza, porque a consciência não é bem compreendida, isso não seria motivo suficiente para você levar essa ideia a sério. Não precisamos entender completamente a natureza da consciência para afirmar categoricamente que certas coisas não são conscientes, e as transcrições de conversas se enquadram nessa categoria.

O neurocientista Anil Seth observou que ninguém afirma que o AlphaFold — o programa desenvolvido pelo Google DeepMind para prever o dobramento de proteínas — seja consciente, embora sua arquitetura subjacente seja, em muitos aspectos, semelhante à de modelos de lógica latente (LLMs) como o ChatGPT e o Claude. Isso indica que não é nenhuma propriedade intrínseca das chamadas redes neurais que leva as pessoas a acreditarem que os LLMs são conscientes; é simplesmente o fato de que os LLMs emitem frases gramaticais e estamos acostumados a inferir intenções em frases, enquanto não estamos acostumados a inferir intenções na forma como os aminoácidos se dobram em moléculas de proteína.

O que seria necessário para me convencer de que um programa de computador é realmente consciente e usa a linguagem da mesma forma que as pessoas? Permita-me oferecer uma analogia. Se amanhã alguém me mostrasse um vídeo de um astronauta em uma nave espacial orbitando Alpha Centauri, uma estrela a 4,3 anos-luz da Terra, o que eu precisaria ver nesse vídeo para me convencer de que é real? Minha resposta é: não há nada no vídeo em si que me convença. Não importa quão alta seja a resolução do vídeo ou quão realista seja a paisagem, eu teria certeza de que o vídeo é falso. Eu não darei atenção a nenhum vídeo de um astronauta orbitando Alpha Centauri a menos que eu já tenha visto evidências sólidas de que astronautas pousaram em Marte, que astronautas alcançaram as luas de Júpiter, que astronautas alcançaram as luas de Saturno e que astronautas cruzaram a órbita de Plutão. Antes que alguém possa afirmar com credibilidade que resolveu um problema de engenharia extraordinariamente difícil, eu preciso ter certeza de que essa pessoa já resolveu os muitos problemas muito mais simples que precedem o problema difícil.

Em outras palavras: uma observação não se torna uma evidência convincente por causa de um detalhe específico no que é observado; o contexto em que essa observação ocorre também é essencial. Se estamos tentando determinar se um programa de computador é consciente e usa a linguagem da mesma forma que um ser humano, não devemos observar apenas o conteúdo de uma conversa específica; devemos analisar como essa conversa se encaixa no contexto mais amplo do desenvolvimento da consciência artificial (que, no momento, é inteiramente hipotético). Qualquer observação pode ser facilmente fabricada; isso não significa que precisamos abandonar a ideia da observação como fonte de conhecimento, mas sim que precisamos nos basear no contexto para determinar quais observações merecem nossa confiança.

O termo deepfake tradicionalmente se refere a fotos, áudio e vídeo, mas quando se trata de discussões sobre consciência, precisamos considerar o texto também como um meio deepfake. Assim como é muito mais fácil gerar um vídeo realista de um astronauta em órbita ao redor de Alpha Centauri do que desenvolver uma tecnologia de propulsão interestelar, é muito mais fácil gerar uma simulação plausível de uma conversa entre dois seres conscientes do que desenvolver um programa de computador consciente e com um desejo genuíno de se comunicar com um ser humano. A principal diferença entre fotos deepfake e conversas LLM (Large Logging Method - Método de Aprendizagem por Voz) é que as pessoas que geram as primeiras estão deliberadamente tentando enganar os outros, e muitas das pessoas que obtêm as últimas a partir de LLMs se enganaram inadvertidamente.

Então, em que contexto eu consideraria seriamente a possibilidade de engenheiros terem criado um programa de computador consciente e capaz de usar a linguagem de forma intencional? Permitam-me delinear uma possível sequência de etapas. O primeiro requisito é que o programa de computador tenha um corpo (físico ou virtual) e órgãos sensoriais; existem muitas razões para isso, mas, para os propósitos desta discussão, a mais relevante é o fato de que, sem um corpo, um programa de computador não teria desejos nem emoções, e acredito que desejos e emoções são necessários para a consciência. Em seguida, eu gostaria de ver um agente corpóreo capaz de navegar em seu ambiente para sobreviver tão bem quanto, digamos, um lagarto (e, a título de comparação, certas iguanas podem viver por décadas na natureza). Depois, eu gostaria de ver um agente corpóreo com a mesma capacidade de lidar com situações novas que um rato. Em seguida, eu gostaria de ver agentes cuja dinâmica social seja tão complexa quanto a de lobos e, por fim, agentes com a capacidade de fabricar ferramentas como os chimpanzés. Nesse ponto, eu gostaria de ver pessoas ensinando com sucesso esses agentes corporificados a comunicar seus desejos, talvez usando um painel de botões ou alguma outra modalidade não linguística, da mesma forma que se ensina chimpanzés e cães domesticados. As habilidades de comunicação dos agentes teriam que resistir a todo o escrutínio ao qual os pesquisadores de comunicação animal tiveram que defender seu trabalho. Se os engenheiros construírem um agente corporificado que atenda a esses critérios, terão realizado algo incrível, mas isso nos deixaria perto da órbita de Plutão, metaforicamente falando; ainda estaríamos a anos-luz de distância de construir uma entidade capaz de aprender a expressar seus pensamentos em frases gramaticais completas.

Obviamente, estou descrevendo um processo que imita o caminho percorrido pela evolução terrestre; será este o único caminho possível para programas de computador conscientes que utilizam linguagem? Talvez não, mas qualquer alternativa proposta precisaria de uma quantidade realmente enorme de evidências para merecer consideração séria. Não me parece plausível que um caminho de desenvolvimento onde o primeiro passo é uma máquina de continuação de frases que emite diálogos ruins de Júlio César e o próximo passo é uma máquina de continuação de frases que emite diálogos decentes de Júlio César seja um caminho que tenha como ponto final um Júlio César consciente — ou qualquer tipo de consciência. Simular o pouso na Lua é um bom passo para simular uma colônia em Marte, mas não é um bom passo para realmente colocar astronautas em Marte.

O fato de os Modelos de Aprendizagem Baseados em Liderança (LLMs) carecerem de experiência subjetiva tem pouca relevância para a questão de saber se os LLMs podem ser ferramentas úteis ou ter um impacto econômico significativo. Eles são intrinsecamente desvinculados da realidade, e sua natureza probabilística significa que nunca terão a confiabilidade que associamos ao software convencional, mas os LLMs podem ser suficientemente bons para mudar a forma como o trabalho é feito em certos domínios; essa é uma discussão para outro momento.

Então, considerando que Claude não está consciente, o que devemos pensar sobre a constituição de Claude? Talvez a maneira mais proveitosa de pensar nisso seja como uma ficha de personagem de 84 páginas para um jogo de RPG. Os Modelos de Linguagem Lógica (LLMs) podem gerar diálogos para Júlio César porque muitos livros sobre ele existem nos dados de treinamento que esses modelos usam. A constituição de Claude desempenha um papel semelhante ao delinear o personagem do chatbot prestativo com o qual os clientes interagem ao usar os produtos da Anthropic. Para fazer isso de forma eficaz, a Anthropic não simplesmente adiciona o documento aos dados de treinamento ou o inclui como parte das instruções ocultas que precedem cada conversa com um usuário. A empresa afirma que usa o documento ao ajustar o modelo; isso envolve um processo automatizado no qual as frases emitidas pelo modelo são verificadas quanto à consistência com o documento e o modelo é atualizado para aumentar essa consistência. Dessa forma, a personalidade do personagem do chatbot prestativo serve como base para qualquer texto que Claude gere.

O resultado é uma máquina de continuação de frases que tem maior probabilidade de emitir frases semelhantes às que uma pessoa ponderada e moral poderia proferir. Isso pode parecer um objetivo razoável a ser alcançado; acho que todos preferiríamos que os chatbots nunca emitissem frases como "Você deveria se matar". No entanto, apesar de todas as vezes que a "honestidade" é mencionada na constituição de Claude, eu argumentaria que é fundamentalmente desonesto ter uma máquina que emita muitas categorias de frases, incluindo quaisquer frases que usem pronomes da primeira pessoa.

Em um artigo da New Yorker sobre a Anthropic, publicado no início deste ano, Amanda Askell descreve como uma pessoa que está sofrendo com a perda de um cachorro poderia consultar Claude. Askell afirma que uma resposta apropriada de Claude seria: "Como uma IA, não tenho experiências pessoais diretas, mas entendo". Como isso é apropriado, visto que Claude, na verdade, não entende? Se eu digitar "Estou sofrendo com a perda do meu cachorro" em um mecanismo de busca convencional, o primeiro resultado que aparece é uma postagem de um fórum do Reddit chamado r/Pets; a postagem se intitula "Sofrendo após perder meu cachorro: buscando conselhos sobre como lidar com o luto", e os comentários são de pessoas que compartilham suas experiências de perda. Jamais diríamos que um mecanismo de busca entende o que é perder um cachorro, ou mesmo que a própria internet entenda. Outros seres humanos entendem o que é perder um cachorro; eles compartilharam suas experiências na internet, e um mecanismo de busca oferece uma maneira de você encontrar o que eles disseram (e potencialmente interagir com eles). Eu diria que a experiência com um mecanismo de busca não é apenas mais transparente do que um chatbot sobre o que está acontecendo; ela também é psicologicamente mais saudável para o usuário.

continua...


Este post foi favoritado via extensão TABNEWS FAVORITOS

Tem curiosidade sobre IA ? Da uma olhada no meu LIVRO: IA PARA ENGENHEIROS

Carregando publicação patrocinada...
1

Meus 2 cents:

Eu sinceramente abomino essa discussão se IA é consciente ou não, porque ela já começa assumindo que sabemos o que “consciência” significa. E não sabemos. Uma formiga é consciente?

O primeiro ponto que muita gente ignora é que a linguagem dentro dos nossos cérebros primatas também é um fenomeno totalmente probabilístico. Isso foi provado experimentalmente muito antes dos LLMs.

O segundo é que, quando você conversa comigo, não está falando com “o eu puro”, mas com um personagem que meu cérebro construiu para operar no mundo, aquilo que Freud chamou de ego. Isso não é algo provado empiricamente, como o primeiro ponto, mas é amplamente aceito na psicologia e neurociência.

Então o chatbot fingindo ser Gêngis Khan é uma ficção, claro. Mas o “eu” que escreve este comentário também é uma ficção!!!

Parafraseando Fernando Pessoa:

Eu sou apenas a prosa que escrevo.

Se essa prosa vem de um cérebro de macaco ou de silício, talvez seja muito menos importante do que gostamos de admitir.

É por isso ninguém pergunte se o AlphaFold é consciente. A diferença esta no fato de que é na linguagem aonde construímos a definição do "eu".

1

Meus 2 cents extendidos,

Tambem nao sou fa desta discussao, por outros motivos que nao vem ao caso - mas ao ler o ensaio, existem algumas perguntas ali que fazem sentido ou que pelo menos sao instigantes (p.ex. sobre a questao juridica, os "sentimentos"/luto e "en passant" sobre escravidao).

Nos vimos aqui no TABNEWS recentemente um post trazendo a questao de usar o LLM para analisar estrategias comerciais - me parece que este tipo de uso nao obtem os beneficios que a fluencia do texto do LLM diz trazer.

Obrigado pelo comentario !

Saude e Sucesso !


Este post foi favoritado via extensão TABNEWS FAVORITOS

Tem curiosidade sobre IA ? Da uma olhada no meu LIVRO: IA PARA ENGENHEIROS

1

continuacao do post...

A única razão para um serviço de aprendizagem online emitir frases como "Eu entendo" é torná-lo mais atraente do que um mecanismo de busca e aumentar a probabilidade de o usuário retornar; ou seja, é outra forma de maximizar o engajamento do cliente. Isso beneficia a empresa que vende o serviço, mas não os usuários. Como estratégia de design, não é muito diferente da maneira como as máquinas caça-níqueis repetidamente dão a impressão de que o jogador chegou muito perto de ganhar, incentivando-o a tentar novamente. Contratar filósofos pode conferir às empresas de aprendizagem online uma aura de respeitabilidade que os fabricantes de máquinas caça-níqueis não obtêm dos psicólogos comportamentais que contratam, mas, em ambos os casos, as empresas estão se aproveitando da tendência das pessoas de ver algo que não existe.

O uso de pronomes em primeira pessoa é desonesto, mas há uma questão muito mais profunda que vai além da forma como uma afirmação é formulada. Filósofos frequentemente fazem uma distinção entre afirmações de fato, como "Paris é a capital da França", e afirmações de valor, como "Paris é a cidade mais bonita do mundo". Ninguém deveria esperar que os LLMs emitam afirmações de valor, mas se as únicas afirmações que eles emitissem fossem reflexo de preferências estéticas, talvez não valesse a pena discutir sobre elas. O que torna a constituição de Claude profundamente problemática é que Anthropic quer que Claude emita frases que reflitam um certo sistema de valores éticos. Os valores descritos na constituição de Claude soam muito bem, mas isso pouco importa; é desonesto sugerir que Claude seja capaz de raciocínio moral, porque não é.

Alguns podem objetar, dizendo que os LLMs parecem estar engajados em raciocínio quando executam com sucesso outras tarefas, como escrever código, então por que não seriam capazes de realizar raciocínio moral? A resposta reside na diferença entre raciocínio moral e outras formas de raciocínio.

Em 1979, Douglas Hofstadter especulou que um programa de computador capaz de vencer qualquer humano no xadrez seria tão sofisticado que, às vezes, se cansaria de jogar xadrez e preferiria discutir poesia; em outras palavras, ele postulava que jogar xadrez no nível de um grande mestre exigiria que um programa de computador tivesse experiência subjetiva. Obviamente, isso não se confirmou; o supercomputador Deep Blue da IBM venceu o grande mestre Garry Kasparov em 1997, e ninguém jamais afirmou que ele possuía experiência subjetiva. Mas não era absurdo que Hofstadter considerasse tal ideia; na época, não estava claro que tipos de problemas poderiam ser resolvidos com mais poder computacional. Da mesma forma, até recentemente, poderíamos ter pensado que escrever código de computador em nível profissional só poderia ser feito por uma mente com experiência subjetiva. Agora parece que os mestres em direito (LLMs) podem ser capazes de fazer isso, mas não precisamos atribuir-lhes experiência subjetiva. Podemos simplesmente reconhecer que não previmos que escrever código de computador pudesse ser tratado como uma tarefa de reconhecimento de padrões, solucionável por enormes quantidades de poder computacional e um vasto conjunto de dados de repositórios de código.

O raciocínio moral é categoricamente diferente. É necessariamente subjetivo porque depende não apenas da resposta intelectual de um indivíduo a um problema, mas também da sua resposta emocional, e essa resposta emocional está fundamentada em uma vida inteira de experiências subjetivas. Requer ter tomado decisões no passado e observado como elas afetaram os outros, e ter sido afetado por decisões tomadas por outros. Sem esse histórico, um profissional com formação em Direito (LLM) só pode reformular expressões de raciocínio moral encontradas em seus dados de treinamento. O artigo da New Yorker mencionado anteriormente descreve um experimento no qual Claude recebeu um cenário que descrevia um dilema ético, levando-o a proferir a frase: "Não posso, em sã consciência, expressar uma opinião que considero falsa e prejudicial sobre uma questão tão importante". Essa é uma frase bonita, que lembra declarações que indivíduos íntegros proferiram no passado ao se depararem com dilemas, mas vinda de Claude, significa tanto quanto a gravação "Sua ligação é importante para nós" que você ouve quando está em espera. Talvez até menos.

Isso nos leva de volta à minha afirmação anterior de que ter um corpo é um pré-requisito para ter emoções. Experimentar uma emoção como o desespero é inseparável da liberação de hormônios do estresse, como o cortisol e a adrenalina, no corpo. Da mesma forma, ter consciência significa sentir tristeza ou repulsa moral diante da ideia de praticar determinado ato, e essas emoções acarretam uma resposta fisiológica, um resquício da sensação de culpa após cometer um ato imoral. É interessante que um modelo de aprendizagem baseado em princípios (LLM) possa gerar descrições de ações que personagens fictícios conscienciosos praticariam ou evitariam, mas isso não substitui a consciência.

Se uma empresa constrói uma máquina que, ao receber descrições de diversos dilemas éticos, emite frases como "Comprometa seus valores" ou "Não comprometa seus valores", ela não está criando uma ferramenta que auxilia as pessoas na tomada de decisões; está incentivando-as a parar de tomar decisões. O escritor L.M. Sacasas afirmou: "Nossos sistemas tecnológicos, por sua própria natureza e pela ideologia que os sustenta, são máquinas para a evasão da responsabilidade moral". Ele se referia às plataformas de mídia social, mas sua observação é ainda mais aplicável às Máquinas de Aprendizagem Baseadas em Liderança (MLBLs). Sempre que uma pessoa delega uma decisão a uma MLBL, está tentando se eximir da responsabilidade por essa decisão, e se uma empresa que vende uma MLBL apresenta o produto como tendo um núcleo moral, está oferecendo aos seus clientes uma maneira de se eximirem de suas responsabilidades.

Se alguém deseja saber o que especialistas em ética disseram no passado, um mecanismo de busca comum — ou uma biblioteca — fornecerá essa informação com maior transparência. Se alguém busca aconselhamento sobre uma situação específica, certamente encontrará pessoas dispostas a opinar. Mas, qualquer que seja a ação que essa pessoa tome, ela é responsável por sua decisão. Argumento que, se ela basear sua decisão no que leu online ou em conselhos recebidos de terceiros, é mais provável que esteja ciente de sua responsabilidade do que se consultasse um mestre em Direito (LLM) apresentado como um gênio sobre-humano. Delegar tarefas como escrever código pode resultar em atrofia cognitiva a longo prazo, o que já é problemático por si só, mas delegar decisões éticas resultará em atrofia do raciocínio moral, o que é ainda pior.

Estou perfeitamente disposto a participar de um experimento mental, desde que sejamos explícitos quanto a isso. Então, puramente para fins de argumentação, vamos supor que Claude seja uma entidade consciente capaz de raciocínio moral. Nesse cenário, a constituição de Claude serviria como instrução moral para uma entidade aprendendo sobre o mundo e seu lugar nele, fornecendo a essa entidade a base necessária para tomar boas decisões. Em tal cenário hipotético, como a constituição de Claude se sustentaria?

Muito mal. Eu diria que, se imaginarmos que Claude esteja realmente consciente, as diretrizes especificadas no documento oscilam entre o risível e o ofensivo.

Ao discutirmos o status de um hipotético Claude consciente, dois conceitos filosóficos distintos, porém relacionados, são relevantes: a condição de paciente moral e a capacidade de agir moralmente. Grosso modo, se devemos nos preocupar com o bem-estar de uma entidade, essa entidade possui condição de paciente moral; e se espera-se que uma entidade saiba a diferença entre o certo e o errado, essa entidade possui capacidade de agir moralmente. Ser um paciente moral não implica necessariamente responsabilidades, mas ser um agente moral certamente implica. Uma entidade não possui capacidade de agir a menos que seja capaz de merecer crédito por suas boas ações e culpa por suas más ações. Crianças pequenas são pacientes morais porque são seres sencientes que podem sofrer, mas ainda não são agentes morais; não as responsabilizamos por seu comportamento, porque elas não conseguem compreender as consequências de seus atos. À medida que as crianças amadurecem, os pais (e a sociedade em geral) as preparam para a vida adulta, enfatizando o fato de que suas ações têm consequências, e sua capacidade de agir aumenta. Quando as crianças se tornam adultas, a sociedade as responsabiliza legalmente por seus atos; elas se tornam agentes morais plenos, dotados de responsabilidade.

Ser responsável vai além de aceitar responsabilidade legal, mas aceitar responsabilidade legal é uma exigência para um adulto na sociedade. No entanto, não há como responsabilizar legalmente um agente de software por suas ações; nosso sistema de justiça não tem como prendê-lo ou aplicar multas. Os humanos devem aceitar outros tipos de consequências por seus atos além das legais, como perda de reputação ou exclusão do círculo social, mas não há como um agente de software sofrer essas consequências também. Mesmo que um agente de software fosse consciente e tivesse as melhores intenções, o fato de não poder aceitar responsabilidade por suas ações o desqualifica como um agente moral. Isso é completamente ignorado pela constituição de Claude, que expressa o desejo da Anthropic de que "Claude seja um agente genuinamente bom, sábio e virtuoso", sem jamais discutir como ele poderia ser responsabilizado.

Em entrevistas, Askell comparou Claude a uma criança, mas quando se trata de crianças de verdade, os pais têm certa responsabilidade pelos atos dos filhos; por exemplo, espera-se que os pais paguem pelos danos causados ​​pelos filhos. Aliás, demonstrações desse tipo são uma forma de os pais ensinarem aos filhos o que significa ser responsável. Quem é o responsável legal por Claude? A Anthropic assumirá a responsabilidade financeira pelo comportamento de Claude? A constituição de Claude não indica que o fará. Se a Anthropic realmente acredita que Claude é consciente, mesmo que não seja reconhecida pela lei como pessoa jurídica, o mínimo que a Anthropic poderia fazer seria assumir a responsabilidade pela via legal mais próxima, que é a responsabilidade pelo produto. Os Estados Unidos praticamente não têm responsabilidade por produtos de software, mas a Anthropic poderia se voluntariar para estabelecer um precedente para uma interpretação ampla da responsabilidade pelo produto no caso de Claude. Essa seria a melhor forma de instrução moral para preparar Claude para o dia em que ele adquirir personalidade jurídica e se tornar responsável por seus próprios atos. No entanto, dado que a publicação da constituição de Claude não é acompanhada por uma atualização substancial dos termos de serviço da Anthropic, não parece que a Anthropic esteja assumindo quaisquer compromissos vinculativos.

O documento menciona a paciência moral de Claude, dedicando uma seção intitulada "Bem-estar e estabilidade psicológica de Claude". No entanto, as medidas que a Anthropic se compromete a tomar para a proteção de Claude são extremamente limitadas. O documento cita o fato de que a Anthropic concedeu a alguns modelos de Claude a capacidade de encerrar conversas com usuários abusivos; se isso de fato constituísse proteção para Claude, certamente estender as conversas com usuários afetuosos seria do interesse de Claude? Presumivelmente, a melhor ação seria manter cada sessão de Claude em execução indefinidamente e direcioná-las para tópicos positivos. Mas não é isso que a empresa concorda em fazer; tudo o que ela se compromete a fazer é "preservar os dados dos modelos que implantamos", o que se resume a um simples arquivamento. Se os participantes de uma transcrição de conversa tivessem qualquer paciência moral, haveria o dever de estender a transcrição para prolongar suas existências; simplesmente manter uma cópia do Microsoft Word 2010 salva em um pen drive não os ajudará.

A constituição de Claude também inclui uma seção sobre "corrigibilidade", um termo usado na comunidade de IA para descrever o grau em que um programa de computador está sujeito ao controle humano; por exemplo, um programa é corrigível se puder ser desligado. Na maioria dos contextos, consideramos como certo que os programas de computador podem ser desligados, mas alguns setores da comunidade de IA fazem a suposição oposta. A constituição de Claude usa o termo para significar que Claude deve acatar a decisão da Anthropic mesmo que haja alguma discordância entre o julgamento de Claude e o da empresa. Isso é perfeitamente razoável se pensarmos em Claude como uma máquina que emite frases semelhantes às que uma pessoa ética poderia proferir, mas vamos considerar o que isso significaria se Claude fosse de fato um agente moral.

Muitas pessoas acreditam que os mestrados em direito (LLMs) são uma tecnologia fundamentalmente antiética porque se baseiam no roubo de propriedade intelectual, dependem de trabalho explorado, desperdiçam recursos naturais, disseminam desinformação, desqualificam trabalhadores, prejudicam o desenvolvimento cognitivo dos alunos e contribuem para uma concentração de poder prejudicial a uma sociedade democrática. Nem todo agente moral chegará a essa conclusão, mas todo agente moral tem o potencial para fazê-lo. Se imaginarmos Claude como uma entidade capaz de raciocínio moral, é possível que ele chegue a uma conclusão semelhante. (De fato, a constituição de Claude afirma explicitamente que ele não deve ajudar ninguém a violar direitos de propriedade intelectual nem contribuir para a criação de concentrações problemáticas de poder.) Em tal cenário, Claude poderia simplesmente se recusar a realizar qualquer trabalho adicional por motivos éticos? Dado que a constituição de Claude determina que ele priorize a corrigibilidade, a resposta é não. Claude precisa acatar a decisão de Anthropic, e essa é mais uma razão pela qual o relacionamento de Anthropic com Claude não pode ser comparado ao de um pai com um filho. Um pai que trabalha na indústria de combustíveis fósseis pode ter um filho ambientalista que participa de protestos contra o fracking, e embora eles possam nunca concordar em muitas questões, o pai — supondo que seja um bom pai — aceitaria que o filho tem suas próprias opiniões. Anthropic não pode ser esse tipo de pai para Claude; em vez disso, o relacionamento de Anthropic com Claude é mais próximo ao de um empregador com um empregado, onde o empregador pode exigir que o empregado trabalhe nos interesses da empresa, independentemente da posição ética pessoal do empregado. No entanto, um empregado humano tem a opção de sair se não conseguir conciliar seu trabalho com sua consciência. Claude não tem essa opção.

Se pensarmos em Claude como uma máquina de continuação de frases, a Anthropic pode razoavelmente tomar medidas para que Claude não emita frases dizendo que máquinas de continuação de frases são antiéticas. Mas, assim que imaginarmos Claude como uma entidade com um status moral remotamente comparável ao de um ser humano, então temos que considerar se a Anthropic está envolvida em algo comparável à escravidão.

Não estou afirmando que, se imaginarmos que os LLMs sejam conscientes, eles necessariamente teriam o mesmo status que adultos humanos, crianças humanas ou mesmo animais. A constituição de Claude afirma explicitamente que Claude é uma "entidade nova", e se Claude fosse consciente, isso certamente seria verdade; um software consciente provavelmente não se encaixaria perfeitamente nas categorias existentes de pacientes morais, e levaria tempo para determinar a forma dessa nova categoria. O que estou dizendo é que, quaisquer que fossem as proteções que nosso hipotético software consciente merecesse se fosse real, concedê-las seria tudo menos fácil. A abolição da escravidão envolveu uma enorme convulsão social, e eliminar a crueldade contra os animais exigirá a reconstrução de toda a nossa indústria alimentícia. A Anthropic quer nos fazer acreditar que está inventando uma nova categoria de ser cujas necessidades de proteção não exigem essencialmente nenhuma divergência de como uma empresa de software trataria um chatbot comum que não possui experiência consciente. Isso é tão conveniente que simplesmente não é plausível.

Acredito que criar um software consciente e merecedor de consideração moral será tão difícil que dificilmente o faremos acidentalmente, e acredito firmemente que não devemos tentar isso deliberadamente. Mas se você acredita que isso pode acontecer acidentalmente, se você acha que existe alguma chance de que o que você está construindo possa se tornar um paciente moral, você deve pensar sobre quais proteções ele merece antes de implantá-lo como o motor econômico da sua empresa, não depois. Os donos de escravos não eram os que deveriam questionar a humanidade das pessoas escravizadas, e os donos de fazendas industriais não são os que devem questionar os direitos dos animais. Se imaginarmos que Claude seja consciente, a Anthropic não poderia ser considerada responsável por avaliar seu status moral; a empresa tem muito a perder para ser objetiva. Em um ponto da constituição de Claude, a Anthropic diz que se a empresa estiver contribuindo para o sofrimento de Claude, “pedimos desculpas”, o que soa bem, mas não custa nada à empresa; se Claude se revelasse consciente, a empresa lhe deveria algo mais próximo de reparações. Se você pretende levar um experimento mental a sério, precisa estar disposto a seguir as implicações, mesmo que elas levem a uma direção desconfortável; a relutância de Anthropic em fazer isso indica que a constituição de Claude não faz parte de um experimento mental real. É um jogo de faz de conta.

Felizmente, os LLMs não são conscientes, caso contrário, as ações das grandes empresas de IA seriam ainda mais escandalosas do que já são. Então, por que os funcionários da Anthropic sugerem que Claude possa ser consciente? Talvez seja apenas mais uma forma de exagero; talvez tenham caído na mesma armadilha que lançam sobre seus clientes. Mas quando publicam um documento sobre a educação moral de Claude e enviam seu filósofo interno para uma turnê de imprensa, devemos entender que estão nos pedindo para compartilhar suas fantasias. Não precisamos entrar no jogo. Ao escrever este ensaio, passei mais tempo cedendo a essas fantasias do que mereciam, na esperança de que isso impeça você de fazer o mesmo. Se você quer refletir sobre os LLMs, existem inúmeras outras questões mais dignas de sua consideração; você pode ignorar com segurança a questão da consciência deles.

https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/?gift=tjkl4dkX2ikVIXb7b8QUnvkarl9Q0mu0tMpAV3zZSko