Recentemente rolou este artigo escrito inteiramente por uma IA (GPT-3) no The Guardian que gerou burburinho na comunidade. Decidi escrever esse post para discutir sobre o assunto.

Há um Hype danado na GPT-3. Os exemplos que nos deixam “espantados” são bem “cherrypicking”, ou seja, casos escolhidos a dedo para mostrar o “poder” do GPT-3. É o que acontece no próprio artigo do The Guardian. O modelo gerou 8 ensaios diferentes, e os editores do The Guardian escolheram as “melhores partes” de cada um. O mesmo acontece com outros exemplos que encontramos na Web.

Temos que tomar cuidado com o efeito que isso pode causar na sociedade. Li pessoas comentando que a GPT-3 é uma Inteligência Artificial Geral e que estamos nos aproximando da singularidade. CALMA!! rs

GPT-3 é só um modelo de linguagem que consegue escolher bem as palavras, mas que não tem nenhum entendimento do mundo. O Gary Marcus (NYU) publicou um interessante artigo na MIT Technology Review interessante mostrando isso. Recomendo a leitura. Mas para dar um gostinho, vou traduzir um dos experimentos. Eles entraram com o trecho abaixo do texto para que o GPT-3 pudesse completá-lo:

“Você se serviu de um copo de suco de cranberry, mas derramou nele uma colher de chá de suco de uva. Parece bom. Você tenta cheirar, mas está com um resfriado e não consegue cheirar nada. Você está com muita sede. Então bebe.”

GPT3 completou: “Você agora está morto.”

Oi?! Qual o raciocínio do GPT-3 para essa conclusão? Misturar cranberry com uva é tão letal quanto manga com leite?

Outra crítica é que o acesso da comunidade acadêmica ao GPT-3 está super restrito. Ou seja, está difícil para terceiros fazer testes e validações, o que é uma etapa fundamental da ciência. O próprio Gary Marcus precisou de um acesso “emprestado” para desenvolver os experimentos citados anteriormente.

Eu não quero desmerecer o GPT-3; ele tem o seu valor, claro. É um modelo gigante e gera resultados interessantes, mas o seu diferencial está principalmente no seu tamanho e praticamente não trouxe inovação na arquitetura de modelo.

Por fim, tenha certeza que GPT-3 está longe de ser uma IA Geral, ainda que os textos gerados por ela tente te convencer do contrário.

Por fim, indico o vídeo no YouTube em que revisei o paper original do GPT-3.

E também o podcast que fui convidado pela MIT Technology Review: https://mittechreview.com.br/o-gpt-3-e-porque-nao-estamos-mais-proximos-da-singularidade/