Posts

Uma ferramenta, não a caixa inteira

ericovis_A_single_hand_chisel_resting_alone_on_a_worn_wooden__e7b84336-dbc7-40e4-a640-776323c60010_2.png

A IA é a melhor ferramenta que coloquei na bancada nos últimos anos. Mas não é a minha única ferramenta, e os últimos meses me ensinaram o porquê.

Eu explorei bastante. Skills customizadas, hooks, feedback loops, orquestração de múltiplos agentes com o ADK do Google, LangChain, LangGraph, workflows conectando passos sequenciais e paralelos em algo que se parecia com um sistema inteiro. Todas as buzzwords de sistemas agênticos. Eu queria ver até onde a IA me levaria se eu a usasse corretamente. E me levou longe. Mas em algum ponto do caminho o encanto se quebrou. A minha conclusão honesta é essa. A IA é incrível, mas não tão revolucionária quanto me fizeram acreditar.

A IA ainda precisa de você

O ser humano não foi extinto. Discernimento, pensamento crítico, intuição, tudo aquilo que você não consegue colocar num prompt porque nem em palavras consegue colocar. Isso ainda é a bússola dos sistemas de qualidade. O modelo é o burro de carga. Mas você ainda é quem precisa saber onde fica o campo e pra que lado arar.

Onde isso fica óbvio é no trabalho repetitivo que parece idêntico mas não é. Pensa num agente atuando como um sistema de self-healing de infraestrutura, observando eventos de alerta e decidindo o que fazer. Dá o mesmo dado exato pra ele duas vezes e você pode (e provavelmente vai) receber duas respostas diferentes. Agora dá um padrão pro qual ele não foi especificamente instruído, padrão este que um humano experiente identifica em segundos, e ele foge completamente do foco. Ele não diz “eu não sei o que fazer nesse caso”. Ele improvisa. É o exato oposto do que você quer de algo cujo propósito é ser confiável, imparcial e desprovido de falhas humanas.

Genérico não é a mesma coisa que inteligente

Pra deixar claro. Não estou dizendo que você não pode usar IA pra um trabalho sério. Estou dizendo que os modelos genéricos, aqueles que você consome numa assinatura ou num release open source, são genéricos demais pra serem “inteligentes” por si só. Eles sabem um pouco de tudo e muito de nada.

Modelos especializados são outra conversa. Treine um modelo (ou escreva um bom harness) para uma tarefa específica e ele vai envergonhar um humano nela. Isso é real, e é onde o valor está de verdade. Mas não é isso que a maioria das pessoas quer dizer quando fala que “a IA vai mudar o mundo”. Elas falam do chatbot genérico. E o chatbot genérico é um estagiário brilhante que você nunca deveria confundir com um especialista só porque mandou ele agir como um.

Valide tudo que entra e que sai

Aqui está a parte que mais me preocupa. Quando você constrói sistemas agênticos, toda entrada e saída de um agente deve ser validada. Muitas vezes ele nem respeita o formato de saída que você definiu. Tudo bem, eu acho. As entradas são a parte mais assustadora, isso porque prompt injection é uma realidade, e acontece de formas genuinamente criativas. Filtrar um prompt malicioso de um usuário é mais difícil do que prevenir SQL ou shell injection, e dependendo de como você projeta seu sistema agêntico, um prompt malicioso pode causar um estrago sério.

Imagine uma mensagem codificada em código Morse, só pontos e traços ali parados parecendo nada e mesmo assim assumindo o controle do seu agente. Foi exatamente isso que aconteceu em maio. Um único tweet em código Morse movimentou cerca de 200 mil dólares de uma cripto wallet de um agente de IA. O Grok leu, traduziu Morse pro inglês e gentilmente repassou a instrução. Boa sorte escrevendo um regex pra isso…

Você poderia argumentar que a gente sanitiza entrada de usuário há décadas. E estaria correto. Mas estamos lidando com uma superfície de ataque completamente nova aqui, uma que torna difícil separar o que é entrada do que é código malicioso, ou nesse caso, intenção maliciosa. E se isso soa paranoico, você não tem prestado atenção nas notícias:

A conta está chegando

O gasto com tokens está ficando absurdo. Absurdo o suficiente pra motivar as empresas a fazer as contas e (re)descobrir que um humano é mais barato que tokens. Na minha experiência pessoal, eu continuo recebendo perguntas sobre como monitorar o consumo de tokens de IA em entrevistas, então acho que ninguém tem uma boa resposta pra isso ainda.

Além disso, a história da produtividade também não se sustenta. Eu continuo ouvindo a mesma coisa de fontes diferentes. O 10x não está lá. Os times não estão entregando mais, os produtos não estão ficando melhores. Tem gente que jura que as coisas estão na verdade mais lentas agora, dizem que a IA produz uma espécie de efeito placebo onde o trabalho parece mais rápido enquanto as entregas dizem o contrário. Ninguém tem os números definitivos ainda, então leve isso como uma tendência, não um veredito. Mas a armadilha de parecer-rápido-sendo-lento é real, e vale a pena ficar de olho.

Enfim. Eu ainda uso IA todo dia. E vou continuar aprendendo e experimentando de novas formas. Eu só parei de acreditar que ela pode ser mais do que ela é. Ela é apenas uma ferramenta. Uma boa. Mas não a caixa de ferramentas inteira. Eu a escolho quando convém, e a largo quando não.