Agentes de IA em finanças: como dar autonomia sem perder o controle

Gartner prevê que 40% das empresas vão desligar agentes de IA por falha de governança. Veja como criar guardrails antes de soltar a rédea.

A maior ameaça aos agentes de IA em finanças não é a tecnologia falhar — é a empresa perder o controle dela. O Gartner prevê que, até o fim de 2027, 40% das organizações vão reduzir a autonomia ou simplesmente desligar seus agentes de IA depois de identificar falhas de governança. Não porque os agentes não funcionam, mas porque ninguém definiu, com antecedência, o que eles podiam — e o que não podiam — fazer.

O contraste com o ritmo de adoção é o que torna o número preocupante. A Deloitte, em pesquisa com 3.235 líderes entre agosto e setembro de 2025, descobriu que apenas 1 em cada 5 empresas tem um modelo maduro de governança para agentes autônomos. Ao mesmo tempo, a expectativa é que a parcela de empresas usando IA generativa que vão operar agentes autônomos dobre — de 25% em 2025 para 50% até 2027.

Traduzindo: a maioria está colocando agentes para trabalhar mais rápido do que consegue controlá-los. Para quem responde por contas a pagar, tesouraria ou fechamento, isso é um problema concreto. Um agente que aprova pagamentos, posta lançamentos no ERP ou ajusta condições com fornecedores precisa de freios tão bem desenhados quanto suas capacidades. Este artigo é sobre como construir esses freios.

De "humano no loop" para autonomia governada

Por anos, o controle de IA em finanças seguiu a lógica do human-in-the-loop: a máquina sugere, a pessoa aprova cada passo. Funciona bem para protótipos, mas trava na escala. Se um humano precisa clicar "aprovar" em cada uma das milhares de faturas que o agente processa, o ganho de produtividade evapora.

O conceito que está substituindo esse modelo é o de autonomia governada (governed autonomy): o agente executa o trabalho de ponta a ponta dentro de limites pré-definidos pela empresa, e o humano deixa de aprovar tarefas individuais para projetar as regras que governam o comportamento do agente. A pessoa sai da operação e entra na supervisão.

A diferença é sutil mas decisiva. No primeiro modelo, você confia caso a caso. No segundo, você confia no sistema de regras — desde que ele seja explícito, monitorado e reversível. É exatamente aí que a maioria das empresas falha: solta a autonomia sem ter construído o sistema de regras primeiro.

Nem todo agente merece a mesma rédea

O primeiro erro de governança é tratar todos os agentes igual. Aplicar os mesmos controles a um agente que apenas gera um relatório e a outro que executa transferências bancárias é, ao mesmo tempo, sufocar o que é inofensivo e subcontrolar o que é perigoso.

A regra prática é calibrar o controle ao risco da ação, não à sofisticação do agente. Uma forma simples de organizar isso:

Nível Tipo de ação Controle recomendado
Baixo risco Ler dados, gerar relatório, sugerir categorização Autonomia total + log de auditoria
Risco médio Conciliar, codificar lançamento, classificar fatura Autonomia com limites + revisão por amostragem
Alto risco Aprovar pagamento, alterar dados bancários, mudar condição contratual Aprovação humana obrigatória acima de um valor

O princípio é antigo na tesouraria: alçada. Ninguém dá a um analista júnior o poder de aprovar um pagamento de R$ 5 milhões sem dupla checagem. Um agente de IA não deveria ter mais alçada do que daríamos a uma pessoa na mesma função — e idealmente menos, até que ele prove consistência.

A "sala de controle" de agentes

Conforme os agentes se multiplicam, surge um risco que poucos CFOs anteciparam: o espalhamento de agentes (agent sprawl). Cada área implanta o seu, com credenciais próprias e acesso ao ERP, e ninguém tem o inventário completo. Na prática, as lacunas de governança costumam aparecer entre o 3º e o 8º agente implantado — quando já são muitos para controlar no improviso e ainda poucos para justificar um sistema dedicado.

A resposta que vem sendo recomendada por consultorias como a Deloitte é montar uma "sala de controle" de agentes, com quatro pilares:

  • Registro central de agentes — um inventário único com nome, fornecedor, função, permissões no ERP (o que cada um pode ler e escrever), responsável e limites de desempenho. É a sua "fonte da verdade" sobre quantos agentes existem e o que cada um faz.
  • Botão de desligar (kill switch) — capacidade de pausar qualquer agente, ou todos de uma vez, sem depender do fornecedor. A meta sugerida é conseguir parar todos os agentes em até 5 minutos durante um incidente.
  • Trilha de auditoria unificada — todas as ações dos agentes (consultas, lançamentos, exceções, escalonamentos) consolidadas em um único registro pesquisável. O teste prático: você consegue recuperar todo o histórico de 30 dias em uma única consulta?
  • Monitoramento de desempenho — cada agente com métricas definidas (taxa de processamento automático, acurácia de matching, variância) e alertas automáticos quando o desempenho cai, antes que os erros se acumulem silenciosamente.

Esse último ponto importa mais do que parece. Um dos riscos mais traiçoeiros do agente autônomo é a degradação silenciosa: ele continua "funcionando", mas a qualidade cai aos poucos, e o erro se acumula por semanas sem que ninguém perceba. Sem monitoramento, você só descobre na auditoria.

Guardrails na prática: limites que vivem no código

Definir regras em um documento de política é fácil. O que separa a governança real da teatral é embutir os limites na própria infraestrutura — guardrails que o agente não consegue violar, e não apenas diretrizes que ele "deveria" seguir.

Os principais guardrails técnicos para agentes que mexem com dinheiro:

  • Tetos de transação e de sessão — valor máximo por operação e por período. Um agente de pagamentos pode liquidar até R$ X por transação e R$ Y por dia; acima disso, trava e escala para um humano.
  • Listas de operações permitidas (allowlists) — o agente só executa ações de uma lista aprovada e só transaciona com fornecedores/contas previamente cadastrados. Mudança de dado bancário de fornecedor — vetor clássico de fraude — fica fora da autonomia.
  • Aprovação multipartes para alto valor — transações acima de um limiar exigem confirmação de mais de uma pessoa, replicando a segregação de funções.
  • Condições de saída — gatilhos programados que fazem o agente parar e pedir ajuda diante de circunstâncias atípicas (um valor fora do padrão histórico, um fornecedor novo, uma divergência de contrato).

Esse modelo já está virando padrão de mercado. Em fevereiro de 2026, a Coinbase lançou uma infraestrutura de carteiras desenhada especificamente para agentes de IA, com guardrails programáveis: limites de sessão, tetos de transação, listas de operações permitidas, aprovação multipartes e logs de auditoria detalhados. A lógica vale para qualquer trilho de pagamento.

No Brasil, o palco natural dessa discussão é o PIX. Por ser de baixo custo e baixa fricção, é o meio que agentes de IA tendem a privilegiar quando começarem a executar pagamentos de forma autônoma — uma "economia de agentes" que ainda é mais tendência do que realidade por aqui, mas que avança rápido. Vale notar que o próprio Banco Central vem apertando os limites do PIX: desde 2 de fevereiro de 2026, dispositivos não cadastrados ficaram restritos a R$ 200 por operação e R$ 1.000 por dia. É um lembrete útil de que, em pagamentos, limites por valor e por período já são a linguagem padrão do controle — e os guardrails dos seus agentes devem falar essa mesma língua.

Por que isso é responsabilidade do financeiro

Há uma tentação de tratar governança de IA como assunto de TI. É um erro. Quando um agente aprova um pagamento indevido ou posta um lançamento errado, quem responde pelo número é o financeiro — e, em última instância, o CFO. As obrigações de SOX, LGPD e da reforma tributária não desaparecem porque a ação foi tomada por um software.

A boa notícia é que uma trilha de auditoria automática e completa, gerada por um agente bem governado, é uma infraestrutura de compliance que processos manuais raramente conseguem replicar. Cada ação registrada com data, hora e a justificativa da decisão. O agente, bem desenhado, não é só mais rápido — ele é mais auditável. A diferença entre os dois cenários é inteiramente decidida antes do agente entrar no ar.

Próximos Passos

  1. Faça o inventário dos seus agentes hoje — liste todo agente ou automação de IA em produção, com função, responsável e o que cada um pode ler e escrever no ERP. Se você não consegue dizer quantos existem, esse é o primeiro problema a resolver.
  2. Classifique cada ação por risco — separe o que é leitura/sugestão (baixo) do que move dinheiro ou altera dados sensíveis (alto). Defina alçada por valor, como você já faz com pessoas.
  3. Exija um botão de desligar antes de escalar — só amplie a autonomia de um agente depois de garantir que consegue pausá-lo em minutos, sem depender do fornecedor.
  4. Embuta os limites no sistema, não na política — tetos de transação, allowlists de fornecedores e aprovação dupla para alto valor precisam ser regras técnicas que o agente não viola, não recomendações em PDF.
  5. Monitore desempenho continuamente — defina métricas e alertas para cada agente e revise por amostragem. A degradação silenciosa é o risco que só aparece quando já virou prejuízo.

Fontes: