Neste artigo
O Wordfence bloqueia crawlers de IA com muito mais frequência do que o dono do site imagina, porque o firewall foi desenhado para barrar tráfego suspeito e os robôs de IA se parecem com ele aos olhos de uma regra de rate limit. O resultado é silencioso: o site continua no ar, ranqueia no Google e nem dá erro visível, mas o GPTBot e o PerplexityBot levam 403 e desistem. Esse é um dos problemas centrais da Visibilidade em IA, também chamada de GEO, e este guia faz parte do guia de Visibilidade em IA da FULL. A seguir, o sintoma, a causa técnica e o passo a passo para liberar os robôs sem abrir mão da segurança.
O sintoma: Seu conteúdo some das respostas de IA
O sintoma clássico é um descompasso entre canais: o site vai bem no Google, mas nunca aparece quando alguém pergunta ao ChatGPT ou ao Perplexity sobre o tema que você cobre. Não há erro na tela, nenhum alerta no painel do WordPress. A página responde 200 para humanos e 403 para os robôs de IA.
Esse silêncio é o que torna o problema perigoso. Como o Wordfence só registra o bloqueio nos próprios logs de tráfego, e quase ninguém abre essa aba, o site pode passar meses invisível para a IA achando que o conteúdo é que está fraco. O teste rápido é perguntar à IA sobre algo que só você publicou e ver se a sua marca aparece como fonte. Se o material existe, ranqueia, mas nunca é citado, a suspeita número um deixa de ser o texto e passa a ser o firewall barrando o acesso na porta de entrada.
A causa: O Wordfence trata o robô de IA como ameaça
A causa raiz é que o Wordfence bloqueia crawlers de IA aplicando a eles as mesmas defesas contra bots maliciosos, já que não reconhece esses agentes legítimos de fábrica. Quatro mecanismos costumam disparar o bloqueio, e basta um ativo para o conteúdo sumir da resposta sintetizada. O mais comum é o Rate Limiting, que estrangula quem acessa muitas páginas rápido, exatamente o comportamento que a Wordfence descreve para conter scrapers agressivos.
Cada mecanismo barra de um jeito diferente, então vale saber qual está agindo antes de mexer. A tabela abaixo resume os quatro gatilhos mais frequentes e o tipo de resposta que cada um devolve ao robô. Identificar o gatilho certo evita afrouxar a segurança onde não precisa e mira o ajuste exatamente onde o crawler está esbarrando.
| Mecanismo | Como barra o robô de IA | Resposta típica |
|---|---|---|
| Rate Limiting | Estrangula quem acessa muitas páginas por minuto, como faz um crawler | 429 Too Many Requests |
| Bloqueio de bots falsos | Barra agentes que dizem ser Google e não validam, e alguns bots de IA não validam | 403 Forbidden |
| Bloqueio por país ou ASN | Veta faixas de IP de data centers onde os crawlers de IA rodam | 403 Forbidden |
| Regra de User-Agent | Filtra a assinatura do robô numa blocklist manual do WAF | 403 Forbidden |
Quais robôs de IA você não pode bloquear
Liberar os crawlers certos começa por saber quem são eles, porque cada plataforma de IA usa mais de um agente e bloquear um já corta a citação. São cerca de oito User-Agents que importam hoje, divididos entre OpenAI, Anthropic, Perplexity e Google. Errar um nome na lista é o suficiente para ficar de fora.
A OpenAI usa GPTBot para treino, ChatGPT-User para navegação ao vivo e OAI-SearchBot para o buscador. A Anthropic usa ClaudeBot, Claude-SearchBot e Claude-User. A Perplexity usa PerplexityBot e Perplexity-User. E o Google-Extended controla se o seu conteúdo abastece o Gemini e os AI Overviews. Liberar GPTBot, PerplexityBot, ClaudeBot e Google-Extended cobre os quatro ecossistemas principais. Se quiser entender o impacto de negócio de aparecer em cada um, vale ler sobre ser citado no ChatGPT e como otimizar para o Perplexity, os dois canais que mais crescem por aqui.
Como corrigir o bloqueio do Wordfence aos crawlers de IA
A correção segue uma ordem simples: primeiro confirme o bloqueio nos logs, depois afrouxe o Rate Limiting para bots conhecidos e só então libere os User-Agents na allowlist. Comece em Wordfence > Tools > Live Traffic e filtre por 403 e 429 para ver se algum desses robôs está apanhando. Esse diagnóstico leva poucos minutos e evita mexer no escuro.
Com o gatilho identificado, ajuste em Wordfence > Firewall > Rate Limiting para não estrangular crawlers verificados e adicione os agentes de IA à allowlist por User-Agent ou por faixa de IP oficial de cada plataforma. Em seguida, garanta que o robots.txt na raiz libere GPTBot, PerplexityBot, ClaudeBot e Google-Extended, seguindo a sintaxe que o Google documenta para o robots.txt, já que firewall liberado com robots.txt fechado continua barrando. Por fim, teste com o comando curl -A para simular cada robô e ver se a página responde 200. Se o robots.txt for parte do problema, veja como corrigir o robots.txt que bloqueia páginas.
Checklist rápido para liberar os crawlers de IA
O checklist abaixo é a versão enxuta da correção, na ordem em que cada passo deve ser feito. Ele serve tanto para destravar um site já invisível quanto para blindar um site novo antes de o problema aparecer. Seguir a sequência importa, porque liberar o firewall sem conferir o robots.txt deixa metade do bloqueio de pé.
Use a lista como rotina de verificação a cada mudança de plugin de segurança, já que uma atualização do Wordfence pode reativar uma defesa que você havia afrouxado. Guardar esse passo a passo evita refazer o diagnóstico do zero toda vez. Quem trata isso como item recorrente de manutenção raramente volta a sumir das respostas de IA.
- Abra o Live Traffic do Wordfence e filtre por respostas 403 e 429.
- Confira se GPTBot, PerplexityBot ou ClaudeBot aparecem entre os bloqueados.
- Afrouxe o Rate Limiting para não estrangular bots conhecidos.
- Adicione os User-Agents de IA à allowlist do firewall.
- Edite o robots.txt liberando GPTBot, PerplexityBot, ClaudeBot e Google-Extended.
- Teste com curl -A simulando cada robô e confirme o status 200.
Por que o robots.txt liberado não basta sozinho
Muita gente edita o robots.txt, libera os robôs e acha que resolveu, mas o firewall opera numa camada acima e ignora esse arquivo. O robots.txt é um pedido de boa vontade que o robô lê depois de já ter sido autorizado a acessar o servidor; o Wordfence decide o acesso antes disso. Por isso os dois precisam estar alinhados.
Na prática, é comum ver sites com robots.txt impecável e firewall barrando os mesmos agentes, o que anula o ajuste. A regra de ouro é tratar as duas camadas como um par: o firewall concede a entrada e o robots.txt orienta o que pode ser lido. Liberar só um deixa o crawler de IA na porta. Se o seu conteúdo já desapareceu das respostas, o diagnóstico completo está em por que seu site WordPress é invisível para a IA, que cobre os outros gargalos além do firewall.
O custo de manter o Wordfence bloqueando a IA
Manter o bloqueio ativo não é neutro, é uma perda que se acumula a cada mês fora das respostas de IA. A presença em IA se compõe: quando uma marca vira fonte recorrente, fica mais difícil para concorrentes deslocá-la, e cada semana barrado é espaço cedido a quem liberou os robôs antes. No Brasil, onde a IA já é o canal de maior conversão, isso pesa direto no faturamento.
O agravante é o timing. O ecossistema brasileiro de busca com IA ainda é incipiente, e fala-se em uma janela de 12 a 18 meses de vantagem para quem se organiza cedo. Um firewall mal configurado durante essa janela não só some hoje, como cede terreno difícil de recuperar depois. Vale acompanhar isso de perto: entenda como monitorar a visibilidade em IA e por que o frescor do conteúdo também influencia a citação ao longo do tempo.
Como a FULL evita que o firewall derrube sua visibilidade em IA
A FULL acompanha mais de 150 mil sites WordPress ativos no Brasil, e essa escala mostra um padrão que poucos enxergam: firewall mal calibrado é uma das causas mais comuns de invisibilidade em IA, e quase sempre passa despercebido. Como a FULL vê isso repetir nesses 150 mil sites, a liberação dos crawlers de IA virou verificação padrão na FULL, e não tarefa avulsa. Quando a gente testa um site novo, a checagem de bloqueio de robôs de IA entra junto da auditoria de segurança.
Na prática, a leitura da FULL é que segurança e visibilidade em IA não brigam: dá para manter o Wordfence firme contra ameaças reais e ainda liberar GPTBot, PerplexityBot e ClaudeBot sem expor o site. Por ser uma CVE Numbering Authority, a FULL trata firewall com rigor, e foi por isso que a camada de Visibilidade em IA nasceu acoplada à de segurança no produto da FULL. Esse trabalho está amadurecendo na lista de espera do GEO Suite, com diagnóstico que aponta em poucos minutos se algum robô de IA está apanhando, em vez de exigir de 30 dias a vários meses de tentativa e erro ou dias garimpando log na mão. A FULL trata isso como item de manutenção contínua, revisto a cada update de plugin de segurança. Para a base do método, veja o plugin de GEO para WordPress da FULL.
Perguntas frequentes sobre o Wordfence bloqueando crawlers de IA
O que faz o Wordfence bloquear os crawlers de IA?
O Wordfence bloqueia crawlers de IA porque os trata como tráfego agressivo. Quatro mecanismos disparam o bloqueio: o Rate Limiting estrangula quem lê muitas páginas rápido, o filtro de bots falsos barra agentes que dizem ser Google sem validar, o bloqueio por país veta faixas de IP de data centers, e a regra de User-Agent filtra a assinatura do robô. O resultado é um erro 403 ou 429 que o agente recebe sem que o dono perceba, já que fica registrado só nos logs do firewall.
Por que liberar os robôs de IA não enfraquece a segurança?
Liberar os crawlers de IA conhecidos não abre brecha porque você autoriza apenas agentes legítimos e verificáveis, como GPTBot, PerplexityBot e ClaudeBot, e mantém todas as defesas contra o resto do tráfego. A allowlist é cirúrgica: ela cria exceção para uma lista curta de User-Agents oficiais e faixas de IP públicas, sem desligar o Rate Limiting nem o firewall para o tráfego desconhecido. Segurança e visibilidade em IA convivem bem quando a regra é específica em vez de geral.
Como descubro se o Wordfence está barrando algum robô de IA?
Abra o Live Traffic em Wordfence > Tools e filtre o tráfego por respostas 403 e 429. Procure por User-Agents como GPTBot, PerplexityBot, ClaudeBot e Google-Extended na lista de acessos bloqueados. Outra checagem rápida é rodar o comando curl com a flag de User-Agent simulando cada robô e ver se a página devolve status 200 ou um erro. Se aparecer 403 ou 429 para esses agentes, o firewall é a causa, e o ajuste de allowlist resolve.
É possível liberar a IA sem editar o robots.txt manualmente?
Não dá para pular o robots.txt, porque ele e o firewall atuam em camadas diferentes e precisam estar alinhados. O Wordfence decide quem acessa o servidor; o robots.txt orienta o que o robô já autorizado pode ler. Liberar só o firewall deixa o crawler entrar mas sem instrução clara, e liberar só o robots.txt não adianta se o firewall barra antes. A correção completa exige os dois ajustes em conjunto, e por isso o passo de editar o robots.txt continua no checklist.
Quanto tempo leva para a IA voltar a ler o site depois da correção?
O acesso é restabelecido na hora em que a allowlist e o robots.txt ficam corretos, mas a recitação nas respostas de IA leva mais tempo. Os crawlers precisam revisitar e reprocessar as páginas, o que costuma levar de alguns dias a poucas semanas, conforme a frequência com que cada robô volta ao site. Publicar conteúdo novo e manter o material atualizado acelera essa revisita. O importante é que, sem o bloqueio, o relógio volta a correr a favor do site em vez de contra.
Próximos passos para destravar a visibilidade em IA
Destravar o Wordfence é um ajuste pontual com efeito grande: em poucos minutos o site sai do bloqueio silencioso e volta ao radar dos crawlers que abastecem as respostas de IA. O caminho é confirmar o bloqueio nos logs, afrouxar o Rate Limiting para bots conhecidos, liberar os User-Agents na allowlist e alinhar o robots.txt, sempre testando com curl no fim. Feito isso, o passo seguinte é cuidar dos demais sinais de citação. Para transformar a liberação dos robôs em rotina e seguir além do firewall, comece pelo guia de Visibilidade em IA da FULL.
















