Hospedado na raiz do site WordPress, o llms.txt entrega aos modelos de IA um mapa markdown curado do seu conteúdo. Segundo o llmstxt.org (2024), Jeremy Howard propôs o formato em 3 de setembro daquele ano, sempre em /llms.txt. Ele não substitui o robots.txt: indexa contexto, não permissão. Configure-o cedo para disputar citação em ChatGPT e Perplexity.
Um arquivo de texto em markdown hospedado na raiz do domínio, o llms.txt descreve para modelos de linguagem quais páginas do seu WordPress valem a leitura e em que ordem. Ele resolve um problema concreto: crawlers de IA como o GPTBot têm orçamento de leitura limitado e tropeçam em menus, rodapés e scripts. Com o llms.txt você entrega um índice limpo, em prosa, que aponta para os links que importam. Neste hub de conteúdos de SEO WordPress da FULL a lógica é a mesma do GEO/AEO: ser citado pela máquina, não só indexado pelo Google.
Primeiros passos: O que o llms.txt resolve no WordPress
O llms.txt entrega aos crawlers de IA um índice em markdown de 2 a 10 KB que reduz o ruído de leitura. Em vez de varrer o HTML cheio de menu, sidebar e JavaScript, o GPTBot lê só os links curados. Isso aumenta a chance de o modelo citar a passagem certa, e o formato é uma proposta aberta de 2024, ainda sem padrão oficial do Google.
| Arquivo | Função principal | Formato | Efeito no crawler de IA |
|---|---|---|---|
| llms.txt | Curar e descrever conteúdo relevante | Markdown em prosa, com links | Orienta o que ler e em que ordem |
| robots.txt | Permitir ou bloquear acesso | Diretivas User-agent / Allow / Disallow | Libera ou barra o crawler antes da leitura |
| sitemap.xml | Listar todas as URLs para indexação | XML estruturado por tags | Alimenta o Google, não o modelo generativo |
A confusão mais comum nos tickets de suporte da FULL é tratar o llms.txt como um robots.txt turbinado. São camadas diferentes: o robots.txt decide quem entra, o arquivo orienta quem já entrou. Vale revisar o guia de robots.txt no WordPress antes de seguir.
Como o llms.txt afeta a citação em ChatGPT e perplexity
Um llms.txt bem montado tende a aumentar a densidade de citação porque entrega ao modelo um resumo de 40 a 60 palavras por seção, em vez de um HTML de 300 KB. Quanto mais limpa a fonte, menor o risco de a IA alucinar ou citar um concorrente. O ganho é probabilístico, não garantido.
A relação causal é direta: llms.txt na raiz do domínio, com o GPTBot liberado no robots.txt e o conteúdo apontado em markdown limpo, deixa as páginas elegíveis para citação em ChatGPT. Falte qualquer uma das três pernas e a cadeia quebra. Na base de sites da FULL, a gente vê no suporte que muita gente publica o arquivo mas esquece de liberar o GPTBot, e aí o esforço não rende. O verbete llms.txt do glossário traz a sintaxe mínima do formato.
Passo a passo: Como criar o llms.txt no WordPress
Criar o llms.txt no WordPress leva cerca de 15 minutos e não exige plugin pago: o arquivo é texto puro servido na raiz, igual ao robots.txt. A sequência abaixo cobre da escrita do markdown até a validação com o crawler. Faça nesta ordem para não publicar um arquivo que o GPTBot não consegue ler.
Legenda: a estrutura mínima do llms.txt: título H1, blockquote de resumo e listas de links em markdown.
Passo 1: Escreva o markdown do llms.txt
Comece criando um arquivo de texto chamado llms.txt com um H1 (o nome do site), um parágrafo de resumo entre > e listas de links em markdown agrupadas por seção. O formato proposto em 2024 pede esse esqueleto: # Nome, depois > resumo, depois seções ## Docs e ## Optional. Mantenha cada descrição de link em uma frase factual. Um arquivo de 30 a 60 linhas cobre bem um blog WordPress de porte médio.
Passo 2: Liste as urls que importam
Selecione de 10 a 30 páginas reais do seu WordPress e escreva cada link no formato título: descrição em uma linha. Priorize guias, comparativos e tutoriais com dado próprio, não a página de contato. Puxe os endereços do seu sitemap do WordPress para não inventar slug. Quanto mais específica a descrição, maior a chance de o modelo escolher aquela URL como fonte da resposta.
Passo 3: Suba o arquivo para a raiz do domínio
Envie o llms.txt por FTP ou pelo gerenciador de arquivos da hospedagem para a mesma pasta onde mora o robots.txt, normalmente public_html. O endereço final precisa ser exatamente https://seusite.com/llms.txt, sem subpasta. Em servidor LiteSpeed ou Apache o arquivo estático já é servido direto. Em Nginx sem regra de fallback, confira o Passo 5 antes de comemorar, porque o caminho pode retornar 404.
Passo 4: Libere os crawlers de IA no robots.txt
Abra o robots.txt e adicione blocos User-agent: GPTBot com Allow: / para os agentes que você quer atrair, como GPTBot, ClaudeBot, PerplexityBot e Google-Extended. Sem essa liberação, o crawler nem chega ao llms.txt. Quem usa Rank Math PRO ou Yoast SEO pode editar o robots.txt direto no painel, sem tocar em arquivo. Liberar tudo é o padrão para GEO; bloqueie só se houver decisão editorial de não alimentar IA.
Passo 5: Valide o acesso real do crawler
Teste abrindo https://seusite.com/llms.txt em uma aba anônima e confirme o status 200 com uma ferramenta de header HTTP. Em Nginx, a regra try_files precisa apontar para o arquivo físico, senão o WordPress intercepta a rota e devolve 404 ao GPTBot mesmo com o arquivo no disco. Esse detalhe aparece com frequência em ambientes que rodam por trás de proxy e quebra silenciosamente a estratégia inteira.
Onde o llms.txt do WordPress costuma falhar
A falha mais comum não está no conteúdo, e sim na entrega: em Nginx sem a regra try_files apontando para o arquivo físico, o llms.txt gerado por plugin via rewrite devolve 404 ao GPTBot mesmo abrindo no navegador logado. O arquivo existe, você o vê, mas o crawler recebe erro.
Servir o arquivo como estático real na raiz, fora do roteamento do WordPress, resolve na maioria dos casos. É o motivo de o método via FTP ser mais confiável que o gerado por plugin atrás de proxy.
O segundo ponto cego é multisite e subdiretório. Quando o WordPress roda em /blog ou em rede multisite, cada site precisa do seu próprio /llms.txt na raiz do respectivo host. A gente vê no suporte da FULL instalações que colocam o arquivo em /blog/llms.txt e esperam citação para o domínio inteiro: o crawler procura sempre na raiz e ignora o subdiretório.
Plano FULL: Rank Math PRO no bundle para acelerar o GEO
Manter llms.txt, robots.txt liberado para IA e schema markup estruturado alinhados dá trabalho de configuração. O plano PRO da FULL custa R$849,90 por ano e inclui Rank Math PRO mais outros 16 plugins premium; diluído nos 10 sites do plano, sai a R$85 por site. É aí que o bundle ajuda.
Esse valor cobre a edição de robots.txt no painel, o schema markup automático e os controles de SEO técnico que sustentam a citação por IA, sem precisar comprar licença avulsa de cada plugin separadamente. Para ativar, veja os planos da FULL. A FULL entrega os plugins do bundle, não hospedagem: o arquivo você sobe no seu próprio servidor atual.
Legenda: editar o robots.txt pelo Rank Math PRO evita acesso por FTP e reduz erro de digitação nas diretivas.
Como medir se o llms.txt está rendendo citação
Medir o efeito do llms.txt exige olhar fora do Google Analytics tradicional, porque tráfego de IA chega sem referrer claro: monitore os logs do servidor por user-agent (GPTBot, ClaudeBot, PerplexityBot) e a frequência de visita ao /llms.txt. Um aumento de hits do GPTBot ao arquivo nas semanas seguintes à publicação indica que o crawler o encontrou. A leitura de citação real ainda é indireta em 2026.
Complemente com testes manuais: pergunte ao ChatGPT e ao Perplexity sobre o seu tema central e veja se o seu domínio aparece como fonte. Cruze isso com os ganhos de Core Web Vitals do WordPress, porque página rápida e bem estruturada é pré-condição para o modelo confiar na fonte. Sem dados internos consolidados de citação por IA, recomenda-se teste A/B por ambiente antes de declarar resultado.
Perguntas frequentes sobre o llms.txt no WordPress
O que é o arquivo llms.txt e para que ele serve no WordPress?
O llms.txt é um arquivo markdown na raiz do domínio que entrega aos modelos de IA um índice curado do seu conteúdo. Proposto em 2024, o arquivo serve para orientar crawlers como o GPTBot sobre quais páginas ler primeiro, em até 60 linhas de links descritos em prosa. No WordPress, vive em /llms.txt, ao lado do robots.txt, e reduz o ruído de menu e script que atrapalha a extração de trechos.
É possível criar o llms.txt sem plugin, só via FTP?
Sim, e em muitos casos é o método mais confiável. Por ser texto puro, o llms.txt pode ser escrito em qualquer editor e enviado por FTP para a pasta public_html, sem nenhum plugin instalado. Essa via evita o erro de 404 por rewrite que aparece quando um plugin tenta servir o arquivo dinamicamente em Nginx. O custo é manter o arquivo na mão a cada atualização grande do site.
Por que o GPTBot ignora o llms.txt mesmo com o arquivo no ar?
Porque o GPTBot foi bloqueado antes de chegar ao arquivo. Se o robots.txt não tiver um bloco User-agent: GPTBot com Allow: /, o crawler nem solicita o /llms.txt. Outra causa frequente é o arquivo retornar 404 em Nginx sem try_files, abrindo no navegador mas falhando para o robô. Confira os dois pontos: liberação no robots.txt e status 200 real em aba anônima.
Qual a diferença entre llms.txt e robots.txt para crawlers de IA?
O robots.txt controla permissão e o llms.txt controla contexto. O robots.txt usa diretivas Allow e Disallow para decidir se o GPTBot pode entrar; o índice em markdown orienta o que ler depois que o acesso já foi liberado. Um não substitui o outro: sem robots.txt liberado o crawler não chega ao site, e sem o arquivo ele lê o HTML bruto, mais ruidoso. Os dois trabalham em camadas.
Quanto tempo leva para o ChatGPT reconhecer o llms.txt do site?
Não há prazo oficial, porque o llms.txt é proposta aberta e cada modelo decide a frequência de rastreio. Na prática, crawlers como o GPTBot revisitam sites populares em dias e sites menores em semanas. O sinal mais confiável é ver hits do GPTBot ao /llms.txt nos logs do servidor após a publicação. Citação real em respostas pode levar mais tempo e depende da autoridade geral do domínio.
Próximos passos para ser citado pela IA no WordPress
Configurar o llms.txt no WordPress é a porta de entrada do GEO, mas funciona em conjunto: robots.txt liberado para o GPTBot, schema markup correto e conteúdo em blocos curtos formam a base que faz ChatGPT, Perplexity e Google AI Overviews confiarem na sua fonte. Comece pelo arquivo estático na raiz, valide o status 200 com o crawler e só depois parta para schema e otimização de blocos. Para montar a estrutura completa, o guia de schema markup com Rank Math é o próximo passo natural, e o guia de SEO para WordPress reúne os tutoriais do tema. Para continuar aprendendo, o FULL Academy organiza guias, tutoriais e reviews em um só lugar.
















