📩 Fique por dentro das novidades com a nossa newsletter

Llms.txt no WordPress: O guia em 5 passos

Relacionados

Como desativar wp-cron e configurar um cron real em 5 passos

Relatório de marketing para a diretoria em 5 passos

LTV e payback: Os 3 números que definem o marketing

Conheça a loja da FULL Services

Plugins premium, suporte de verdade e tudo o que seu site WordPress precisa em um só lugar.

Hospedado na raiz do site WordPress, o llms.txt entrega aos modelos de IA um mapa markdown curado do seu conteúdo. Segundo o llmstxt.org (2024), Jeremy Howard propôs o formato em 3 de setembro daquele ano, sempre em /llms.txt. Ele não substitui o robots.txt: indexa contexto, não permissão. Configure-o cedo para disputar citação em ChatGPT e Perplexity.

Um arquivo de texto em markdown hospedado na raiz do domínio, o llms.txt descreve para modelos de linguagem quais páginas do seu WordPress valem a leitura e em que ordem. Ele resolve um problema concreto: crawlers de IA como o GPTBot têm orçamento de leitura limitado e tropeçam em menus, rodapés e scripts. Com o llms.txt você entrega um índice limpo, em prosa, que aponta para os links que importam. Neste hub de conteúdos de SEO WordPress da FULL a lógica é a mesma do GEO/AEO: ser citado pela máquina, não só indexado pelo Google.


Primeiros passos: O que o llms.txt resolve no WordPress

O llms.txt entrega aos crawlers de IA um índice em markdown de 2 a 10 KB que reduz o ruído de leitura. Em vez de varrer o HTML cheio de menu, sidebar e JavaScript, o GPTBot lê só os links curados. Isso aumenta a chance de o modelo citar a passagem certa, e o formato é uma proposta aberta de 2024, ainda sem padrão oficial do Google.

llms.txt e robots.txt: função, formato e efeito no crawler
Arquivo Função principal Formato Efeito no crawler de IA
llms.txt Curar e descrever conteúdo relevante Markdown em prosa, com links Orienta o que ler e em que ordem
robots.txt Permitir ou bloquear acesso Diretivas User-agent / Allow / Disallow Libera ou barra o crawler antes da leitura
sitemap.xml Listar todas as URLs para indexação XML estruturado por tags Alimenta o Google, não o modelo generativo

A confusão mais comum nos tickets de suporte da FULL é tratar o llms.txt como um robots.txt turbinado. São camadas diferentes: o robots.txt decide quem entra, o arquivo orienta quem já entrou. Vale revisar o guia de robots.txt no WordPress antes de seguir.


Como o llms.txt afeta a citação em ChatGPT e perplexity

Um llms.txt bem montado tende a aumentar a densidade de citação porque entrega ao modelo um resumo de 40 a 60 palavras por seção, em vez de um HTML de 300 KB. Quanto mais limpa a fonte, menor o risco de a IA alucinar ou citar um concorrente. O ganho é probabilístico, não garantido.

A relação causal é direta: llms.txt na raiz do domínio, com o GPTBot liberado no robots.txt e o conteúdo apontado em markdown limpo, deixa as páginas elegíveis para citação em ChatGPT. Falte qualquer uma das três pernas e a cadeia quebra. Na base de sites da FULL, a gente vê no suporte que muita gente publica o arquivo mas esquece de liberar o GPTBot, e aí o esforço não rende. O verbete llms.txt do glossário traz a sintaxe mínima do formato.


Passo a passo: Como criar o llms.txt no WordPress

Criar o llms.txt no WordPress leva cerca de 15 minutos e não exige plugin pago: o arquivo é texto puro servido na raiz, igual ao robots.txt. A sequência abaixo cobre da escrita do markdown até a validação com o crawler. Faça nesta ordem para não publicar um arquivo que o GPTBot não consegue ler.

Legenda: a estrutura mínima do llms.txt: título H1, blockquote de resumo e listas de links em markdown.

Passo 1: Escreva o markdown do llms.txt

Comece criando um arquivo de texto chamado llms.txt com um H1 (o nome do site), um parágrafo de resumo entre > e listas de links em markdown agrupadas por seção. O formato proposto em 2024 pede esse esqueleto: # Nome, depois > resumo, depois seções ## Docs e ## Optional. Mantenha cada descrição de link em uma frase factual. Um arquivo de 30 a 60 linhas cobre bem um blog WordPress de porte médio.

Passo 2: Liste as urls que importam

Selecione de 10 a 30 páginas reais do seu WordPress e escreva cada link no formato título: descrição em uma linha. Priorize guias, comparativos e tutoriais com dado próprio, não a página de contato. Puxe os endereços do seu sitemap do WordPress para não inventar slug. Quanto mais específica a descrição, maior a chance de o modelo escolher aquela URL como fonte da resposta.

Passo 3: Suba o arquivo para a raiz do domínio

Envie o llms.txt por FTP ou pelo gerenciador de arquivos da hospedagem para a mesma pasta onde mora o robots.txt, normalmente public_html. O endereço final precisa ser exatamente https://seusite.com/llms.txt, sem subpasta. Em servidor LiteSpeed ou Apache o arquivo estático já é servido direto. Em Nginx sem regra de fallback, confira o Passo 5 antes de comemorar, porque o caminho pode retornar 404.

Passo 4: Libere os crawlers de IA no robots.txt

Abra o robots.txt e adicione blocos User-agent: GPTBot com Allow: / para os agentes que você quer atrair, como GPTBot, ClaudeBot, PerplexityBot e Google-Extended. Sem essa liberação, o crawler nem chega ao llms.txt. Quem usa Rank Math PRO ou Yoast SEO pode editar o robots.txt direto no painel, sem tocar em arquivo. Liberar tudo é o padrão para GEO; bloqueie só se houver decisão editorial de não alimentar IA.

Passo 5: Valide o acesso real do crawler

Teste abrindo https://seusite.com/llms.txt em uma aba anônima e confirme o status 200 com uma ferramenta de header HTTP. Em Nginx, a regra try_files precisa apontar para o arquivo físico, senão o WordPress intercepta a rota e devolve 404 ao GPTBot mesmo com o arquivo no disco. Esse detalhe aparece com frequência em ambientes que rodam por trás de proxy e quebra silenciosamente a estratégia inteira.


Onde o llms.txt do WordPress costuma falhar

A falha mais comum não está no conteúdo, e sim na entrega: em Nginx sem a regra try_files apontando para o arquivo físico, o llms.txt gerado por plugin via rewrite devolve 404 ao GPTBot mesmo abrindo no navegador logado. O arquivo existe, você o vê, mas o crawler recebe erro.

Servir o arquivo como estático real na raiz, fora do roteamento do WordPress, resolve na maioria dos casos. É o motivo de o método via FTP ser mais confiável que o gerado por plugin atrás de proxy.

O segundo ponto cego é multisite e subdiretório. Quando o WordPress roda em /blog ou em rede multisite, cada site precisa do seu próprio /llms.txt na raiz do respectivo host. A gente vê no suporte da FULL instalações que colocam o arquivo em /blog/llms.txt e esperam citação para o domínio inteiro: o crawler procura sempre na raiz e ignora o subdiretório.


Plano FULL: Rank Math PRO no bundle para acelerar o GEO

Manter llms.txt, robots.txt liberado para IA e schema markup estruturado alinhados dá trabalho de configuração. O plano PRO da FULL custa R$849,90 por ano e inclui Rank Math PRO mais outros 16 plugins premium; diluído nos 10 sites do plano, sai a R$85 por site. É aí que o bundle ajuda.

Esse valor cobre a edição de robots.txt no painel, o schema markup automático e os controles de SEO técnico que sustentam a citação por IA, sem precisar comprar licença avulsa de cada plugin separadamente. Para ativar, veja os planos da FULL. A FULL entrega os plugins do bundle, não hospedagem: o arquivo você sobe no seu próprio servidor atual.

Legenda: editar o robots.txt pelo Rank Math PRO evita acesso por FTP e reduz erro de digitação nas diretivas.


Como medir se o llms.txt está rendendo citação

Medir o efeito do llms.txt exige olhar fora do Google Analytics tradicional, porque tráfego de IA chega sem referrer claro: monitore os logs do servidor por user-agent (GPTBot, ClaudeBot, PerplexityBot) e a frequência de visita ao /llms.txt. Um aumento de hits do GPTBot ao arquivo nas semanas seguintes à publicação indica que o crawler o encontrou. A leitura de citação real ainda é indireta em 2026.

Complemente com testes manuais: pergunte ao ChatGPT e ao Perplexity sobre o seu tema central e veja se o seu domínio aparece como fonte. Cruze isso com os ganhos de Core Web Vitals do WordPress, porque página rápida e bem estruturada é pré-condição para o modelo confiar na fonte. Sem dados internos consolidados de citação por IA, recomenda-se teste A/B por ambiente antes de declarar resultado.

Perguntas frequentes sobre o llms.txt no WordPress

O que é o arquivo llms.txt e para que ele serve no WordPress?

O llms.txt é um arquivo markdown na raiz do domínio que entrega aos modelos de IA um índice curado do seu conteúdo. Proposto em 2024, o arquivo serve para orientar crawlers como o GPTBot sobre quais páginas ler primeiro, em até 60 linhas de links descritos em prosa. No WordPress, vive em /llms.txt, ao lado do robots.txt, e reduz o ruído de menu e script que atrapalha a extração de trechos.

É possível criar o llms.txt sem plugin, só via FTP?

Sim, e em muitos casos é o método mais confiável. Por ser texto puro, o llms.txt pode ser escrito em qualquer editor e enviado por FTP para a pasta public_html, sem nenhum plugin instalado. Essa via evita o erro de 404 por rewrite que aparece quando um plugin tenta servir o arquivo dinamicamente em Nginx. O custo é manter o arquivo na mão a cada atualização grande do site.

Por que o GPTBot ignora o llms.txt mesmo com o arquivo no ar?

Porque o GPTBot foi bloqueado antes de chegar ao arquivo. Se o robots.txt não tiver um bloco User-agent: GPTBot com Allow: /, o crawler nem solicita o /llms.txt. Outra causa frequente é o arquivo retornar 404 em Nginx sem try_files, abrindo no navegador mas falhando para o robô. Confira os dois pontos: liberação no robots.txt e status 200 real em aba anônima.

Qual a diferença entre llms.txt e robots.txt para crawlers de IA?

O robots.txt controla permissão e o llms.txt controla contexto. O robots.txt usa diretivas Allow e Disallow para decidir se o GPTBot pode entrar; o índice em markdown orienta o que ler depois que o acesso já foi liberado. Um não substitui o outro: sem robots.txt liberado o crawler não chega ao site, e sem o arquivo ele lê o HTML bruto, mais ruidoso. Os dois trabalham em camadas.

Quanto tempo leva para o ChatGPT reconhecer o llms.txt do site?

Não há prazo oficial, porque o llms.txt é proposta aberta e cada modelo decide a frequência de rastreio. Na prática, crawlers como o GPTBot revisitam sites populares em dias e sites menores em semanas. O sinal mais confiável é ver hits do GPTBot ao /llms.txt nos logs do servidor após a publicação. Citação real em respostas pode levar mais tempo e depende da autoridade geral do domínio.


Próximos passos para ser citado pela IA no WordPress

Configurar o llms.txt no WordPress é a porta de entrada do GEO, mas funciona em conjunto: robots.txt liberado para o GPTBot, schema markup correto e conteúdo em blocos curtos formam a base que faz ChatGPT, Perplexity e Google AI Overviews confiarem na sua fonte. Comece pelo arquivo estático na raiz, valide o status 200 com o crawler e só depois parta para schema e otimização de blocos. Para montar a estrutura completa, o guia de schema markup com Rank Math é o próximo passo natural, e o guia de SEO para WordPress reúne os tutoriais do tema. Para continuar aprendendo, o FULL Academy organiza guias, tutoriais e reviews em um só lugar.

Compartilhe este conteúdo

Equipe Full Services

A FULL. é especialista em WordPress e oferece plugins premium com licenças originais, suporte técnico e instalação facilitada. Já ajudou mais de 25 mil clientes a impulsionar seus sites com performance, segurança e praticidade.

Como desativar wp-cron e configurar um cron real em 5 passos

O WP-Cron é o agendador interno do WordPress que executa

Relatório de marketing para a diretoria em 5 passos

Um relatório de marketing para a diretoria não é o

LTV e payback: Os 3 números que definem o marketing

LTV e payback respondem à pergunta que decide o orçamento
Componentes

Hero Sections

30 componentes

Seções de CTA

14 componentes

Login

14 componentes

Blog

14 componentes

Cabeçalhos

24 componentes

Seções de FAQ

53 componentes

Cadastro

53 componentes

Blog individual

53 componentes

Rodapés

28 componentes

Seções de contato

27 componentes

Seções de preços

27 componentes

Faixas

27 componentes

Portfólio

16 componentes

Seções de equipe

12 componentes

Números

12 componentes

Logotipos

12 componentes

Uma nova era para o WordPress.

A FULL Services redefine o CMS com uma arquitetura modular que transforma o WordPress em um motor de crescimento digital. 

Painéis personalizados

Um novo nível de controle para o WordPress. Acompanhe métricas, automações e evolução do seu site em um único painel visual.

A força por trás de grandes marcas

Para agências, estúdios e profissionais independentes que desejam oferecer soluções de alto nível com sua própria marca.