Legendas de vídeo no WordPress se resolvem com um arquivo WebVTT por faixa de idioma e uma transcrição em texto na própria página. Segundo a WebAIM Million (2024), a média foi de 56,8 erros de acessibilidade por página inicial. A faixa .vtt pesa poucos KB e não afeta o LCP. Comece pelo vídeo de maior tráfego.
Adicionar legendas de vídeo no WordPress significa anexar uma faixa de texto sincronizada ao player e publicar a transcrição correspondente no corpo da página. O caminho mais solido usa o formato WebVTT (.vtt) com a tag do HTML5, porque ele funciona tanto na biblioteca de mídia nativa quanto em players de plugins. A gente vê no suporte da FULL que a maioria dos sites trata legenda como detalhe estético, quando na prática ela é o que torna o conteúdo audível acessível para usuário surdo e legível para o crawler do Google. Este guia em 5 passos cobre a estrutura do arquivo, a validação WCAG e o impacto em SEO. Para o contexto do cluster, veja os guias de acessibilidade WordPress da FULL.
Primeiros passos: Visão geral das legendas de vídeo
Legendas de vídeo no WordPress dependem de três decisões antes de qualquer plugin: formato do arquivo, origem da hospedagem e presença de transcrição. O formato padrão é o WebVTT, suportado nativamente por Chrome, Firefox e Safari desde 2018, e a faixa pesa poucos KB.
A tabela abaixo resume as 5 etapas, cada objetivo e o teste que comprova que ela funcionou. Em sites que chegam ao suporte da FULL com vídeo “mudo” para leitor de tela, o erro quase sempre está na faixa ausente ou no idioma não declarado, não no plugin em si. Por isso o roteiro começa pelo arquivo e termina na validação WCAG.
| Etapa | Objetivo | Check de validação |
|---|---|---|
| Gerar o .vtt | Criar a faixa de texto sincronizada | Abrir o arquivo e ver o cabeçalho WEBVTT na 1a linha |
| Declarar idioma | Definir srclang e label na tag track | Leitor de tela anuncia o idioma correto |
| Hospedar na origem | Servir o .vtt do mesmo domínio | Legenda aparece no Safari sem erro de CORS |
| Publicar transcrição | Tornar o áudio indexável e legível | Texto da fala visível na página HTML |
| Validar WCAG | Confirmar conformidade 1.2.2 | WAVE sem erro de mídia sincronizada |
Legenda: a faixa .vtt anexada via tag track é o que o leitor de tela e o crawler enxergam, não o áudio do vídeo.
Por que legendas de vídeo importam para acessibilidade e SEO
Legendas de vídeo cumprem duas funções que se reforçam: conformidade com o critério WCAG 2.1 nível A (1.2.2 Legendas) e indexação do conteúdo falado pelo Google. A WebAIM Million de 2024 registrou média de 56,8 erros de acessibilidade por página, e mídia sincronizada sem alternativa está entre as falhas mais caras de corrigir depois.
Um vídeo sem faixa de texto é, para o crawler, um bloco opaco de poucos bytes de metadado. A gente vê no suporte da FULL que boa parte dos sites institucionais publica vídeo de apresentação sem nenhuma legenda, perdendo o usuário surdo e a chance de ranquear pela transcrição. Linkar bem ajuda: o tema da acessibilidade web WCAG conecta legenda, contraste e navegação por teclado num mesmo padrão de conformidade.
A faixa WebVTT: Estrutura do arquivo de legendas de vídeo
O arquivo WebVTT é a base técnica de qualquer legenda de vídeo servida em HTML5: texto puro, extensão .vtt, codificação UTF-8 e cabeçalho WEBVTT na primeira linha. Um .vtt de vídeo de 10 minutos costuma pesar de 4 a 12 KB, sem impacto mensurável no LCP.
Cada bloco da faixa tem um intervalo de tempo no formato de horas, minutos e segundos seguido da linha de fala correspondente. Em testes que a gente acompanha na base FULL (150 mil sites conectados), o erro recorrente é salvar o arquivo em ANSI em vez de UTF-8: o acento da legenda vira caractere quebrado e o Safari recusa a faixa em silêncio, sem mensagem de erro. Como o peso do arquivo é mínimo, não há custo no Core Web Vitals da página, e o contraste do estilo padrão da legenda ainda soma para o critério de contraste de cor exigido pelo WCAG.
Passo a passo: Como adicionar legendas de vídeo em 5 passos
Este procedimento leva um vídeo da biblioteca de mídia ao player com legenda funcional e transcrição publicada em cerca de 20 a 30 minutos por vídeo de 10 minutos. Cada passo abaixo é um H3 com um teste de validação ao final. A ordem importa: declarar o idioma antes de hospedar evita o retrabalho de re-upload que a gente vê com frequência nos tickets da FULL. Ferramentas usadas: a transcrição automática do YouTube ou do Whisper para o rascunho, e o WAVE para a checagem final.
Passo 1: Gere a faixa de legendas de vídeo em WebVTT
Comece com um rascunho automático para encurtar o trabalho: o YouTube gera uma transcrição sincronizada que você exporta como .vtt, e a ferramenta Whisper (open source da OpenAI) faz o mesmo offline. O rascunho automático acerta cerca de 80 a 90% das palavras em português claro, então reserve tempo para revisar nomes próprios e pontuação. Salve sempre em UTF-8.
Passo 2: Declare srclang e label na tag track
Anexe a faixa ao player com . O atributo srclang é o que o leitor de tela usa para anunciar o idioma; sem ele, a legenda carrega mas a tecnologia assistiva não sabe lê-la. O default marca a faixa exibida automaticamente.
Passo 3: Hospede o .vtt na mesma origem do site
Suba o arquivo .vtt para a biblioteca de mídia do próprio WordPress ou para o mesmo domínio do site. Arquivo .vtt com tag track sem srclang em player HTML5 resulta em legenda que carrega mas o leitor de tela ignora o idioma. Já a faixa hospedada em CDN externa sem header Access-Control-Allow-Origin some no Safari sem erro visível, por bloqueio de CORS.
Passo 4: Publique a transcrição em texto na página
Cole a transcrição completa do áudio como texto HTML normal abaixo do vídeo, dentro de um bloco recolhível ou de uma seção com título. É a transcrição na página, e não a legenda dentro do vídeo, que o Google indexa e que uma IA generativa cita. Esse passo transforma 10 minutos de fala em conteúdo rastreável.
Passo 5: Valide a conformidade no WAVE
Rode a página final no avaliador WAVE, da WebAIM, que aponta mídia sincronizada sem alternativa. Confirme que não há erro de “missing captions” e que a transcrição está no DOM. Em vídeo incorporado via iframe do YouTube sem legenda própria e tema sem fallback de transcrição, o conteúdo fica invisível para o usuário surdo e para o crawler ao mesmo tempo.
Plugins e players: Onde as legendas de vídeo se encaixam
A escolha do player define quanto trabalho manual a legenda exige, e quatro caminhos cobrem quase todos os casos. O player nativo do HTML5 aceita a tag direto e é o mais leve dos quatro, sem dependência de plugin.
O Tutor LMS PRO, voltado a cursos, gerencia legendas por aula e mantém a transcrição junto da lição. O Elementor PRO incorpora vídeo com player próprio, mas não gera o .vtt: você ainda precisa do arquivo. O YouTube serve legenda automática, porém perde a transcrição indexável no seu domínio. A gente recomenda no suporte da FULL hospedar o vídeo crítico de forma acessível em vez de depender só do embed; o tutorial sobre hospedagem de vídeo acessível para WordPress detalha a decisão, e o comparativo YouTube vs Vimeo para vídeos no WordPress ajuda a escolher a origem.
Plataforma FULL: Legendas de vídeo sem montar a stack sozinho
Montar legendas de vídeo acessíveis exige Tutor LMS PRO para cursos, um tema leve e plugins de mídia que não inflem o Core Web Vitals, e licenciar cada um avulso encarece rápido. No plano PRO da FULL, por R$849 por ano, você ativa o bundle com esses plugins em um clique.
São 17 plugins inclusos no plano, com Tutor LMS PRO e Elementor PRO entre eles. Dividido pela quantidade de sites que o plano cobre, isso fica em torno de R$85 por site, contra a soma de licenças individuais que passa fácil de R$2.000 ao ano. A gente vê no suporte da FULL que o gargalo raramente é o conhecimento técnico, e sim juntar e manter as ferramentas atualizadas. Conheça os planos da FULL para comparar com o que você paga hoje em licenças separadas. Para aprofundar no plugin de cursos, veja o Tutor LMS PRO na FULL.
Legendas de vídeo: O que evitar antes de publicar
Três erros derrubam legendas de vídeo que pareciam corretas, e todos aparecem só depois da publicação. O primeiro é confiar na legenda automática sem revisão: ela tende a errar termos técnicos e pontuação, o que vira ruído em vez de acessibilidade real.
O segundo erro é tratar legenda embutida no vídeo (open caption, queimada direto na imagem) como se fosse faixa de texto separada; ela não é selecionável, não é indexável e não atende ao WCAG da mesma forma que o WebVTT. O terceiro é esquecer a transcrição, deixando o áudio inteiro fora do alcance do crawler. Para entender como o texto descritivo trabalha em conjunto, o comparativo entre texto alt da imagem e título da imagem mostra a mesma lógica aplicada a mídia, e esse cuidado se conecta ao alt-text e ao SEO técnico da página.
Perguntas frequentes sobre legendas de vídeo
É possível adicionar legendas de vídeo no WordPress sem instalar plugin?
Sim. O player nativo do HTML5 aceita a tag <track> apontando para um arquivo WebVTT, sem nenhum plugin. Você sobe o .vtt na biblioteca de mídia, insere o vídeo via bloco de vídeo do editor e adiciona a faixa no HTML. O limite é a interface: gerenciar muitas faixas manualmente fica trabalhoso, e aí um plugin como o Tutor LMS PRO compensa. Para um ou dois vídeos, a via nativa resolve em minutos.
Por que a legenda some no Safari mas funciona no Chrome?
Porque o Safari aplica a política de CORS de forma mais rígida em arquivos de faixa. Quando o .vtt está hospedado em uma CDN ou domínio diferente do site, sem o header Access-Control-Allow-Origin, o Safari bloqueia a legenda sem mostrar erro visível, enquanto o Chrome às vezes tolera. A correção é hospedar o arquivo .vtt na mesma origem do site ou liberar o cabeçalho CORS na CDN. A gente vê esse caso com frequência nos tickets da FULL.
Qual a diferença entre legenda WebVTT e transcrição na página?
A legenda WebVTT é uma faixa de texto sincronizada que aparece sobre o vídeo, intervalo a intervalo. A transcrição é o texto corrido da fala publicado no corpo da página, fora do player. As duas se complementam: a faixa WebVTT atende ao usuário surdo durante a reprodução, e a transcrição em HTML é o que o Google indexa e uma IA cita. Um vídeo de 10 minutos vira algo entre 1.200 e 1.800 palavras de transcrição rastreável.
Quanto tempo leva para legendar um vídeo de 10 minutos?
Em torno de 20 a 30 minutos por vídeo, partindo de um rascunho automático. A geração inicial pelo YouTube ou pelo Whisper leva poucos minutos e acerta cerca de 80 a 90% das palavras em português claro. O tempo real está na revisão de nomes próprios, números e pontuação, mais o ajuste de sincronia. Sem o rascunho automático, transcrever do zero pode triplicar esse tempo.
O que o WCAG 2.1 exige para vídeos com áudio?
O critério 1.2.2 do WCAG 2.1, no nível A, exige legendas sincronizadas para todo conteúdo de vídeo pré-gravado que tenha áudio. No nível AA, o critério 1.2.4 estende a exigência para vídeo ao vivo. Na prática, isso significa faixa de legenda em todo vídeo com fala, e a transcrição como alternativa textual recomendada. A validação pelo WAVE, da WebAIM, sinaliza quando a mídia sincronizada está sem essa alternativa.
Próximos passos para publicar vídeo acessível
Legendas de vídeo bem feitas combinam três camadas: a faixa WebVTT para o player, a transcrição em HTML para o crawler e a validação WCAG para garantir conformidade. Comece pelo vídeo de maior tráfego, gere o .vtt a partir de um rascunho automático revisado, hospede o arquivo na mesma origem do site e publique a transcrição abaixo do player. A diferença entre um vídeo opaco e um vídeo acessível costuma ser meia hora de trabalho por peça. Para continuar aprendendo, o FULL Academy reúne os tutoriais, guias e reviews de WordPress em um só lugar, e o guia de como incorporar vídeo em posts do blog fecha o fluxo de publicação.
















