Estructura web

HTML para IA: cómo estructurar tu web para IA

FERNANDO FERREIRO

Los sistemas de inteligencia artificial que responden preguntas (ChatGPT, Gemini, Perplexity, Google AI Overviews) leen el HTML de tu web para decidir si tu contenido merece ser citado. No ven tu diseño, no ejecutan tus scripts y, en la mayoría de los casos, no renderizan JavaScript. Lo que procesan es el HTML crudo, y si ese HTML no les dice con claridad qué es cada cosa, tu contenido queda fuera de la respuesta.

Optimizar el HTML para que los sistemas de IA lo entiendan es una capa técnica que complementa el SEO clásico y que determina, en mayor medida, si tu marca aparece o no cuando alguien hace una consulta relevante en un entorno generativo.

 

Qué es el HTML semántico y cómo lo define la especificación oficial

El HTML semántico es el uso de etiquetas que describen el significado del contenido, no solo su apariencia visual. Un <article> le dice a la máquina que ese bloque es un contenido independiente y autocontenido. Un <nav> identifica la navegación. Un <h1> marca el titular principal.

La alternativa, anidar todo en <div> y confiar en el CSS para dar una estructura, produce lo que se conoce en el sector como div soup: código que se ve bien en el navegador pero que un sistema de IA no puede interpretar con fiabilidad.

La especificación HTML Living Standard del WHATWG define las etiquetas semánticas y sus funciones. MDN Web Docs las documenta en detalle con ejemplos. El W3C establece los criterios de accesibilidad (WCAG) que también promueven el uso de semántica nativa. Google Search Central lleva años recomendando su aplicación en el SEO técnico. Lo que ha cambiado en los últimos años es que el coste de ignorarlas ya no se limita al posicionamiento clásico: afecta directamente a la visibilidad en entornos de IA generativa.

La evolución del HTML hasta el contexto de la IA

El HTML ha recorrido un camino largo. La web estática de los años noventa usaba etiquetas casi únicamente para presentación. Con la Web 2.0 llegaron JavaScript, el contenido dinámico y los frameworks de renderizado para los usuarios. La web semántica que Tim Berners-Lee describió como visión de futuro apostaba por un lenguaje de marcado que las máquinas pudieran entender sin interpretación humana.

Ese enfoque semántico cobra ahora una nueva relevancia. Los LLMs (modelos de lenguaje de gran escala) procesan HTML como lo haría un lector que no ve el diseño: solo el texto y la estructura de las etiquetas. Cuanto más clara es esa estructura, más fácil resulta extraer información útil y atribuirla correctamente.

Etiquetas semánticas principales y para qué sirve cada una

Estas son las etiquetas que los sistemas de IA identifican y utilizan para dar sentido al contenido:

  • <article>: contenido independiente y autocontenido. Una entrada de blog, una noticia, una ficha de producto. Tiene sentido por sí sola fuera del contexto de la página.
  • <section>: agrupación temática dentro de un documento. No es independiente por sí sola, necesita contexto. Dentro de un artículo puede haber varias secciones.
  • <main>: el bloque de contenido principal de la página. Solo puede haber uno por documento. Refuerza las relaciones semánticas para los rastreadores de IA.
  • <nav>: menús de navegación, tablas de contenido, conjuntos de enlaces internos agrupados con una función clara.
  • <aside>: contenido complementario relacionado con el principal pero que puede entenderse de forma independiente (barras laterales, datos relacionados, notas).
  • <header> y <footer>: cabecera y pie de la página o de una sección. Permiten a la IA distinguir el contenido principal del marco estructural.
  • <figure> y <figcaption>: para imágenes, gráficos o ejemplos visuales con su descripción asociada.

Etiquetado HTML para IA

Las etiquetas puramente de diseño como <span> o <div> no aportan información sobre el significado del contenido. Según W3Techs, aproximadamente el 98% de los sitios web ya usan HTML5 como base. La adopción del estándar es casi universal: el problema no es el formato sino el uso correcto de las etiquetas semánticas que ese estándar define.

Cómo leen el HTML los sistemas de IA y dónde falla la mayoría de webs

Los rastreadores de los LLMs y los crawlers de los buscadores con IA acceden al HTML de una página de forma muy parecida: solicitan el documento, leen el código resultante y extraen el contenido textual con su estructura. La diferencia con un navegador humano es que no interpretan estilos, no interactúan con la interfaz y, en la mayoría de los casos, no ejecutan JavaScript.

Esto tiene una consecuencia directa: si tu menú, tu tabla de precios, tus preguntas frecuentes o tu contenido principal se generan mediante JavaScript en el cliente, un sistema de IA probablemente no los procesará. Solo existirá para él lo que esté en el HTML estático del servidor. Googlebot sí renderiza JavaScript (aunque con cierto retraso), pero los LLMs que alimentan ChatGPT, Perplexity o los AI Overviews de Google trabajan mayoritariamente con el HTML crudo.

JavaScript dinámico frente a HTML estático para IA

La diferencia entre SSR (renderizado en servidor) y CSR (renderizado en cliente) es crítica para que los sistemas de IA extraigan la información:

  • En un sitio con SSR, el HTML que llega al rastreador ya contiene el texto completo.
  • En un sitio con CSR puro (React, Angular o Vue sin configuración adicional), el HTML inicial es prácticamente una página vacía que solo cobra sentido cuando el navegador ejecuta los scripts.

La solución para proyectos basados en frameworks de JavaScript pasa por el prerendering o por frameworks como Next.js, que permiten generar HTML estático en el servidor. Para contenido crítico, también funciona incluirlo en el HTML inicial con etiquetas <noscript> como alternativa visible para rastreadores.

Los errores más habituales que dificultan que la IA extraiga el contenido

Estos son algunos de los fallos que puedes tener en tu web y que hacen más difícil tu visibilidad SEO para IA:

  • Contenido principal renderizado con JavaScript. Si el texto de tu página no aparece en el HTML que devuelve el servidor, los LLMs no lo ven. Afecta especialmente a SPAs, frameworks sin SSR y widgets dinámicos sin una alternativa de HTML puro.
  • Div soup. Páginas donde todo el contenido está envuelto en <div> sin ninguna etiqueta semántica. La IA no puede distinguir el encabezado del pie, el artículo del menú lateral ni el contenido principal de la publicidad.
  • Múltiples H1 o jerarquía rota. Tener varios <h1> en una misma página o saltar de H2 a H4 sin H3 desorienta tanto al rastreador como al sistema de IA sobre cuál es el tema principal.
  • Imágenes sin atributo alt. El contenido que solo existe en formato imagen es invisible para los LLMs. Si una infografía contiene datos importantes, esos datos deben estar también en texto HTML.
  • FAQs o tablas ocultas con CSS o JS. Los acordeones que se despliegan al hacer clic suelen depender de JavaScript. Si el contenido colapsado no está en el HTML estático, la IA no lo ve.
  • Lazy loading excesivo. La carga diferida aplicada en exceso puede impedir que los rastreadores de IA accedan a bloques relevantes de la página.

Qué papel tienen los atributos ARIA

Los atributos ARIA (Accessible Rich Internet Applications) están pensados como complemento (no como sustituto) de las etiquetas semánticas nativas. Un role="navigation" sobre un <div> puede simular lo que hace un <nav>, pero siempre es preferible usar el elemento semántico nativo cuando existe.

Evita añadir roles ARIA redundantes sobre elementos que ya los llevan implícitos: role="banner" en un <header> o role="list" en un <ul> no aportan nada y aumentan innecesariamente el tamaño del DOM.

HTML semántico para IA frente al SEO clásico: en qué se parecen y en qué difieren

El SEO clásico y la optimización HTML para IA comparten una base: el contenido bien estructurado, claro y relevante rinde mejor en ambos entornos. Pero hay diferencias de énfasis que conviene tener claras.

AspectoSEO clásicoHTML para IA
EstructuraJerarquía de encabezados, densidad de keywordEtiquetas semánticas, bloques autocontenidos
ContenidoExtensión, palabras clave, intención de búsquedaRespuestas directas, extractabilidad, precisión
Datos estructuradosÚtiles para rich snippets en SERPÚtiles para que la IA identifique el tipo de contenido
JavaScriptGooglebot renderiza JS (con retrasos)La mayoría de LLMs no ejecuta JS
MetadatosTitle, meta description, canonicalOpen Graph, schema.org, atributo lang, hreflang
Métrica principalPosición en SERP, CTR orgánicoCitación en respuestas de IA, visibilidad en AI Overviews

Algunos estudios apuntan a que los contenidos en las primeras posiciones de la SERP tienen más probabilidades de ser citados por sistemas de IA, aunque la correlación no es perfecta: posicionar bien en Google no garantiza aparecer en una respuesta generativa, ni viceversa. Puedes leer nuestros artículos sobre cómo posicionar en ChatGPT o cómo posicionar tu empresa en la IA si quieres más información.

La combinación de HTML semántico con datos estructurados en JSON-LD es la que mayor compatibilidad ofrece tanto con Googlebot como con los rastreadores de IA, siendo capas que se complementan.

Datos estructurados y schema.org: el lenguaje que entiende la IA

El HTML semántico le dice a la máquina que algo es un artículo, un encabezado o una lista. Los datos estructurados van un paso más allá: le dicen exactamente qué tipo de contenido es, quién lo escribió, cuándo se publicó y de qué trata.

Schema.org es el vocabulario estándar para esto, y el formato recomendado actualmente es JSON-LD, que se incluye en el <head> de la página sin alterar el HTML visible.

Tipos de schema más relevantes para contenido editorial

  • Article / BlogPosting: para entradas de blog y contenido editorial. Permite marcar autor, fecha de publicación, fecha de modificación, headline y descripción.
  • FAQPage: para secciones de preguntas frecuentes reales. Solo válido si las preguntas y respuestas están visibles en el HTML. Si no lo están, el marcado no es válido.
  • HowTo: para guías paso a paso. Marca cada paso con nombre y descripción estructurada.
  • Organization / Person: para identificar la marca o el autor del contenido. Refuerza la atribución y la autoridad de la fuente ante los sistemas de IA.
  • LocalBusiness: para negocios con presencia física. Permite marcar nombre, dirección, teléfono y horario, reforzando la relevancia para búsquedas locales en entornos generativos.

Ejemplo de estructura combinada: HTML semántico con microdatos

Un artículo bien preparado para IA combina el marcado semántico en el cuerpo con el schema en el head. El siguiente bloque muestra la estructura básica con microdatos integrados en el HTML, útil cuando no es posible añadir JSON-LD en el head:

<article itemscope itemtype="https://schema.org/BlogPosting">
  <header>
    <h1 itemprop="headline">Título del artículo</h1>
    <time datetime="2026-05-06" itemprop="datePublished">6 de mayo de 2026</time>
  </header>
  <div itemprop="articleBody">
    <p>Contenido del artículo con HTML semántico.</p>
  </div>
  <footer>
    <p>Autor: <span itemprop="author">Nombre del autor</span></p>
  </footer>
</article>

No uses datos estructurados que no coincidan con el contenido visible de la página. Google y los sistemas de IA verifican la coherencia entre el schema y el HTML. Si marcas algo como FAQPage pero las respuestas no están en el texto, el marcado no aporta valor y puedes tener problemas de calidad en Search Console.

Configuración de robots y rastreadores de IA

El archivo robots.txt sigue siendo el mecanismo estándar para indicar a los rastreadores qué partes del sitio pueden indexar. En los últimos años ha surgido el concepto de LLMs.txt, un archivo complementario pensado específicamente para dar instrucciones a los rastreadores de sistemas de IA generativa. Todavía no es un estándar consolidado, pero algunos sitios ya lo implementan como capa adicional de control.

Lo más importante es asegurarse de no bloquear por error a los rastreadores de IA en el robots.txt. Si el contenido de valor no es rastreable, ninguna optimización semántica tiene efecto (en este post tienes la explicación para saber si tu web permite el rastreo de crawlers de la IA).

Si quieres profundizar en qué estructura HTML facilita específicamente la extracción por parte de sistemas de IA, puedes consultar este artículo sobre estructura HTML y extracción de IA.

Idiomas, SEO local y HTML semántico para IA

Las etiquetas HTML son independientes del idioma: <article> funciona igual en español que en inglés. Pero hay atributos que sí afectan a cómo los sistemas de IA procesan el idioma del contenido.

El atributo lang en la etiqueta <html> le indica al rastreador y al modelo de lenguaje en qué idioma está escrito el contenido. Para un sitio en español de España, lo correcto es lang="es" o lang="es-ES". Esto ayuda a los LLMs a procesar el texto con el contexto lingüístico adecuado y a los buscadores a servirlo al público correcto.

Para sitios con versiones en varios idiomas, el atributo hreflang en el <head> indica qué URL corresponde a cada variante lingüística y geográfica. Es relevante tanto para el SEO internacional clásico como para evitar que los sistemas de IA mezclen versiones de contenido de distintas regiones.

En el caso del SEO local, el schema LocalBusiness permite marcar el nombre, la dirección, el teléfono y el horario de un negocio físico de forma que los sistemas de IA puedan identificarlo como una entidad geolocalizada. Combinado con menciones de la localidad en el texto visible, refuerza la relevancia para búsquedas locales en entornos generativos.

Hay además consideraciones legales relevantes para el mercado europeo: el RGPD y la normativa ePrivacy afectan a cómo se implementan los scripts de consentimiento de cookies. Un gestor de consentimiento mal implementado puede bloquear la carga de contenido o añadir capas de JavaScript que dificulten el rastreo. Conviene revisar que las soluciones de consent management no interfieran con el HTML estático de las páginas de contenido.

Velocidad web y herramientas de validación

El HTML semántico y el rendimiento técnico van de la mano. Un sitio con buen HTML semántico tiende a tener un DOM más limpio y ligero, lo que se traduce en mejores métricas de Core Web Vitals:

  • LCP (Largest Contentful Paint).
  • CLS (Cumulative Layout Shift).
  • FID (First Input Delay).

Google utiliza estas métricas como señal de calidad, y los rastreadores de IA tienen más facilidad para procesar páginas que cargan rápido y tienen poco ruido en el código.

La accesibilidad y la semántica comparten la misma base técnica. Un HTML bien estructurado permite que los lectores de pantalla naveguen correctamente por el contenido. Esa misma estructura es la que aprovechan los sistemas de IA para identificar el contenido principal, los encabezados, las listas y las tablas.

Herramientas para validar la calidad del HTML

  • W3C Validator (validator.w3.org): comprueba errores de sintaxis HTML. Un HTML con errores graves puede impedir que un rastreador interprete correctamente la estructura de la página.
  • Google Lighthouse: audita el rendimiento, la accesibilidad, el SEO y las buenas prácticas. Un score bajo en la pestaña de accesibilidad suele indicar problemas semánticos que también afectan a la legibilidad para IA.
  • Axe DevTools y WAVE: herramientas especializadas en accesibilidad que detectan usos incorrectos de ARIA y etiquetas semánticas.
  • Screaming Frog: rastrea el sitio e identifica problemas de encabezados duplicados, atributos alt ausentes y estructura de URLs.
  • Google Rich Results Test: valida que los datos estructurados son correctos y coinciden con el contenido visible.

Frameworks, CMS y librerías: cómo afectan al HTML que ve la IA

No todos los entornos de desarrollo generan el mismo HTML. La elección del CMS o del framework de frontend tiene un impacto directo en la calidad semántica del código que llega al rastreador:

  • WordPress con un tema bien construido genera HTML semántico de base. El problema suele estar en los constructores de páginas visuales (Elementor, Divi) que añaden capas de <div> innecesarias. Con plugins como Rank Math o Yoast SEO se puede implementar schema sin tocar código.
  • React, Vue y Angular sin configuración de SSR producen HTML casi vacío en el servidor. Para resolver esto, Next.js (React), Nuxt (Vue) y Angular Universal permiten el renderizado en servidor, generando HTML estático que los rastreadores pueden leer directamente.
  • Generadores de sitios estáticos como Hugo, Jekyll o Eleventy producen HTML puro por defecto, lo que los convierte en una opción muy eficiente para sitios de contenido donde la extractabilidad es prioritaria.
  • Bootstrap 5 y Tailwind UI incluyen componentes con etiquetas semánticas predefinidas. Usados correctamente, facilitan mantener una estructura HTML limpia sin esfuerzo adicional.

Errores comunes al preparar HTML para IA y cómo corregirlos

Más allá de los problemas técnicos de estructura, hay errores editoriales y de implementación que se repiten con frecuencia y que reducen la probabilidad de que el contenido sea procesado correctamente por sistemas de IA.

  • Usar encabezados por su tamaño visual, no por su función semántica. Lo que se hace mal: elegir <h2> o <h3> según el tamaño que se quiere conseguir visualmente, sin respetar la jerarquía lógica. La corrección: los encabezados se usan según su función semántica. El diseño visual se gestiona con CSS, no con el nivel del encabezado.
  • Marcar FAQs con schema cuando el contenido está oculto en un acordeón JS. Lo que se hace mal: añadir el schema FAQPage pero mostrar las respuestas en un acordeón que solo se despliega con JavaScript. La corrección: las respuestas deben estar en el HTML estático antes de añadir el schema. Si el contenido no es visible en el HTML crudo, el marcado no es válido.
  • Poner información importante solo en imágenes sin alternativa textual. Lo que se hace mal: usar infografías o tablas en PNG sin equivalente textual en el HTML. La corrección: las tablas deben ser <table>, no imágenes de tablas. El atributo alt no sustituye al texto real cuando el contenido es complejo.
  • Implementar schema con datos que no coinciden con el contenido visible. Riesgo: Google penaliza la incoherencia entre el marcado y la página real. Los sistemas de IA aprenden a desconfiar de fuentes que presentan discrepancias entre el schema y el HTML visible.
  • Usar múltiples H1 sin justificación semántica. La norma es un único H1 por página. La excepción ocurre cuando una página contiene varios <article> completamente independientes entre sí, donde cada uno puede llevar su propio H1 interno. En una página de contenido normal, un solo H1 es la práctica correcta.

Checklist: cómo auditar y mejorar el HTML de tu web para sistemas de IA

Este proceso está pensado para webs ya publicadas que quieren mejorar su visibilidad en entornos de IA sin descuidar el trabajo de SEO hecho hasta ahora.

  1. Valida el HTML con el W3C Validator. Accede a validator.w3.org y comprueba que tu HTML no tiene errores de sintaxis. Los errores graves pueden impedir que un rastreador interprete correctamente la estructura de la página.
  2. Comprueba que el contenido principal existe en el HTML estático. Abre la página con JavaScript desactivado o revisa el código fuente. Si el contenido clave no aparece, necesitas renderizado en servidor (SSR) o páginas estáticas generadas en build time.
  3. Revisa la jerarquía de encabezados. Un único H1 por página. Los H2 definen los bloques temáticos principales. Los H3 desarrollan subtemas dentro de cada H2. Sigue un orden y no hagas saltos de nivel solo por el diseño.
  4. Sustituye los div sin función semántica. Identifica los bloques que actualmente son <div> y que deberían ser <article>, <section>, <nav>, <aside> o <main>. Haz el cambio solo cuando sea correcto semánticamente.
  5. Añade atributos alt a todas las imágenes con contenido relevante. El alt debe describir lo que muestra la imagen de forma útil. Las imágenes puramente decorativas pueden llevar alt="".
  6. Implementa JSON-LD para el tipo de contenido principal. Para un blog, usa BlogPosting o Article. Incluye al menos: headline, author, datePublished, dateModified y description. Verifica que coincide con el contenido visible.
  7. Audita con Lighthouse. Ejecuta Lighthouse desde Chrome DevTools o PageSpeed Insights. Un score bajo en la pestaña de accesibilidad suele indicar problemas semánticos que también afectan a la legibilidad para IA.
  8. Comprueba el robots.txt y los permisos de rastreo. Asegúrate de que no estás bloqueando por error a los rastreadores de IA. Revisa si tienes directivas Disallow que afecten a las secciones de contenido que quieres que sean visibles.
  9. Prueba cómo interpreta tu contenido un LLM. Pega la URL de tu página en ChatGPT o Perplexity y pídele que resuma el contenido. Si la respuesta no refleja lo que has escrito, es una señal de que la estructura o el extracto de información tienen margen de mejora.

Cómo medir el impacto de mejorar el HTML para IA

Una de las dificultades de trabajar en visibilidad para entornos generativos es que las métricas son menos directas que las del SEO clásico. No hay una posición en SERP que leer de un vistazo, pero sí hay indicadores que permiten evaluar si los cambios están funcionando.

  • Impresiones en AI Overviews: Google Search Console empieza a mostrar datos de visibilidad en los resultados con IA. Monitoriza las impresiones de tus páginas más optimizadas antes y después de los cambios.
  • Citaciones en herramientas de IA: realiza consultas manuales en ChatGPT, Perplexity y Gemini con preguntas relacionadas con tu contenido. Anota si tu dominio aparece citado como fuente en las menciones de IA.
  • CTR y tráfico orgánico: el HTML semántico bien implementado mejora la aparición en rich snippets y featured snippets, con impacto directo en el CTR de las páginas optimizadas.
  • Cobertura de indexación: revisa en Search Console el porcentaje de URLs indexadas y los errores de rastreo. Un HTML mal formado puede generar problemas de indexación que el semántico correcto evita.
  • Score de accesibilidad en Lighthouse: buen indicador proxy de la calidad semántica del HTML. Medir antes y después de los cambios muestra la evolución técnica.

No existe actualmente ninguna herramienta que mida de forma automática y fiable el porcentaje de veces que un sitio es citado en respuestas de IA. El monitoreo manual sigue siendo la forma más precisa, aunque existen plataformas emergentes de brand monitoring para IA que empiezan a ofrecer datos en esta dirección.

Preguntas frecuentes sobre HTML para IA

¿Necesito cambiar todo mi HTML para que la IA me lea bien?

No. El punto de partida es hacer una auditoría GEO de lo que tienes. En muchos casos, los cambios más impactantes son puntuales: corregir la jerarquía de encabezados, añadir una etiqueta <main> donde falta, asegurarse de que el contenido está en HTML estático. No es necesario reescribir la web desde cero.

¿El HTML semántico garantiza que apareceré en las respuestas de ChatGPT o Gemini?

No. El HTML semántico mejora la probabilidad de que tu contenido sea procesado e interpretado correctamente. La citación en respuestas de IA depende también de la relevancia del contenido, la autoridad de la fuente y el momento en que esos sistemas entrenaron sus modelos. Lo que sí puedes controlar es que, cuando te rastreen, encuentren un HTML que puedan leer sin obstáculos.

¿Qué diferencia hay entre <article> y <section>?

Un <article> es contenido que tiene sentido por sí solo fuera del contexto de la página: una entrada de blog, una noticia, una reseña. Una <section> es una agrupación temática dentro de un documento más amplio. Una página puede tener varias <section> dentro de un único <article>.

¿El atributo lang del HTML afecta a cómo me leen los sistemas de IA?

Sí. El atributo lang en la etiqueta <html> indica al sistema de IA en qué idioma está escrito el contenido. Para un sitio en español de España, lo correcto es lang="es" o lang="es-ES". Esto ayuda a los modelos de lenguaje a procesar el texto con el contexto lingüístico adecuado.

¿Necesito conocimientos de programación para mejorar el HTML de mi web?

Depende del punto de partida. Con WordPress y un tema bien estructurado puedes mejorar mucho sin tocar código: eligiendo bien los bloques, respetando los niveles de encabezado y añadiendo schema con plugins como Rank Math o Yoast. Para cambios más profundos en la estructura HTML del tema, se necesita acceso al código o ayuda de un desarrollador web.

¿Qué es LLMs.txt y para qué sirve?

LLMs.txt es un archivo de texto que algunos sitios están empezando a implementar como complemento del robots.txt, pensado específicamente para dar instrucciones a los rastreadores de sistemas de IA generativa. Todavía no es un estándar consolidado, pero apunta a la dirección en que va la gestión de permisos de rastreo para entornos generativos.

¿Cuándo se justifica usar más de un H1 en una página?

La práctica habitual es un único H1 por página. La excepción ocurre cuando una página contiene varios <article> completamente independientes entre sí, donde cada uno puede llevar su propio H1 interno. En una página de contenido normal tiene que haber un único H1.

Por dónde empezar si quieres que tu web funcione mejor en entornos de IA

El HTML semántico no es una solución mágica, pero en nuestra agencia GEO sabemos que sí es la base técnica sobre la que se construye cualquier estrategia de visibilidad en IA. Un contenido bien escrito dentro de una estructura HTML confusa tiene muchas menos posibilidades de ser extraído, citado o referenciado por un sistema generativo.

El orden lógico de trabajo es este:

  1. Primero, asegúrate de que el contenido principal está en el HTML estático y es legible sin JavaScript.
  2. Segundo, revisa la jerarquía de encabezados y sustituye los <div> que deberían ser etiquetas semánticas.
  3. Tercero, implementa JSON-LD para el tipo de contenido que produces.
  4. Cuarto, valida con el W3C, audita con Lighthouse y prueba cómo un LLM interpreta tus páginas más importantes.

No hace falta hacerlo todo a la vez. Un avance incremental sobre las páginas con más tráfico o más potencial de citación ya produce resultados medibles en Search Console y en la presencia de la marca en respuestas generativas.