Google ha realizado cambios en algunos de sus documentos de ayuda de búsqueda de Google en los últimos días respecto del tamaño del HTML, entre otras modificaciones. Los documentos actualizados incluyen códigos de estado HTTP, Googlebot y documentación de ayuda para la publicación de trabajos. Ten en cuenta que el aspecto del código de estado HTTP no es nuevo, el contenido simplemente se movió de una ubicación a otra.
Robot de Google
La gran noticia en esta actualización es que Googlebot puede rastrear los primeros 15 MB de contenido en un archivo HTML o en un archivo de texto compatible. Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB de contenido para su indexación.
Por alguna razón, los SEO sintieron que 15 MB de HTML sin procesar por página no son suficientes. 15 MB es una cantidad enorme de HTML por URL. No incluye la descarga de videos, imágenes, etc., es solo el código fuente HTML. Nuevamente, es un límite enorme que simplemente se agregó a la documentación, pero ha estado vigente en Google durante mucho tiempo.
Gary Illyes de Google hizo suyo este tema para aclarar las cosas y publicó una entrada de blog con un título agradable en el blog de Google llamado Googlebot y lo de los 15 MB. En resumen, Illyes explica: «Hay muy pocas páginas de Internet que tienen un tamaño mayor. Es poco probable que te conviertas en el propietario de una de ellas, ya que el tamaño promedio de un archivo HTML es alrededor de 500 veces más pequeño: 30 kilobytes (KB). Sin embargo, si eres el propietario de una página HTML de más de 15 MB, es posible que tengas que mover algunas secuencias de comandos y código CSS a archivos externos.».
Posteriormente, entró John Mueller de Google a la discusión, haciendo su versión de hilo de Twitter:
Aquí tienes la traducción del hilo:
Esto no es algo nuevo, solo está escrito recientemente. Si no has visto problemas de esto hasta ahora, seguirás sin verlos. Si bien confío en que puedas crear archivos HTML más grandes, es *mucho trabajo* y casi nadie lo hace.
fuente: @JohnMu 28 de junio de 2022
Las aventuras de Sherlock Holmes de Arthur Conan Doyle, Frankenstein; O El moderno Prometeo de Mary Wollstonecraft Shelley, Moby Dick; O, La Ballena de Herman Melville, Drácula de Bram Stoker, Ulises de James Joyce, también por supuesto El Retrato de Dorian Gray de Oscar Wilde,
fuente: @JohnMu 28 de junio de 2022
El extraño caso del Dr. Jekyll y Mr. Hyde de Robert Louis Stevenson, y encima (¿o debajo?) de todo eso:
Guerra y paz por graf Leo Tolstoy.Ahora, agregue el contenido para el que desea clasificar.
fuente: @JohnMu 28 de junio de 2022
No sé ustedes, pero para mí, eso es mucho HTML. De todos modos, nunca pudes pasar de los primeros capítulos de Orgullo y prejuicio, ¿y quieres que lea todo esto antes de llegar a la parte realmente importante? Admiro la paciencia de Googlebot.
fuente: @JohnMu 28 de junio de 2022
Puedes verificar el tamaño de cualquier página en Internet yendo allí y mirando las herramientas de desarrollo en su navegador. O puedes usar una herramienta genial como https://t.co/CLRJkz732J que le da el tamaño completo en una interfaz de usuario agradable.
fuente: @JohnMu 28 de junio de 2022
Si eres un escritor prolífico, mi recomendación sería dividir los libros en capítulos y publicarlos individualmente. No publiques 16 libros en una sola página HTML y esperar que la gente encuentre tu mejor prosa en la parte inferior. Gracias.
fuente: @JohnMu 28 de junio de 2022
¿Todavía te preocupa este límite de 15 MB?
¿Cómo calcular el tamaño del código HTML de una página?
Existen dos opciones de calcular el tamaño del HTML de una página, exactamente las mismas que mencionó Mueller en sus Tweets:
- Puedes calcular el tamaño del HTM utilizando el HTML Size Analyzer de DebugBear, simplemente insertando el HTML o la URL que quieras analizar:
- Puedes calcular el tamaños del HTML utilizando la herramienta para desarrolladores de Google Chrome, con la opción «Network»:
Discusión completa en Twitter.