Uno de los participantes al English Google SEO office-hours del 4 de Marzo de 2022 le preguntó a John Mueller acerca el problema de rastreo e indexación que estaban experimentando, es decir, cuál es la razón por la que ciertas páginas no están indexadas, aunque se rastreen más de una vez.
Desde el punto de vista de Mueller, él asumiría que no sucede con tanta frecuencia porque, en general, si Google puede rastrearlo, podría indexarlo. Pero puede suceder que Google rastree una página y al final decidan «Oh, en realidad no necesitamos indexarla».
Sin embargo, una situación común en la que esto puede suceder es en el supuesto de si hay un código que genere un error en la página, ya que Google tiene que rastrear la página primero, y luego verificar el error.
Otro supuesto es si hay una etiqueta noindex en la página, Google también tiene que rastrearla primero para luego ver el noindex. Y por último, si la página es un duplicado completo de algo que Google ya ha indexado, la rastrean, ven que es un duplicado y luego se enfocan en la página principal nuevamente.
Estas son las situaciones en las que Google rastreará algo pero quizás no lo indexe. Para cuando lleguen a la indexación.
En la repregunta, el mismo usuario reflexionó acerca de la calidad del sitio y el papel que jugaría en esa decisión, y así se lo preguntó a Mueller, quién dijo que, por lo general, si Google no está convencido de la calidad del sitio, es probable que tampoco rastreen la página en primer lugar.
Mueller finalizó, señalando que en Search Console, prácticamente para cada sitio, es probable que tenga la agrupación de descubierto pero no indexado, así como rastreado pero no indexado. Él cree que es bastante común en todos los sitios web en general.
Esto sucede aproximadamente en la marca de 14:10 en el video.
Este tema ya fue tratado en reiteradas ocaciones, cuando se habló del HTML semántico no es una señal de calidad de búsqueda de Google, que muchas páginas no son un signo de la calidad del sitio, de que la calidad del sitio no se trata de las páginas que faltan en el índice de Google y acerca de estar al límite del umbral de calidad de Google.