Rastreo e indexación

Rastreo e indexación. Sobre cómo los motores de búsqueda (search engine) encuentran una página web y descubren su contenido.

La World Wide Web es una gran red de información, donde cada documento único es una parada para los motores de búsqueda o buscadores.
[adsense_id=»1″]
Resulta que los motores de búsqueda necesitan rastrear y conocer toda la red para encontrar todas las paradas posibles (documentos posibles), para lo cual se sirven de los hipervínculos o enlaces (links), entre páginas web, pues es la mejor ruta disponible para hacerlo. Dicho de otra forma, para que una pagina web exista y sea rastreada y posteriormente indexada, ha de haber alguna otra pagina web que la mencione o le de un enlace. Si su página web es nueva y nadie la menciona vía hipervínculo, google va a tardar mucho más en rastrearla y en indexar su contenido. Luego podemos deducir que a mayor cantidad de sitios mencionando nuestros contenidos en forma de links, mayor velocidad de rastreo y de actualización ante google tendrá nuestra página web. A través de los links, los robots automáticos de los motores de búsqueda, llamados crawlers o spiders (rastreadores o arañas) acceden a millones de millones de nueva información que se va dando en internet. Una vez que los motores de búsqueda hallan una nueva página web, analizan su código (dejen de soñar que ven sus sitios web) deben almacenar la información en los discos duros de sus servidores para posteriores consultas de los usuarios. Para hacer esta labor diligentemente y en una fracción de segundo, los motores de búsqueda tipo google tienen muchos servidores y data centers alrededor del mundo.

[adsense_id=»1″]

Un concepto clave en esto de los motores de búsqueda es decidir cuando y por donde hacen un rastreo web; generalmente empiezan por los sitios de confianza o confiables para el sistema. En el caso de google sabemos que mide la confianza en las páginas web por medio de un sistema patentado por ellos al que llaman pagerank. Es decir, que si su sitio está dentro de los más confiables de google, será rastreado con mayor frecuencia que si no lo está. Quiere decir así mismo que el rastreo e indexación se hace diligentemente en lo sitios con mayor pagerank y se siguen sus vínculos; valdría la pena entonces que alguna de esas páginas web en las que google confía nos de un enlace para que google asuma que somos amigos de uno de sus íntimos, por decirlo de alguna forma coloquial.

Rastreo e indexación, un tema garrafal en esto del posicionamiento web.

Ver: Seo y google adwords

[adsense_id=»1″]

This post is also available in: Español