Google y desambiguación

En google y desambiguación, intentaré contar uno de los problemas de palabras en los que se mete google para intentar ser un buscador semántico, inteligente y preciso.

Todos los idiomas del mundo presentan giros, sinónimos y particularidades y a eso tiene que enfrentarse el gigante de Mountain View. La desambiguación es el reto principal, encontrarle el sentido a una palabra o expresión de acuerdo al contexto en que se usa. Por ejemplo, cuando alguien habla de jaguar, puede estarse refiriendo al felino, al automóvil, a un sistema operativo e inclusive a una guitarra. ¿Qué haría un usuario promedio? ¿Qué hace google search? Google search “lee” el texto y le asigna un valor dentro de la búsqueda pero, así mismo, pide referencias que avalen ese texto o página web en ese ítem de búsqueda concreta, busca enlaces o links que referencien ese texto, preferiblemente usando el texto de anclaje que le de peso a la misma dentro de una búsqueda. Pausa. O sea que si una web habla de jaguar y recibe un enlace desde un portal de autos donde recomienda nuestra página por el “anchor text” de  autos jaguar, google asume que nuestro portal es efectivamente de autos jaguar; pero si recibiéramos un enlace de sitios web de fauna, recomendándonos como “autoridad” en estos animalitos, google en primera instancia, cree. Y digo en primera instancia porque esta particularidad suele ser empleada por los spammers, que intentan condicionar una búsqueda web usando elementos tendenciosos (y se califican de expertos seo). A la postre, google descubre la triquiñuela y le quita peso a esta argucia penalizando a las páginas implicadas.

Google y desambiguación, una dificultad diaria en el proceso de indexación y generación de listados de búsquedas, que cada vez el buscador de Mountain View hace mejor, mostrando resultados certeros e intuitivos y dejando de lado los intentos “sucios” de condicionar las búsquedas.

Ver: motores de búsqueda y recuperación de la información

Motores de búsqueda y recuperación de la información

Los motores de búsqueda y recuperación de la información. ¿Sabían ustedes que los modernos motores de búsqueda basan sus resultados en la ciencia de la recuperación de la información, una ciencia que ha existido desde mediados del siglo XX, cuando se usaba para bases de datos de grandes bibliotecas, centros de investigación y laboratorios del gobierno. Los expertos en esta ciencia de la recuperación de la información descubrieron que en este proceso habían dos elementos críticos para los resultados arrojados: la pertinencia y la importancia de los datos. Para medir estos factores los motores de búsqueda analizan los documentos encontrados (incluyendo el análisis semántico de los conceptos a través de los mismos) y los links o citas.

Análisis de documentos y conectividad semántica.
En los análisis de documentos los motores de búsqueda buscan si hay coincidencias entre los términos de la búsqueda y áreas clave de los documentos como pueden ser los títulos, encabezados, los metadatos, etc. Fuera de eso los motores de búsqueda evalúan la llamada conectividad semántica, la relación entre palabras o frases entre sí. Por ejemplo, la palabra Miami puede tener conexión lógica con Florida o Estados Unidos pero no existen nexos rápidos con Perú por decir algo. De esa forma los motores de búsqueda elaboran sus particulares diccionarios de sinónimos y de temas relacionados (¿algo que ver con los contenidos robotizados que resultan expresando incoherencias y no son bien rankeados por google?). Por el simple escaneo de su gigantesca base de datos y empleando técnicas de la lógica difusa (heurística que asigna valores de verdad entre 0 y 1, muy similar a la lógica probabilística en su planteamiento pero sus interpretaciones son distintas) que no es categórica en sus asertos como verdaderos o falsos.

Pero en esto de motores de búsqueda y recuperación de la información se habla recurrentemente también de análisis semántico latente, una técnica de procesamiento del lenguaje que tiene relación con la llamada semántica vectorial, que intenta analizar y relacionar grupos de documentos y términos relacionados entre ellos.

Análisis de links.
En el análisis de links google y los motores de búsqueda evalúan la cantidad de enlaces que unen a un sitio con otro y lo que se dice de la página web que se enlaza (anchor text o texto de anclaje); la autoridad de la página emisora del enlace y la credibilidad de su link frente a otras con menos confiabilidad por el sistema y si el referente tiene vínculos temáticos con su referido. Por ejemplo, un enlace de un sitio que hable de comidas rápidas a la hora de referenciar una web de salchichas y embutidos, tienen mayor peso que el de un sitio de vajillas referenciando a la misma web de carnes frías. Zapatero a tus zapatos. Otro factor decisivo en un enlace o link (algo que hace parte del análisis de documentos que hace la recuperación de la información y los motores de búsqueda) es la forma de implementar el vínculo y el sitio donde se coloca.

Motores de búsqueda y recuperación de la información, un tema de candente actualidad para entender el funcionamiento de sitios como google, bing o yahoo search.

Ver: lo que google no ve

Posicionamiento web 3

En posicionamiento web 3 veremos la manera en que google clasifica y asigna importancia a las páginas que lista en los primeros lugares.

Google posee un algoritmo patentado que evalúa más de un centenar de factores a la hora de analizar y determinas la importancia de un sitio para sus criterios de búsqueda; el asunto crucial para nosotros consiste en saber que no es estático y que periódicamente sufre ajustes y afinaciones, lo que exige que nuestro trabajo seo o de posicionamiento web no sea estático sino periódico y frecuente para estar siempre en lo alto de las clasificaciones de los resultados de google.

Para optimizar un sitio y posicionarlo de buena forma para los buscadores hay que tener en cuenta dos grupos de factores o variables:

1- ) Factores internos de la página en cuestión, como por ejemplo los keywords, tags o palabras clave, cómo, dónde y cuándo se emplean, si el contenido es relevante frente a las mismas o no. Las palabras clave determinan la relevancia de la página. Las palabras clave tienen mucha relación con los términos que la gente ingresa a google para encontrar nuestros websites o información específica en la web. Los usuarios promedio ingresan en el buscador de 2 a 5 palabras en una frase para buscar lo que sea que requieran. De ahí que sean los keywords quienes dictan de qué tema trata su sitio web. Pero ahí no para todo. Google también evalúa si los textos de anclaje o texto de los vínculos que apuntan hacia su web contienen a su vez estas palabras clave.

2- ) Factores externos a la página: Aquí van la cantidad y la calidad de enlaces que apuntan hacia nuestra web. No todos los enlaces hacia su sitio son de la misma credibilidad ante el buscador. ¿Cómo valora google la credibilidad de un sitio o la fuerza de un enlace? Generalmente recurriendo a una tecnología patentada que ellos llaman pagerank, a mayor pagerank de un sitio y menor cantidad de enlaces salientes, mayor peso tiene su enlace hacia nuestro sitio. El asunto funciona como en el mundo real, por recomendaciones, le creemos un consejo más fácilmente a un buen amigo que a un desconocido. Lo mismo sucede con google, le da mayor veracidad a un enlace de un “buen amigo” suyo, es decir una página con alto pagerank (se califica de 1-10) que a una página desconocida para su base de datos. A mayor cantidad y calidad de enlaces apuntando a su web, mayor valoración y estimación a la hora de listar los resultados, tendrá su  página web.

Soluciones Seo

Posicionamiento web 2

En posicionamiento web 2 veremos que si bien aprender SEO cuesta, tiempo, dinero y aplicación, sale mucho más barato que pagar al buscador (generalmente google) para obtener un cúmulo de visitas importantes y negocios recurrentes para nuestro sitio, pues el SEO nos da visitas vía búsquedas orgánicas. No se trata de magia ni de grandes procedimientos, se trata de ser cositero, de poner cuidado en minucias y en aplicar sentido común…

Cuando google comienza a visitarnos.

Al estar en la base de datos de las búsquedas de google (estar indexado, así lo llaman los expertos en estas minucias), google visita nuestra página web usando programas automatizados llamados robots o spiders (arañas). Esta clase de robots o spiders leen cada página de nuestro website, empezando tradicionalmente por el home o index de nuestro portal y siguiendo cada una de las otras páginas del sitio. Pero deténgase un momento, si su sitio es nuevo y ninguna página web conocida de google (un website que esté en indexada en el buscador) la linkea, enlaza o recomienda, llámese directorio, contador, proveedor de acceso, el proceso de ingresar en las búsquedas de google se ralentiza y dilata. Por eso, para sitios nuevos, lo primero que han de hacer es lograr que algún directorio web o directorio de blogs si es el caso, de alta credibilidad ante google, les dé un enlace de calidad hacia su sitio. Eso garantiza que google indexe su página web con mayor celeridad.

El crawl, robot o spider de google, al menos el principal, se llama googlebot. Entre mejor clasificado esté su sitio o entre mayor cantidad de veces lo actualice, mayor cantidad de visitas recibirá de googlebot, pues google prefiere los sitios que añaden información o actualizaciones frecuentes.Soluciones Seo.

Ranking de google

Muchos se preguntan cómo se construye el ranking de google, es decir, cómo ordena los resultados google que nos muestra google search. Nadie fuera de google lo sabe al 100% pero intuímos cosas. Para google hay resultados más relevantes y menos relevantes y es de esa forma que lista los resultados de nuestras búsquedas; todos queremos estar en los primeros diez lugares o, en caso trágico en los 20 primeros puestos del listado.

Un estudio demostró los porcentajes de visitas que reciben los sitios de acuerdo con la posición en que se hallan del listado de google. Son resultados sorprendentes, veamos:

Para la primera hoja estándard, los primeros diez resultados habituales:
Primer lugar: 30%; o sea que de 100 búsquedas, 30 van a parar directo al primer resultado que aparece en google.Segundo: 15%; de 100 búsquedas, 15 van a parar al segundo puesto en los resultados de google.Tercero: 7%.Cuarto: 5%.Quinto: 4%. Sexto:4% Séptimo: 2%.Octavo: 2%. Noveno:3% (vaya paradoja).Décimo: 5% (interesante).

Pero ahí no paran los resultados; para la segunda hoja de búsquedas, es decir los resultados del 11 al 20, estos son los porcentajes de clicks promedio para los mismos:

Posición 11: 6%, tal vez por ser el primero de un grupo de búsquedas. Posición 12: 4%; posición 13: 2%; posición 14-20: < 2%.

Mejor dicho, es preferible estar bien posicionados dentro del ranking de google; para no correr riesgos en la primera hoja de los resultados de las búsquedas y, hasta donde se pueda, en los cinco primeros puestos del listado. Les puedo anticipar que el pagerak es muy importante para figurar más arriba en los resultados de google. También lo es la densidad y ubicación de las palabras clave. Pero google además valora o cuantifica la importancia relativa de la página web dentro de una búsqueda concreta, esto lo hace valorando la cantidad y calidad de citaciones (referencias o enlaces) que otros sitios web hacen del mismo con un texto de anclaje igual o semejante a la búsqueda referida. Y los factores que tiene en cuenta google son muchísimos más. Esta clase de cálculos se hace por medio de software automatizado que determinan en últimas el ranking de google.

Ver soluciones seo , importancia de google

Importancia de google

¿Cuál es la importancia de google? La posible respuesta la podemos desglosar por partes. A nivel de buscador, más del 75% de las búsquedas en el mundo se realizan por medio de su buscador, google search, del cual existe por lo menos uno por país del mundo (en general). Las visitas de un sitio web normal, más del 75% en promedio llegan por google. No es que los demás buscadores no existan, es que tienen una tajada de mercado muy chica, tienen poca credibilidad o son poco conocidos. Ahora, para personas como usted o como yo que pasamos media vida frente a un monitor e internet, es frecuente probar de cuando en cuando otros buscadores pero, seamos honestos, sus resultados no se ajustan en general a nuestras necesidades. Es el mismo caso de los metabuscadores, ofrecen muy poco que no encontremos en google.Eso en cuanto al buscador.

Pero resulta que google es algo más que un buscador, es publicidad contextual, es Adsense, el sistema por el cual muy sitios web se hacen rentables o producen algún dinerillo para gastos de funcionamiento. Y google también es la cuenta de correo más estable que conozco, gmail; es un servicio de blogs, blogger; es una plataforma de grupos, etc. No hay espacio en la web que no ocupe o tenga presencia de la casa google.

Si bien es cierto algunos productos de google han sido un fiasco comercial, eso no quita que por cada desacierto de ellos hayan por lo menos 10 excelentes iniciativas andando. Lo demás es envidia y falta de visión. La importancia de google salta a la vista; muy pronto, seguramente, la marca tendrá más presencia en el mercado real, en la publicidad de tv y en los medios masivos de comunicación (vaya usted a saber exactamente cuando ocurrirá esto), pronto tendrá un sistema operativo gratuito también. ¿Hasta dónde llegará? No alcanzamos a dimensionarlo.