Co-Ocurrencia, qué es; linguística, SEO; semántica

Co-Ocurrencia, qué es; linguística, SEO.

Vamos a hablar de la co-ocurrencia  o coocurrencia en términos semánticos pero más en términos SEO. El término original fue acuñado en lingüística para significar dos o más palabras en la misma instrucción, dos o más términos en el corpus del texto uno al lado del otro en cierto orden. Esto se puede interpretar como un indicador de proximidad semántica o de una expresión idiomática. Es más que la función de proximidad, se trata de la interdependencia entre los dos términos. Ejemplos: estudiante y profesor, puerto y buque, aeropuerto y avión, etc.

Co-ocurrencia en redes

La coocurrencia en redes  extrapola el concepto hacia la web y hacia los documentos con hipervínculos en general, que es más específico en cuanto a nuestro oficio. Esto proporcionaría una visión de las posibles relaciones entre las personas, organizaciones, conceptos y otros conceptos expresados por escritos en la web. Otra de las derivaciones de la llamada minería de texto. ¿Que es entonces la co-ocurrencia en redes? Es la interconexión colectiva de los términos con base a emparejar su presencia dentro de una unidad de texto específica. Se dice que los términos Ñ y LL co-ocurren si ambos aparecen en un artículo particular. Otra publicación puede tener los términos CH y LL. Vincular ambas publicaciones puede obtener co-ocurrencia cruzada entre dichos términos. Pero hay que tener en cuenta el símbolo primario y sus posibles sinonimias como símbolos alternativos (algo que google search ya tiene en cuenta). Si a lo anterior le agregamos un poco de procesamiento natural del lenguaje, tendremos un algoritmo potente capaz de identificar este fenómeno, sobre todo para las alternativas posibles.

Co-ocurrencia en SEO o en google search

La co-ocurrencia en SEO o en google search pudiera darse ubicando en una cadena de caracteres términos relacionados y asociándolos con una marca, pagina web o compañía e inclusive un nombre de autor (ojo con el marcado de autoría, marcado de edición etc.). Para muchos la co-ocurrencia es lo mismo que la co-citación; yo soy de los que creo que esto es ligeramente diferente. Resulta que la co-correncia no relaciona entre sí dos sitios en conjunto (algo que si hace la co-citación); lo que hace es asociar algunas frases particulares o keywords importantes que están estrechamente próximas entre sí, esta proximidad desarrolla una asociación y relación valiosa para los motores de búsqueda, sobre todo en google search. Puesto en lenguaje llano y corriente, el uso de lenguaje articulado y coherente, el empleo de sinónimos y variantes alrededor del tema y del término o de los términos empleados, no solo da riqueza lingüística  también lleva asociado un plus semántico a nivel del buscador web, confiere de alguna forma un añadido de autoridad extra. Si varios sitios externos aluden a este tipo de publicaciones suyas (sin apelar al mismo texto de anclaje que lo hará terriblemente sospechoso), su credibilidad o reputación al respecto se disparará. Pero también sucederá si es compartido por otros en redes sociales en un contexto adecuado.

Esto puede tener como consecuencias en una web semántica o inteligente (que aprende permanentemente de las búsquedas, personas y resultados), que google muestre un título que en realidad no existe o una descripción. ¿Como es esto? Que por asociación de ideas y términos google puede hallar concordancias en el cuerpo del texto mostrado en sus resultados, con la búsqueda particular y mostrar un titulo que no se ha puesto específicamente o de una descripción que puede no corresponder exactamente a la meta etiqueta mencionada. Esto sucede cuando páginas de alta autoridad describen nuestro sitio. Si escribimos contenidos notable y otros sitios bien acreditados lo referencian, google puede emplear estas asociaciones o descripciones para referirse a su sitio. Si tratamos de forzar el contenido para clasificar por determinados keywords, estaríamos perdiendo el tiempo y los esfuerzos.

Y al igual que la co-citación, no es preciso que tengan hipervínculos o enlaces apuntando hacia nuestro sitio (obsérvese que es indiferente si son dofollow o nofollow). Aquí ya no vale sobreoptimizar el sitio desde el seo onpage, ni rellenar las metaetiquetas posibles, aquí reina el contenido y las referencias (no los hipervínculos o los anchor text).

Ay de las empresas cuyos comentarios y menciones negativas superen en cantidad o en calidad a las asociaciones positivas, puede golpearlas en el rostro el spider de google colocando alguna de estas alusiones negativas en sus propias meta-etiquetas.

Ha llegado en pleno el LSI (Indexación semántica latente) que usa palabras sueltas o términos; pero también ha arribado con fuerza lo que google llama «Phrase Based Indexing «, frases, no palabras, que permitan indexar, recuperar y organizar los documentos en la web.

Referencias bibliográficas
Bussmann, Hadumod : Lexikon der Sprachwissenschaft.Kröner, Stuttgart 2002
Grivell L: “Mining the bibliome: searching for a needle in a haystack? New computing tools are needed to effectively scan the growing amount of scientific literature for useful information.” EMBO reports 2001 Mar;3(3):200-3: doi : 10.1093/embo-reports/kvf059 PMID 11882534
Ozgur A, Cetin B, Bingol H: “Co-occurrence Network of Reuters News” (15 Dec 2007) http://arxiv.org/abs/0712.2491
Zhou Y, Reid E, Qin J, Chen H, Lai G: «US Domestic Extremist Groups on the Web: Link and Content Analysis» http://doi.ieeecomputersociety.org/10.1109/MIS.2005.96

Leer también: regla de inferencia, qué es; Search Human optimization; Soluciones SEO
Ediciones 2013-16-18

This post is also available in: Español