Co-Citacion, semántica, bibliografía, SEO, qué es

Co-Citacion, semántica, bibliografía, SEO, qué es.

La co-citación es un tema de moda en el SEO, pues sería una de las formas en que google intenta zafarse de los texto ancla (o textos de anclaje) usados por los webmasters para intentar manipular el algoritmo de búsqueda.
Esta herramienta derivada de la semántica (estudio del o de los significados), propia de la transición hacia la web 3.0, ni siquiera se fija en que haya o no vínculos o links salientes entre las páginas implicadas, solo que una página A referencia a una página B y a una página C; esto quiere decir que las páginas B y C estan co-citadas luego hay un vínculo fuerte o una posible asociación de contenidos semejantes que serán tenidas en cuenta por el motor de búsqueda a la hora de presentar sus resultados. Es decir que google search establecería similitudes entre las páginas B y C debido a que fueron mencionadas por una pagina de terceros en un contexto preciso.

Pero la co-citación puede ser un acoplamiento bibliográfico (medida de similitud que emplea un análisis de citas bibliográficas para registrar sus resultados; disciplina fundada en 1963), una similitud semántica establecida entre documentos gracias a la mención que hacen de ellos una tercera fuente. Entre más sean mencionadas juntas por los demás, mayores y más fuertes serán sus concordancias temáticas o de significados a los ojos de google search. Dicho de otra forma, entre más co-citaciones obtengan dos documentos, mayor será la fortaleza y similitudes semánticos entre los mismos.

Visto de esta forma, la co-citación no tiene en cuenta el texto de anclaje ni la cantidad de links que reciba una publicación o sitio web; lo importante es que muchos autores referencien o mencionen dicha publicación o página web. Y como estamos en la era del authorrank, importa la calidad y el peso de quienes hagan dicha citación.(1)

El enfoque del análisis de co-citación fue introducido en 1973 por Henry Small (en inglés) y por Irina Marshakova (en ruso), llegando ambos a conclusiones semejantes por caminos independientes, aunque la mayor parte del crédito ha recaído sobre el primero debido a que el inglés es más comercial como idioma. Pese a esto, ya en 1972 Robert Amsler había publicado un documento en este sentido. En 1981 Howard White y Griffith Belver introdujeron el concepto de análisis del autor co-citado (ACA). En 2009 Geep y Beel introdujeron un nuevo enfoque llamado co-citación análisis de proximidad; para esta forma de co-citación es relevante la colocación y proximidad de las citas dentro del texto completo del documento; se supone que la proximidad más cercana entre las mismas, tienen una similitud más fuerte.

La gran diferencia entre la co-citación y el acoplamiento bibliográfico, es que el primero es una herramienta prospectiva en la similitud del documento mientras que la segunda es tan solo retrospectiva. Las citas que reciba un artículo en el futuro pueden depender de la manera de pensar, de los hitos de pensamiento en boga.

Referencias bibliográficas
MM Kessler (1963), «Bibliographic coupling between scientific papers.»»American Documentation», 14(1), pp. 10–25
HG Small (1973)»Co-citation in the scientific literature: a new measure of the relationship between two documents.» Journal of the American Society for Information Science , 24, 265-269.
H. G. Small (1978). «Cited Documents as Concept Symbols,» Social Studies of Science, vol.8, p. 327-340
HD White & BC Griffith (1981)»Author co-citation: a literature measure of intellectual structure.» Journal of the American Society for Information Science , 32, 163-171. Wiley
Sergey Brin & Lawrence Page (1998). «The anatomy of a large-scale hypertextual Web search engine.» Computer Networks and ISDN Systems, vol. 30, no. 1-7, pp. 107–117. ACM
Bela Gipp and Joeran Beel, 2009 «Citation Proximity Analysis (CPA) – A new approach for identifying related work based on Co-Citation Analysis» in Birger Larsen and Jacqueline Leta, editors, Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09), volume 2, pages 571–575, Rio de Janeiro (Brazil), July 2009.

(1) Post publicado originalmente en marzo 2013; revisado en diciembre 2014, para mencionar que el author-rank como lo intuíamos, no constituye factor de posicionamiento de acuerdo con Google Search y sus voceros.

Leer también: Co-ocurrencia, que es; qué es una regla de inferencia

Ediciones 2014-16-18

Similitud semántica o proximidad, qué es; motores de búsqueda, web

Similitud semántica o proximidad, qué es; motores de búsqueda, web.

Disertar sobre la similitud semántica o la proximidad semántica es necesario, sobre todo cuando se habla de motores de búsqueda inteligentes, de la web semántica y esos términos algo nebulosos para la mayoría.

En otros apartados hemos hablado de la coocurrencia y la cocitación como una especie de abre-bocas a este tipo de temas. Pues bien, vamos a entrar en materia.

¿Que es la similitud semántica?¿Cual podría ser su concepto o significado? Se trata de una métrica definida sobre un conjunto de datos para hallar parecidos y semejanzas. ¿Cómo se determina esta proximidad semántica? Por sus significados y no por sus representación sintáctica, es decir

Identificar los parecidos entre palabras o frases tienen importantes aplicaciones en el procesamiento del lenguaje natural y en las búsquedas orgánicas normales que hace la gente (no en las que trataron en algún momento de la historia, de inducir los expertos del SEO); también resulta valioso en recuperación de la información y hasta en la inteligencia artificial.

Por lo general se asumen dos grandes enfoques a la hora de determinar dichas proximidades entre oraciones o palabras: un diccionario de sinónimos (por eso en marketing de contenidos aconsejamos emplear a fondo la sinonimia) o computando las estadísticas de un conjunto de datos. Esta información se maneja en datos numéricos. En ambos sentidos el uso de grandes bloques de texto o cadenas largas de caracteres permiten hacer más eficiente el ejercicio.

En el caso de los motores de búsqueda, creemos que cualquier intento no natural de usar el lenguaje, podría, a mediano plazo, no ser bien visto en aras de la clasificación respectiva; el algoritmo es capaz calcular la relevancia temática de un texto, más allá de una palabra, hallando las aproximaciones de rigor en cuestión de milisegundos. Ya no será asunto que un término esté o no en el título, la meta description o los head del texto desarrollado, básicamente con que esté el mismo o un sinónimo (varios también por supuesto) dentro del desarrollo argumental, es suficiente para ser identificado y calculada su posible relevancia al respecto. Tampoco será definitivo el uso de negrillas o el uso de otros atributos como color de texto, tamaño o cursiva, por citar algunos ejemplos.

De todas formas, a los bloggers y  webmasters se nos tiende a olvidar que los encabezados corresponden a una necesidad de ordenar el contenido y, que cuando se define un head, sea este h2, h3…h6, la información que va inmediatamente debajo tiene una fuerte relación en el mismo. De ahí que definir convenientemente este tipo de elementos ayuden a establecer relaciones y significados entre sus partes. ¿En el futuro se tendrá en cuenta el formato del texto? Es factible que no, si bien es solo una especulación mía.

Implícitamente, hay latente un concepto de autoridad y contexto, pues se pueden establecer también comparaciones y afinidades semánticas entre un texto y otros ubicados en un mismo sitio web y hallar y ponderar sus aproximaciones o soportes temáticos previos. Ahí toman fuerza las entradas relacionas y las taxonomías como categorías o etiquetas, por decir algo. Lo mismo aplica para la antigüedad activa de un sitio web.

Webgrafía consultada al 11/05/2015

The Google similar distance; Computing Semantic Relatedness using Wikipedia- based Explicit Semantic Analysis; Clustering the Google distancewith eigenvectors and semidefinitive programming

Ediciones 2015-16-18

Posicionamiento web, SEO y comunicacion

En posicionamiento web y comunicación había hecho un resumen escueto sobre las relaciones entre marketing , posicionamiento y posicionamiento web. Había resaltado que nuestro principal problema en esto del seo, radica en el la sobreinformación de las personas, en la gran cantidad de paginas web que existen y en el ritmo de crecimiento de las mismas y cómo la gente necesita información de calidad y alguien que la guíe. Para poder hacerlo con excelencia, debemos simplificar nuestro mensaje al máximo, eludir las trampas de la sofisticación y de la verborrea; el cibernauta promedio anda tanto o más de afán que nosotros y desea ya, aquí y ahora su información.

El truco de nosotros, como SEO radica en entender cuál es exactamente lo que el cliente desea, asumiendo que cliente dentro de este contexto es el lector, no el dueño del sitio web a posicionar, y dárselo. Destacar entre casi 250 millones de sitios web con dominio (al menos según estadísticas a octubre de 2010) no es sencillo aunque tampoco imposible si tenemos o buscamos un nicho de mercado hacia el cual crecer y nos focalizamos. Eso de tener un sitio web estático y abandonado para mostrar como si fuera un volante, está mandado a recoger.

Leer también: comunicación efectiva; comunicaciones perdidas; SEO Bogotá, posicionamiento web
Ediciones 2011, 2015, 2018