¿En qué se diferencian los datos no estructurados y semi-estructurados?

¿En qué se diferencian los datos no estructurados y semi-estructurados? Si casi todos los datos no estructurados realmente contienen algún tipo de estructura en forma de metadatos, ¿cuál es la diferencia? La realidad es que hay un área gris entre los datos verdaderamente no estructurados y los datos semi-estructurados.

La estructura semiestructurada puede carecer de organización y, ciertamente, está a un millón de millas de la organización rigurosa de la información contenida en una base de datos relacional. Pero la presencia de metadatos realmente hace que el término semiestructurado sea más apropiado que no estructurado.

Muy pocos datos en la era moderna no tienen absolutamente ninguna estructura ni metadatos. Por lo tanto, en el uso popular, la mayoría de lo que se denomina datos no estructurados son realmente datos semi-estructurados. Los documentos, imágenes y otros archivos tienen algún tipo de estructura de datos . Pero en aras de la simplicidad, los datos se dividen libremente en categorías estructuradas y no estructuradas. Algunos argumentan que la distinción entre datos no estructurados y semiestructurados es discutible.

Otros recursos afines en nuestro blog de Big data:Datos semiestructurados, definición, que son, tipos; ventajas y desventajas

This post is also available in: Español