¿Cómo gestionar la información en fuentes no estructuradas?

27 Jul 2020
Miguel Ángel Alcalde

La correcta gestión de la información aporta un valor incalculable. Sin embargo, es una cuestión que la mayoría de las organizaciones deja pasar por alto.

De toda la información que tenemos en nuestras organizaciones, se calcula que cerca del 80% es no estructurada, es decir, de difícil acceso. Son datos que ocupan una ingente cantidad de espacio, en servidores, pero también en ordenadores personales, smartphones, etc.

Concretamente, según estudios, el 70% de las compañías cree imposible gestionar este tipo de datos, en su mayor parte texto. ¿Somos conscientes de todo lo que acarrea esta deficiente gestión documental?

Debemos tener en cuenta que dentro de ese 80% se encuentra la mayoría de los documentos generados por dentro de la compañía (ya sea como documentos ofimáticos, emails, chats, etc.), lo que significa que en ellos se alberga conocimiento de la organización: Ideas, métodos, proyectos, propuestas, y también quejas, fraudes, espionaje… Tengámoslo claro, capitalizar el conocimiento es vital para ser competitivos en el mercado.


Índice de contenidos:


0a21cced-96fb-4e44-a628-7f664f8a0557

 

Una situación que se agrava con el tiempo

Los sistemas de gestión documental (SGD) de finales del pasado siglo trataban de resolver este problema, pero la resistencia del empleado a documentar la metadata del fichero a cargar y la lentitud de los sistemas crearon una profunda resistencia al cambio.

Posteriormente, la Gestión del Conocimiento, mediante Intranets, lo que hoy usamos cotidianamente como redes sociales (Schlumberger tenía un “Facebook” en el año 2002 y fue premiada internacionalmente como empresa líder en Gestión del Conocimiento), tampoco resolvió el problema, sino que lo agravó. Sirvió para aumentar exponencialmente los documentos de texto (foros, chats, blogs…). Y qué contar del correo electrónico.

El teletrabajo, proyectos en casa del cliente, viajes de trabajo, también fomentan este problema. Los ordenadores portátiles, smartphones y tabletas se encuentran sin más control que el del usuario, de manera que la información de la compañía se encuentra permanentemente en riesgo.

En muchas organizaciones, incluso las tecnológicas, la información está organizada en carpetas, en el ordenador de cada uno, pudiendo acceder a ella sólo a través de una búsqueda manual o a través del buscador. La actividad de búsqueda, aunque pueda parecer sencilla, repetida en el tiempo, genera una pérdida de tiempo y dinero para la empresa. Por si no fuera poco, esta situación se vuelve catastrófica con la rotación del personal (tan común en la actualidad). En este caso, se pierde directamente la pista de la información archivada.

La realidad es que, por lo general, aunque obtengamos gran cantidad de información potencialmente interesante desde múltiples dispositivos y canales, finalmente no llegamos a aprovecharla debido a su difícil gestión.

 

¿Por qué analizar la información de fuentes no estructuradas?

Aunque a simple vista podamos imaginar cuál es uno de sus beneficios principales (el ahorro de espacio) existen otros importantes beneficios:

  • Creación de inteligencia
  • Capitalización del conocimiento
  • Ayuda en la toma de decisiones
  • Aumento de la seguridad
  • Mejora de chatbots
  • Detección de fugas de información o fraude
  • Generación automática de la metadata de los documentos a importar al SGD, CRM, ERP…

 

¿Qué soluciones existen?

Para acceder a la información en fuentes no estructuradas podemos hacer uso de buscadores cognitivos:

  • Machine Learning. Un algoritmo estadístico que establece categorías.
  • Buscadores Semánticos. Una técnica de análisis procedural que aplica la manera en la que nosotros pensamos para comprender el lenguaje y trata de analizar el texto y su contexto.
  • Mixtos

Podríamos resumir las diferencias entre los tipos de buscadores cognitivos en:

Analisis-semantico

 

Limitaciones

El principal inconveniente al que se enfrenta una compañía a la hora de buscar un archivo o documento concreto es el uso de palabras clave. La realidad, es que la riqueza del lenguaje humano hace que sea realmente difícil su catalogación ya que es abstracto, simbólico, creativo, cuenta con contexto, etc. por no hablar de los distintos idiomas en los que nos podemos comunicar. Por lo que una búsqueda que podría parecer sencilla de primeras se convierte en imposible.

 

¿Por qué es el Análisis Semántico decisivo?

El análisis semántico utiliza técnicas de comprensión del lenguaje que permite de forma fácil y rápida gestionar todo tipo de documentos. Todo ello, gracias a los distintos análisis que realiza:

  • Análisis morfológico
  • Análisis gramatical
  • Análisis lógico
  • Análisis semántico (desambiguación)

De esta manera, cumple con los dos principios de la gestión de la información:

  • Precisión (una medida de exactitud) resume el documento como lo haría una persona.
  • Localización (una medida de integridad) te permite encontrar solo lo que te interesa, al contrario que a la búsqueda estadística de Google. De manera que evitamos ruido y pérdida de tiempo.

Ya que otras tecnologías basadas en palabras clave, patrones o estadísticas, como el Machine Learning, pueden cumplir solo uno de los dos principios anteriores.

Además, la semántica:

  • Permite justificar la razón por la que cierto texto supone una amenaza
  • No necesita volver a enseñar al algoritmo para estar operativo de nuevo
  • No genera falsos positivos

¿Quieres conocer todas las capacidades del Análisis Semántico? Accede al siguiente vídeo donde hacemos una demostración de CIP, una solución distribuida por nuestra compañía:

0a21cced-96fb-4e44-a628-7f664f8a0557

Protege y capitaliza tu conocimiento, nosotros te acompañamos: desde el backup de todos los dispositivos en nuestra Nube, a la integración de tecnologías inteligentes para automatizar las tareas tediosas de tu organización.

Es el momento de que comiences a gestionar tu información. ¡Entra en el mundo de la inteligencia empresarial!

 

Quizá te interese:

¿Usas el Cloud adecuado a tu compañía?

Certificaciones ISO como camino hacia la excelencia

GDPR y Compliance en el Cloud empresarial

Quizá te interese

Miguel Ángel Alcalde

Miguel Ángel Alcalde

Miguel Ángel Alcalde fue BDM de Soluciones Software hasta junio de 2021, momento en el finalizó su andadura en Alhambra. Miguel Ángel es Ingeniero en Informática de Gestión por la Universidad Politécnica de Madrid y su carrera profesional ha estado ligada al Desarrollo de Negocio, Consultoría, Jefatura de Proyectos y área Comercial en compañías tecnológicas, con especialización en el área de Seguridad y Software.

Noticias relacionadas

Categorías relacionadas

Más Información