La vigilancia tecnológica avanzada

Los volúmenes de datos, informaciones y conocimientos que se almacenan en bases de datos y en los que se han dado en llamar grandes repositorios de datos permiten una exploración mediante diferentes opciones de búsqueda.

La vigilancia tecnológica avanzada


1. Minería de datos: Es un mecanismo de explotación, consistente en la búsqueda de información valiosa en grandes volúmenes de datos. Está muy relacionada con las bodegas de datos que proporcionan la información histórica con la cual los algoritmos de minería tienen la información necesaria para la toma de decisiones.
2. Minería de textos: Debido a que el 80 por ciento de la información de una compañía está almacenada en forma de documentos, las técnicas como la categorización de texto, el procesamiento de lenguaje natural, la extracción y recuperación de la información o el aprendizaje automático, entre otras, apoyan al Text Mining (minería de texto).

En ocasiones se confunde el Text Mining con la recuperación de la información (Information Retrieval o IR). Esta última consiste en la recuperación automática de documentos relevantes mediante indizaciones de textos, clasificación, categorización, etc. Generalmente, se utilizan palabras clave para encontrar una página relevante.

En cambio, el Text Mining se refiere al examen de una colección de documentos y el descubrimiento de información no contenida en ningún documento individual de la colección; en otras palabras, trata de obtener información sin haber partido de algo. La minería de texto pretende facilitar el tratamiento por parte de las computadoras de la semántica del lenguaje natural.

La mayor parte del conocimiento humano está representado en lenguaje natural. Para poder acceder a dicho conocimiento es necesario poder contestar a estas preguntas:
- ¿Cómo buscamos la información?
- ¿Cómo comparar fuentes de información diferentes y sacar conclusiones?
- ¿Cómo manejamos los textos para, por ejemplo, traducirlos o editarlos?

La Minería de texto consiste en la búsqueda a partir de técnicas de aprendizaje automático de regularidades o patrones que se encuentran dentro de un texto.

En la literatura sobre el tema, se refiere que las aplicaciones de la minería de textos se utilizan principalmente para:
1. Extraer información relevante de un documento.
2. Agregar y comparar información automáticamente.
3. Clasificar y organizar documentos según su contenido.
4. Organizar depósitos para búsqueda y recuperación.
5. Clasificar textos e indizarlos en el Web.

Pero la realidad es que son muchos los casos de organizaciones que han aplicado la minería de textos con el afán de alcanzar objetivos más reales y ambiciosos (en el mejor sentido) que estos.

Por ejemplo, el uso que le dan algunas empresas para identificar el contenido de los correos electrónicos que les envían los clientes y redirigirlos a los departamentos apropiados, incluso si el sistema es capaz de identificar el contenido de una consulta frecuente, envía una respuesta estándar, sin necesidad de intervención humana.

En el campo de la vigilancia tecnológica y en la “Business Intelligence”, para bucear en las bases de datos textuales y seguir la evolución de la competencia. Además de que se apunta también la posibilidad de usar esta técnica en la investigación de mercados en el Web, sobre la base de recoger estadísticas sobre la utilización de determinados conceptos y temas en la red con el objetivo de estimar la demografía y las curvas de demanda de productos asociados con ellos.

Todas esas aplicaciones son perfectamente transferibles a la gestión de información que ocurre en el interior de las bibliotecas y están llamadas a redimensionar a función de la entidad, así como del bibliotecario, tanto hacia adentro como fuera de esta.