Analítica aplicada en bibliotecas: una experiencia de los primeros pasos

Por: Jesús Anderson Morales-Alvira

El valor de los datos es un tema del que se ha venido hablando activamente durante los últimos años. Términos como analítica, business intelligence, business analytics, big data, minería de datos y machine learning, han tomado fuerza y se han puesto entre los principales temas del momento en muchas disciplinas, pero especialmente en materia de administración y gestión de las organizaciones.

Y no es de extrañarse, con el poder del internet, estamos constantemente conectados en dispositivos que miden toda clase de información: la frecuencia cardiaca en los relojes inteligentes, las palabras que usamos para hacer búsquedas en la web, las tiendas virtuales que visitamos, nuestros trayectos y patrones de desplazamientos, entre muchos otros que quizá no sepamos que se miden. De hecho, existe una acalorada conversación de qué tan ético puede ser y hasta dónde inicia la privacidad de las personas con este tipo de mediciones.

En este siglo, se han construido imperios como Google, Amazon y Facebook que han sabido aprovechar al máximo toda la información que pueden extraer de sus usuarios sin ser intrusivos o solicitarlos directamente. Datos que pueden ser tan fáciles de identificar como la ubicación, palabras de búsqueda, edad, sexo o la IP del dispositivo desde el cual navegamos, han sido claves para desarrollar complejos algoritmos que convierten estos datos en información que es usada para personalizar cada vez más sus servicios.

Esta conversión de datos a información es el primer proceso que se describe en la ya famosa “pirámide del conocimiento”, desarrollada por Russell Ackoff (1989).

***Figura 1. Pirámide del conocimiento*** (Ruiz, 2020).

La estructura que se presenta, de hecho, es un poco fácil de comprender: “La suposición implícita es que los datos se pueden utilizar para crear información; la información se puede utilizar para crear conocimiento, y el conocimiento se puede utilizar para crear sabiduría” (Rowley, 2007), contando con una estructura jerárquica fundamentada en los datos.

Para ampliar información de la pirámide del conocimiento, puedes visitar este artículo científico: https://doi.org/10.1177/0165551506070706

Ahora bien, entrando en el entorno Bibliotecario, se puede mencionar que los datos han servido como apoyo para conocer el estado de la Biblioteca y también para la toma de decisiones en temas como la adquisición de material bibliográfico, descarte, suscripción a recursos electrónicos, reservas, préstamos, renovaciones, consulta en sala, cantidades y tipos de usuarios, que a su vez han permitido responder preguntas específicas del impacto que tiene en la comunidad, su relevancia y la detección de áreas de mejora para continuar con el fortalecimiento de sí misma y su evolución de acuerdo con el entorno social y tecnológico actual, con una mirada al futuro.

Figura 2. Centro de información de Biblioteca

Dentro de este marco, y en función del desarrollo de la analítica como capacidad institucional (Universidad de La Sabana, 2020), la Biblioteca Octavio Arizmendi Posada ha sido consciente del valor de los datos que surgen de sus recursos y servicios y se ha planteado el uso de estos, apuntando a niveles superiores en la pirámide del conocimiento de Ackoff, que no solamente nos sirvan para responder a los objetivos de la unidad o institucionales, sino que también podamos explorar análisis más profundos en otros aspectos y que nos permita aportar a otras bibliotecas que se encuentren en la misma búsqueda.

En aras de llegar a este objetivo, se ha creado la mesa de analítica de Biblioteca, la cual se ha ocupado de llevar a cabo todo un proceso que ha enriquecido no solamente la capacidad de nuestra unidad de información de responder rápida y acertadamente a consultas de información solicitadas por las demás áreas, sino que también ha impactado positivamente el ámbito profesional de quienes la conformamos, dejando claro también, que aún nos hace falta mucho que aprender.

***Figura 3. Informe de circulación y préstamo***

¿Por dónde iniciar?

La construcción un modelo de analítica que permita escalar en esta pirámide hasta su cúspide debe estar fundamentada en su base: los datos. Esta va a ser la materia prima desde la cual vamos a construir los demás niveles, y, por ende, debe estar minuciosamente cimentada mediante procesos que garanticen la fiabilidad, seguridad y respaldo ante cualquier eventualidad.

Para ello, es indispensable conocer muy bien los servicios y los recursos junto a su funcionamiento con exactitud, teniendo en cuenta los datos generados por los diferentes programas de administración y gestión, junto a aquellos que se hacen con la intervención de un funcionario o el usuario, tratando siempre de dar relevancia a aquellas fuentes automatizadas, ya que suelen tener un margen de error menor a las que se realizan manualmente, y suelen ahorrar tiempo y esfuerzo.

Posteriormente, es necesario consultar todas y cada una de estas fuentes de datos para familiarizarse con los mismos, identificar aquellas que no cuentan con una estructura propia de base de datos (filas y columnas) y convertirlas para que puedan ser usadas correctamente.

En este punto, ya podemos ser capaces de hacer pequeños análisis y construir nuestros primeros informes, pero antes de continuar es necesario establecer los objetivos del modelo.

Preguntas como ¿Qué se va a medir? ¿Qué datos se están tomando y no se están incluyendo en los informes? ¿Qué datos son irrelevantes? ¿están los datos normalizados en todas las fuentes de datos? Deben quedar resueltas antes de continuar.

Una buena fuente de indicadores, y mediciones para la Biblioteca puede ser la ISO 11620: Información y documentación – Indicadores de rendimiento bibliotecario. (2014). Que cuenta con una estructura y mediciones desarrolladas para conocer el impacto y rendimiento de la Biblioteca.

Así mismo, y teniendo en cuenta las diferentes mediciones, se hace necesario contar con una estructura normalizada de datos de los usuarios entre todas las fuentes. Es decir, que se manejen los mismos atributos para describir la comunidad que usa los servicios de biblioteca independiente del software, los formularios o los informes existentes, se debe hablar de los usuarios de la misma manera, pensando en que esta variable, va a compartirse entre todos los informes para que en un futuro podamos hacer el análisis de todos los servicios y recursos usados por un solo usuario en un solo lugar.

Este análisis es fundamental, “Es una realidad que el usuario es el norte principal de toda la actividad bibliotecaria, por lo que el amplio conocimiento sobre él es esencial para ofrecerle los servicios que requiere, como un objetivo estratégico que debe cumplir la unidad de información” (Morales & Carrión, 2020).

***Figura 4. Informe de referencia y bibliografía***

¿Qué software usar?

Existen en este momento varias opciones para elaborar informes interactivos con varias fuentes de datos, software de suscripción como Power BI o Tableau cuentan con las herramientas necesarias para desarrollar nuestros informes, sin embargo, también se puede usar software como Excel o Google Data Studio (más accesibles).

En cuanto al almacenamiento de datos, formatos como Excel o CSV son más que suficientes para lograr conectarnos a estas fuentes de datos y en lo posible, tratar de usar servicios en la nube como OneDrive para almacenar los mismos. Por otra parte, en nuestro caso, hemos optado por herramientas adicionales para mejorar y automatizar la captura de información, como por ejemplo Microsoft Forms y su versión institucional para capturar direcciones de correo electrónico y nombre de los usuarios (si se incluye este tipo de información debemos tener en cuenta la privacidad de los datos personales), Listas de Microsoft Sharepoint para almacenar los datos y recuperar otros atributos de los usuarios (programa, facultad, comunidad, tipo de usuario, etc) y herramientas como Microsoft PowerApps junto a Microsoft PowerAutomate para crear flujos de trabajo automatizados que nos facilitan diferentes tareas y nos producen datos con márgenes de errores mínimos comparados con el ingreso de datos manual y de paso nos ahorran tiempo en la gestión de las solicitudes.

***Figura 5. Informe de servicio de domicilios***

Proceso

Teniendo en cuenta lo anterior, ya podemos hablar de las 3 fases consecutivas que hemos identificado en la mesa de analítica de la Biblioteca Octavio Arizmendi Posada para subir el primer peldaño en la pirámide, en nuestro caso, cada uno de los 3 integrantes se ha especializado en cada una de estas áreas, ya que requieren conocimientos técnicos para realizar la conversión de los datos en conocimiento.

Gobierno de datos

Si apuntamos a un modelo que se alimente de bases de datos de las diferentes actividades de la biblioteca, se deben establecer ciertas reglas de acceso, organización de los archivos o bases de datos y su actualización, para que sea sencillo conectarse a los datos. La transparencia y el conocimiento de todo el equipo de trabajo de estas fuentes y cómo se alimentan, ayudan a crear la cultura y el desarrollo de la analítica como capacidad de toda la unidad.

Por otra parte, la centralización de todas las fuentes de datos en un lugar accesible, y preferiblemente en la nube (en nuestro caso usamos herramientas ligadas a los servicios institucionales como OneDrive y SharePoint de Microsoft), son de gran ayuda para continuar con la siguiente fase, ya que si estamos pensando en usar un software como Power BI, vamos a tener la posibilidad de programar actualizaciones automáticas y los informes van a permanecer actualizados a medida que se ingresen nuevos datos.

La alimentación de estos orígenes de datos también debe ser lineada de acuerdo con la producción de estos, si extraemos datos de Sistema Integrado de Gestión Bibliotecaria (SIGBD), la sugerencia es no hacer transformaciones de los datos en este punto, ya que en la siguiente fase serán realizadas.

2. ETL – Extract, Transform and Load

El proceso de extracción, transformación y carga hace las veces de pegamento entre los orígenes de datos y la construcción de los informes, implica el desarrollo y la conexión del software de visualización con las fuentes de datos y, por ende, requiere conocimientos básicos en editores de consultas (Power Query en Microsoft Excel y Power BI).

Aquí es importante también conocer un poco más el software utilizado, ya que en nuestro caso hemos tenido que aprender fundamentos de lenguaje DAX y Lenguaje de Fórmulas M para realizar combinaciones, cálculos y conexiones entre las diferentes fuentes de datos.

Otro concepto a tener en cuenta, es el de Relaciones entre tablas, necesario para la construcción lógica del modelo de datos, y que nos permita interactuar entre varias bases de datos.

Finalmente, la construcción de los indicadores con cálculos, nos abren el panorama al segundo peldaño de la pirámide, la información.

3. Visualización

La presentación y diseño de los informes debe estar en función de las necesidades de información de quienes los consultan. Una manera de plantear la funcionalidad del informe en esta etapa, es diseñarlo teniendo en cuenta de que el mismo sea capaz de responder a preguntas que pueden llegar a ser específicas o generales y dando relevancia, a aquellas que la Biblioteca responde frecuentemente, por ejemplo: ¿Cuántos préstamos hubo en el mes pasado? ¿Qué programa tuvo la mayor tasa de reserva en el año anterior? ¿Cuántos libros se catalogaron por analista?

Aquí el reto es construir un Dashboard o un tablero de mando que sea interactivo e intuitivo, que responda a aquellas preguntas identificadas anteriormente, que cuente con los datos principales, que permita hacer análisis a profundidad y que el uso de gráficas sea adecuado y lo suficientemente comprensible por quienes usan la información.

Así mismo, la interfaz de los informes debe ser interactiva. Que le permita al usuario aplicar filtros y ver el comportamiento de los datos respecto a estos, se aclaren variables que puedan ser confusas y que al mismo tiempo no saturen la vista con demasiados objetos visuales.

En cuanto a los objetos visuales a usar, se sugiere dar prioridad a aquellos que son fáciles de interpretar como diagramas de tortas, mapas, gráficos de barras, líneas y áreas, así como espacios para indicadores como tarjetas o números grandes con indicadores principales. Gráficas especializadas o difíciles de comprender como los diagramas de dispersión o gráficos de cajas y bigotes, se pueden implementar, pero explicando a quienes van a usar el informe su interpretación, y quizá, dejando notas aclaratorias.

Aquí puedes leer más acerca de La visualización de datos, herramientas y el periodismo de datos. Finalmente, y antes de la publicación y puesta en producción de los informes, nos ha funcionado presentar el mismo y obtener retroalimentación de las personas que van a utilizarlo frecuentemente o con todo el equipo de trabajo, su perspectiva, comprensión y comentarios son fundamentales para realizar los últimos ajustes y garantizar que se entienda el uso de este por todos los funcionarios.

***Figura 7. Informe de servicios interbibliotecarios***

***Figura 8. Informe de servicios interbibliotecarios con información por convenio.***

¿Qué sigue?

La creación de un modelo de analítica de la unidad en este punto abre un poco el panorama de lo que viene después, la aparición de otros indicadores y combinaciones de datos, alertas y la minería de datos o Bibliominig, abren la puerta al conocimiento dentro de la pirámide y nuevas ideas de todo nuestro equipo de trabajo para realizar mediciones que antes no realizábamos, empiezan a ser más palpables.

Como vimos anteriormente, para alcanzar la cúspide de la pirámide del conocimiento debemos subir los 4 peldaños, y hasta ahora hemos fundamentado el primero, y nos encontramos cosechando información del segundo, los siguientes requieren aún más de formación y conocimientos de nuestro equipo de trabajo y nuestra intención es seguir trabajando en esa dirección para lograrlo.

Bibliografía

Ackoff, R. (1989). From data to wisdom. Journal of Applied Systems Analysis, 16, 3-9. – References – Scientific Research Publishing. Journal of Applied Systems Analysis, 16, 3–9. https://www.scirp.org/(S(351jmbntvnsjt1aadkposzje))/reference/ReferencesPapers.aspx?ReferenceID=713373

International Organization for Standardization. (2014). ISO 11620. Information and documentation – Library performance indicators (pp. 1–108).

Morales, M. F., & Carrión, R. B. (2020). Bibliomining, data, and the decision making process. Revista Interamericana de Bibliotecologia, 43(2), eI8–eI8. https://doi.org/10.17533/UDEA.RIB.V43N2EI8

Rowley, J. (2007). The wisdom hierarchy: representations of the DIKW hierarchy. Journal of Information Science, 33(2), 163–180. https://doi.org/10.1177/0165551506070706

Ruiz, F. (2020). La pirámide del conocimiento: Apuntes para una reflexión. Soul. https://soulimproveledge.com/piramide-del-conocimiento/

Universidad de La Sabana. (2020, octubre 26). Nuestras victorias tempranas como capacidad institucional en el desarrollo de la analítica. 1599, 2–4.

¿Por dónde iniciar?

¿Qué software usar?

Proceso

¿Qué sigue?

Bibliografía

Me gusta esto:

Relacionado

Deja un comentarioCancelar respuesta

Analítica aplicada en bibliotecas: una experiencia de los primeros pasos

¿Por dónde iniciar?

¿Qué software usar?

Proceso

¿Qué sigue?

Bibliografía

Compartelo:

Me gusta esto:

Relacionado

Deja un comentarioCancelar respuesta

Descubre más desde Bibliosabana