El presente, futuro y los retos de la minería de procesos y las técnicas de generación de lenguaje natural: entrevista con Manuel Lama

Escrito por
inverbis analytics
1 de julio de 2022 Max 15 min read

Según la investigación ‘Explorando la aplicación de la minería de procesos para apoyar el aprendizaje autorregulado’, la minería de procesos comprende un amplio conjunto de algoritmos y técnicas para el análisis de secuencias y datos temporales. Al tratarse de una disciplina bastante reciente, continuamente se desarrollan nuevos algoritmos y técnicas para mejorarla.

En la medida en que existan personas involucradas, los procesos no suelen ser fijos ni deterministas, pero la visión de lo que sucede en el mundo real puede ayudar a comprender qué está sucediendo y de qué manera la realidad difiere de lo que planeamos o esperamos. De esta manera, la minería de procesos puede ser una herramienta muy útil y desempeñar un papel clave en el apoyo a las actividades humanas. 

En una entrevista con Manuel Lama, investigador de Process Mining y docente de la Universidad Santiago de Compostela, se realizó un análisis a fondo la minería de procesos, su estado actual, las técnicas de generación de lenguaje natural, sus oportunidades de mejora y su futuro prometedor.

Manuel Lama

Manuel Lama, Senior Lecturer en la Universidad de Santiago de Compostela

La minería de procesos es una disciplina joven, pero que ya cuenta con cierto bagaje y ha demostrado su potencial. ¿Cuáles crees que son los 3 retos más importantes en los próximos años?

Manuel Lama: Los retos más importantes tienen que ver con el salto cualitativo que ha dado la minería de procesos en los últimos 3 o 4 años, donde se pasó del desarrollo de técnicas y de estrategias orientadas a la descripción de lo que ha ocurrido en un proceso, a entender qué es lo que ha ocurrido antes, a empezar a centrar su atención en lo que son las técnicas predictivas y las técnicas prescriptivas.

Es decir, a no solo hacer el análisis post mortem, sino hacer un análisis de las predicciones y de cómo tomar acciones para corregir los posibles desvíos que pueden ocurrir sobre las predicciones de la ejecución del proceso. Entonces ahí es donde se han desarrollado técnicas para la predicción y técnicas de optimización, técnicas de causalidad y técnicas de simulación. Todas ellas, sobre todo causalidad, optimización y simulación, aun están en un estado muy temprano de desarrollo.

Sobre las técnicas de predicción, se ha centrado la atención desde hace unos 6 o 7 años, y ya hay desarrollos interesantes, técnicas que han demostrado, especialmente a nivel académico, su rendimiento, sobre todo las que están basadas en arquitecturas de aprendizaje profundo, de machine learning. Y ahora el reto en las técnicas de predicción está en aplicarlas a problemas reales, problemas en la industria, para saber si tienen efectividad, si la información que utilizan es suficiente, o si habría que proveer más información.

Tenemos también las técnicas de causalidad, que son tremendamente importantes para entender no lo que ocurría, sino por qué ocurría. Aquí lo importante es el por qué, y básicamente este tipo de técnicas se centran en extraer las causas por las cuales un proceso se ejecuta de determinada forma. Entonces por ejemplo, por qué una solicitud, que forma parte de un proceso cuyo objetivo es aceptar una solicitud o rechazarla, ha sido aceptada, o por qué ha sido rechazada.

Así mismo, donde tenemos por ejemplo un proceso de exploración de una página web, poder saber por qué un determinado número de usuarios visita más unas páginas que otras, entendiendo esa navegación como un proceso.

En un proceso médico en el que hay que decidir si se opera o no un determinado paciente, por qué se opera o no se opera. Y esto tiene que ver con que actualmente las técnicas de minería de procesos donde se hace ese análisis post mortem, trabajan con relaciones temporales entre actividades. Es decir, si una actividad A está conectada con otra actividad B, eso quiere decir que la actividad A ocurre antes que la actividad B, pero no que la actividad A causa la ejecución de la actividad B.

Entonces de lo que tenemos que pasar es de un modelo de relaciones temporales a un modelo causal, donde las relaciones entre las actividades indiquen las causas por las cuales tienen lugar esas actividades, y también tiene que haber una conexión no solo con las causas sino con otros elementos de interés en el proceso, como pueden ser los atributos.

Continuando con estos retos, una vez tenemos claras las causas podemos optimizar, que al final es el fin último de lo que es la minería de procesos. La minería de procesos tiene como objetivo optimizar los procesos, es decir se estudia lo que ha ocurrido en su ejecución, se puede predecir lo que va a ocurrir, pero en definitiva el objetivo es facilitar la toma de decisiones por parte de los usuarios para mejorar los procesos.

Claro, si no conocemos las causas de lo que ha ocurrido difícilmente vamos a poder optimizar. Podemos suponerlas, intuirlas a partir de información de la que disponemos, y podemos decir si se ejecuta con mucha frecuencia un patrón de actividades, podemos inferir que el crecimiento o el que este atributo tenga un valor superior es porque se ha ejecutado muchas veces este patrón, pero eso no deja de ser una injerencia que está haciendo el usuario, aquí estamos hablando de otra cosa. 

Si conocemos las causas desde luego podemos tomar mejores medidas, es decir, optimizar el proceso.

Y finalmente lo que completa el cuadro actual son las herramientas de simulación, que se pueden entender como la herramienta definitiva de minería de procesos. Si puedes simular un proceso basado en lo que ha ocurrido, es decir en la ejecución real del proceso, no en un modelo que puedes tener, si puedes eliminar actividades para ver lo que sucede, o introducir nuevas actividades, establecer nuevos participantes que ejecutan las actividades, y jugar con una configuración de proceso determinada, que te simula el resultado, tendrás o facilitarás la toma de decisiones.

En definitiva, uno de los retos a los que se enfrenta a día de hoy la minería de procesos es pasar, combinar o aprovechar el análisis post mortem que se ha hecho durante estos años.

Otro reto que también es muy importante es saber transmitir la información, las analíticas traídas a través de las técnicas transmitidas de minería de procesos, saber transmitirlas a los tomadores de decisiones. En la mayor parte de los casos tenemos lo que se denomina un proceso espagueti, que tiene tal cantidad de relaciones entre actividades que es imposible para un usuario visualizar la estructura de lo que se está viendo.

Por lo tanto, necesitamos saber explicar y transmitir al usuario lo que está ocurriendo. Históricamente se ha hecho a través de gráficos avanzados, pero en los últimos años una de las líneas hot topic en ingeniería de procesos es utilizar técnicas de generación de lenguaje natural para explicar el proceso. En definitiva, en vez de verlo a través de un gráfico te lo cuento a través de texto, pero no te cuento todo, porque si te cuento todo, es muy difícil ver lo que es más relevante. 

Pierdes información pero posiblemente no necesitas toda la información. Uno de los temas importantes en ingeniería de procesos que tiene que ver con análisis post mortem, es hacer entender a los usuarios qué es lo que ha ocurrido a diario y una de las formas es a través de las técnicas de generación de lenguaje natural. 

¿En qué entornos veremos la aplicación del process mining en el futuro más inmediato?

Manuel Lama: Actualmente hay una serie de entornos o de dominios de aplicación donde las técnicas de minería de proceso han sido más exploradas, y donde tiene todo el sentido. En el dominio médico porque existe una gran cantidad de excepciones a los protocolos establecidos, y porque en muchos casos los protocolos se tienen que adaptar a situaciones que no están previstas.

Entonces en esos ámbitos de la salud, es muy relevante conocer qué es lo que ha ocurrido y poder prever qué es lo que puede ocurrir. Porque esos procesos tienden a ser espagueti, donde hay  muchas excepciones.

Se empezó a aplicar en ese ámbito desde el inicio, pero están otros ámbitos donde hay sistemas que capturan esos datos y que por lo tanto se prestan para realizar ese análisis. Por ejemplo, en el ámbito de la banca, se registran todas las interacciones entre lo que es el banco y los clientes, en la medida en que se registran se habilita el uso de técnicas de minería de procesos para optimizar y para ver anomalías que puede haber dentro de los procesos. 

Tenemos también las administraciones públicas que son candidatos a seguir aplicando las técnicas de ingeniería de procesos, pues tienen la obligación de optimizar los procesos para darle una mejor prestación de servicio a los usuarios. Legalmente por lo menos en España tienen esa obligación, y tienen los datos.

Y por supuesto en industria, que es el candidato casi más clásico, donde tienen sistemas de gestión de procesos, capturan la información sobre esas actividades que se realizan en el marco del proceso, y donde necesariamente los objetivos también deben ser optimizar. En la medida en que mejor se optimice el proceso, mejores serán los indicadores.

La minería de procesos se puede entender como una herramienta bastante general a la hora de optimizar un proceso, porque un proceso es una secuencia de actividades que pueden tener lugar y se pueden determinar de forma específica para cada uno. Una actividad puede ser, por ejemplo, los espacios por los que transita un usuario por el centro comercial. Si un usuario pasa por delante de una cafetería se puede entender que ha hecho la actividad de pasar por delante, con lo cual puedes trazar a ese usuario en el centro comercial. Si no es un usuario sino son miles, puedes hacer un análisis de patrones, para identificar los sitios por los que de forma frecuente han transitado los usuarios.

En e-learning también se ha trabajado bastante y desde mi punto de vista se tiene que trabajar más. El uso de técnicas de minería de procesos dentro de lo que se llama learning analitycs, es decir, la realización de analítica sobre lo que hacen los y las estudiantes en una plataforma. 

Con la minería de procesos se puede estudiar el fenómeno de por qué los estudiantes no terminan un curso, abordando desde diferentes perspectivas: analizando los datos en genérico o a partir de la lista de actividades que realizan los usuarios. 

La minería de procesos se puede aplicar en ámbitos muy diversos. En los mundos virtuales, cuando tienes una app y el usuario realiza una serie de actividades, tú puedes establecer la ejecución del proceso que ha realizado el usuario.

Tanto la “simulación de procesos” y “predicción de procesos” son temas relevantes para sectores industriales (y muchos otros sectores). ¿Cuáles son las diferencias y las relaciones entre una y otra?

Manuel Lama: Una predicción no implica que tenga que haber una simulación. Con una predicción concretamente en lo que se denomina monitorización predictiva en ingeniería de procesos, básicamente realizas la predicción de los elementos que forman parte del proceso. Predices cuándo tendrá lugar la siguiente actividad, predices cuándo acabará esa ejecución del proceso, predices el conjunto de actividades que se pueden dar en el proceso y predices indicadores de negocio, es decir, los resultados de la ejecución del proceso.

Se puede realizar la predicción, se le puede presentar al usuario, lo ideal es que esa predicción requeriría una explicación de por qué el sistema predice qué va a ocurrir, por ejemplo, el rechazo de una solicitud. ¿Por qué es necesaria una explicación? Porque eso ayuda a la toma de decisiones corporativas. 

Das esa información y dejas en mano del usuario la toma de decisiones. Como sé que esta solicitud se va a rechazar por ejemplo, porque no ha valorado correctamente la documentación, pues puedo tomar acciones para comunicarle al usuario que realice mejor la validación y no esperar a la finalización del proceso. 

En el caso de simulación, aquí hasta cierto punto predecimos, si estamos en una determinada parte de una ejecución, para simular tenemos que averiguar qué actividad se va a ejecutar después, y en definitiva tenemos que indicar las actividades que se van a ejecutar, el tiempo con el que se va a ejecutar cada una, y cómo la ejecución modificará los indicadores de negocio. 

Actualmente hay una línea de investigación donde une la predicción con la simulación, y donde hasta cierto punto, si podemos predecir, podemos simular.

La simulación tiene un segundo componente, esto es así si no modificamos nada del proceso, pero si decimos vamos a eliminar esta actividad y simulamos qué es lo que ocurre, ahí no solo necesitamos técnicas de predicción.

No solo es suficiente con una predicción, sería suficiente si lo que necesitamos es que nos indique cómo va evolucionando el proceso a partir de lo que ha sucedido antes. 

Desde mi punto de vista, la simulación se puede entender como la herramienta definitiva, tienes predicción, tienes causalidad, optimización, necesitas causalidad para poder prescribir acciones. 

Cuando hablamos de “mutación y cambio” de procesos, ¿a qué nos referimos exactamente? ¿Cuáles son las diferencias?

Manuel Lama: Mutación y cambio de procesos se pueden entender como sinónimos. Qué significa cambio de proceso, pues se puede entender que un proceso es algo estable en el tiempo, es decir, la ejecución de un proceso sigue un conjunto de actividades a lo largo del tiempo.

Un proceso es algo muy vivo porque tiene como característica fundamental que muchas de las actividades las realizan personas, y las personas tienen su propia situación, y tienen la toma de decisiones que en muchos casos son medidas correctoras y correctivas que toman para que un proceso se ejecute de la mejor forma.

Entonces, ¿qué significa el cambio de proceso? Significa que el proceso no siempre se ejecuta de la misma forma. Imaginémonos que tenemos un proceso de e-learning donde en una de las actividades o en un determinado punto, el alumno puede o hacer un examen y después paritcipar en un debate, o hacer un conjunto de ejercicios. Tiene esos dos tipos de posibilidades para obtener un determinado resultado.

Es posible que unos alumnos empiecen a ejecutar el proceso y que haya una proporción de 70-30, pero a la vez que van acabando los alumnos los que van llegando a esta etapa, pasa que primero, mientras el profesor va viendo los resultados, los propios alumnos pueden ir interactuando con otros alumnos y contándoles que los ejercicios les toman más tiempo que hacer el examen y participar en el debate. De modo que esa proporción del 70-30 se va modificando, incluso, puede llegar un momento donde nadie haga los ejercicios, y si nadie los hace, esa actividad no se está ejecutando y el proceso no es el mismo. 

El modelo de proceso ha cambiado, la estructura y la forma de ejecutarla. Y puede cambiar por decisiones que se tomen en un momento dado, en este caso por decisión de los profesores, donde pueden eliminar ese ejercicio, o por la propia dinámica de la ejecución del proceso, donde un conjunto de actividades se deja de ejecutar.

Dicho esto es importante tener herramientas que detecten ese cambio en el proceso, porque sino las decisiones se están tomando asumiendo que el proceso tiene una determinada estructura, que no es la real, sino que se está ejecutando de otra. 

Actualmente, las herramientas de minería de procesos no tienen en cuenta que el proceso puede cambiar. Entonces se están tomando decisiones sobre algo que ya no está ocurriendo, tu puedes decir oye, en el último año los alumnos que han realizado los ejercicios ha sido un 35%, sí, es cierto, pero lo que no dices es que en los últimos 4 meses es el 0.5% o del 1%, porque el proceso ha cambiado. Ahí lo que falla es la identificación de ese cambio de proceso, la identificación de que a partir de un punto dado se deben volver a extraer nuevas analíticas suponiendo que existe un proceso diferente.

El lenguaje natural y toda la evolución de la IA en este campo está dando mucho que hablar. ¿Cómo podemos usar el procesamiento del lenguaje natural para la captura de procesos? ¿Nos puede servir para explicar su comportamiento? ¿Nos puedes adelantar algo de tu investigación sobre el tema?

Manuel Lama: Mi investigación está más relacionada no tanto con el procesamiento del lenguaje natural sino con la generación del lenguaje natural. Aquí hay dos vías, la generación del lenguaje natural está relacionado con lo que indicaba antes, si tú tienes un proceso que tiene muchas actividades y que tiene muchas relaciones entre las actividades, te puedes basar en el uso de herramientas visuales para ir viendo lo que ocurre. 

Básicamente lo que vas haciendo es explorando a través de esas herramientas visuales qué es lo que ocurre, tienes selección de variantes, selección de variantes por frecuencia, por tiempo de ejecución, puedes eliminar o puedes seleccionar las variantes donde no existe una actividad, donde la diferencia temporal entre dos actividades sea menor a un determinado tiempo, etc. En definitiva, lo que hace el analista del proceso es hacerse preguntas y explorar a través de herramientas visuales.

El problema es que con esas herramientas visuales en muchos casos tenemos una saturación de información, por lo que es necesario realizar esa exploración profunda que lleva bastante tiempo, y extraer conclusiones no es sencillo, porque además el analista tiene que conocer el dominio, o por lo menos tiene que resolver un conjunto de preguntas que hacen los expertos en el proceso.

Esas preguntas las puede resolver de dos formas, una hace esa exploración, obtiene unos resultados y a través de gráficas entrega esos resultados. Entonces ¿Quién hace la interpretación de esos resultados? La hace el analista de negocio o el experto del dominio viendo esas gráficas, viendo la tendencia de la frecuencia de las actividades, la tendencia de las variables, etc, pero la interpretación la tiene que hacer necesariamente el usuario de la herramienta.

En generación del lenguaje natural el objetivo no es sustituir esas herramientas visuales porque aportan una gran cantidad de información y son muy útiles, el objetivo es complementar esas herramientas visuales. De modo que se le describe al usuario la información más relevante del proceso. 

Por ejemplo, con una descripción del lenguaje natural yo te podría decir en los últimos 3 meses, la mayoría de los pacientes que entraron por urgencias y a los que se les practicó un tag y una ecografía fueron operados en el plazo de 6 meses. Eso que te lo condenso en una frase, pero extraerlo a través de herramientas visuales es bastante complicado, primero el modelo del proceso no te lo va a decir, ese modelo es un espaguetti de relaciones y de actividades, por lo tanto lo que tienes que hacer es un análisis temporal y de frecuencia a lo largo del tiempo, buscando eso que te acabo de decir, relaciones entre los últimos 3 meses, entre los ingresos que se han hecho, entre las actividades que han recibido los usuarios y entre el resultado de lo que es el proceso, es decir, que se ha operado, y además el tiempo en el cual se ha operado.

Tienes que combinar una gran cantidad de información para llegar a ese resultado, si yo te doy ese resultado en lenguaje natural, tu puedes leer el resultado y cuando veas las gráficas establecer conclusiones sobre lo que ha ocurrido. 

Ese es uno de los ámbitos en lenguaje natural en los que estamos trabajando, lo hemos aplicado en el dominio médico con éxito, le hemos presentado a los profesionales sanitarios la información de forma gráfica y de forma textual, y prefieren la forma textual. Evidentemente con esto no podemos decir que en todos los casos prefieren la forma textual, se necesita más información al respecto, pero los resultados son muy prometedores.

Hay otro ámbito también muy relevante que es la extracción del registro de eventos a partir de información no estructurada. Es decir, la inmensa mayoría de las técnicas en ingeniería de procesos parte de que los datos están en una base de datos que tienen la información en columnas, donde se identifica el caso, la actividad, cuándo ha iniciado, cuándo ha finalizado, quién la ha hecho, y una serie de indicadores de negocio.

Se supone que viene en un fichero CSV, o en una base de datos.

Pero, ¿qué ocurre si los datos no están en esos formatos estructurados? ¿Qué ocurre si los datos, por ejemplo, están en un conjunto de correos que se han pasado los usuarios? ¿Qué ocurre si están en un documento donde se describe qué es lo que se ha hecho.

Ahí sí que necesitamos técnicas de procesamiento de lenguaje natural para extraer esos eventos, automáticamente. A día de hoy, hasta donde conozco, aun hay muy pocas experiencias y técnicas que realicen ese análisis, y de hecho es uno de los retos abiertos en este matrimonio entre ingeniería de procesos y procesamiento y generación de lenguaje natural. 

Para terminar: ¿qué te gustaría que se convirtiera en realidad en el mundo de la minería de procesos de aquí a 5 años?

Manuel Lama: Lo que me gustaría es que se aplicase de forma más extensiva. Es decir, a día de hoy la aplicabilidad real de las técnicas de minera de procesos aun es baja, y lo que me gustaría es que de la misma forma que se han adoptado determinado tipo de técnicas, herramientas y tecnologías como pueden ser a día de hoy, nadie discute que tiene que haber una base de datos en una compañía, muy pocas empresas discuten que tienen que tener un ERP para gestionar lo que son los procesos, pero la adopción de las técnicas de minería de procesos aun necesita de lo que en otros ámbitos se denominan ‘killer applications’. Es decir, por ejemplo, ¿Cuál fue el punto de no retorno para la adopción de internet? El correo electrónico, como herramienta que hacía indiscutible el uso de internet para la interacción entre personas, esa fue la ‘killer application’, la herramienta central a partir de la cual vimos la necesidad de implantar internet. 

Desde mi punto de vista en minería de procesos aun no existe esa ‘killer application’, que aplicada de forma indiscutible a casi cualquier empresa promueva la adopción de la minería de procesos. Muy posiblemente eso viene condicionado a una baja disponibilidad de los datos, es decir, aunque nadie discute el valor de los datos, una cosa es acopiar datos y otra cosa es hacer disponibles esos datos con calidad y que se puedan utilizar por otras herramientas. 

Creo que esos dos aspectos van ligados, la disponibilidad de unos datos y la disponibilidad de una herramienta que vaya más allá de una exploración, de herramientas visuales que son muy útiles pero que requieren gran esfuerzo. Esa aplicación que haciendo uso de unos datos bien estructurados, curados y disponibles, permita a las empresas de forma sencilla tomar decisiones. Y yo creo que ese ‘killer application’ aun falta para que el mercado vea realmente esa adopción, esa necesidad de disponer de minería de procesos en general, y de esa herramienta en particular. 

Se están dando pasos, cada vez se van mejorando y se van entendiendo mejor las necesidades de las empresas pero desde mi punto de vista aun falta para que una empresa que vende minería de procesos vaya a otra empresa que necesite de esta herramienta y que vea la necesidad, porque ya lo ha visto aplicado en otras empresas, porque ya les ha funcionado, y porque adoptarlo es sencillo.

Y esa es la tercera parte. Mientras no existe esa sencillez a la hora de adoptar esa tecnología, tendremos una barrera. Y yo creo que los tres elementos están relacionados, eso es lo que me gustaría como investigador en minería de procesos. Eso nos permitiría seguir desarrollando nuevas ideas, nuevos retos, que a día de hoy se ven limitados por la baja disponibilidad de los datos. Y de hecho en ciertos ámbitos y líneas de investigación se están manejando datos sintéticos, porque disponer de los datos reales es muy difícil. Algo en lo que se está trabajando en el «living lab» que Inverbis ha puesto en marcha con Queizuar.

Me gustaría ir a empresas que tuvieran datos reales y ver en qué medida podríamos hacer predicciones. Un gran ejemplo es el living lab de Inverbis con Queizuar.

Y por supuesto, una de las cosas que realmente valoro yo de investigar en minería de procesos es que desarrollamos investigación que tiene una aplicabilidad, es decir, no se queda en modelos teóricos, que resuelven problemas reales a corto medio plazo, porque la investigación también requiere de un reposo, de combinar ideas y de cierta creatividad para lo que se necesita tiempo. 

El saber que el objetivo es resolver un problema real, para mi personalmente es una de las cosas que me gusta más de la investigación en minería de procesos.

Leer más…

Observabilidad y minería de procesos

Observabilidad y minería de procesos

Las herramientas de observabilidad, permiten a los gestores de las infraestructuras de tecnologías de la información tener conocimiento en tiempo real de los estados internos de los sistemas de forma integrada y omnicomprensiva. Las técnicas de observabilidad tienen...