Congreso Universidad, mayo-agosto 2026; 12(2), e91

Presentado en el XI Taller Internacional “La transformación digital y las tecnologías de avanzada en la Educación Superior”

 

Artículo científico

Propuesta de un agente inteligente para la mejora del acceso a la información en el contexto universitario

 

Proposal for an intelligent agent to improve access to information in the university context

 

Rafael Martínez Estévez1 0000-0001-5407-1865 rafael.martinez@upr.edu.cu
Lázaro Hernández Pérez1 0009-0001-3528-669X lhdezp0211@gmail.com
Yoendi García Yañes1 0009-0008-9464-3184 yoendigy1408@gmail.com

1 Universidad de Pinar del Río "Hermanos Saíz Montes de Oca". Cuba.

 

Recibido: 21/02/2026
Aceptado: 2/06/2026


RESUMEN

Se presentó la propuesta de UPR-Chat, un sistema de agente inteligente diseñado para mejorar el acceso a la información específica del ámbito universitario, abordado desde las limitaciones de los grandes modelos de lenguaje, como el conocimiento desactualizado y las alucinaciones. Basado en la tecnología GraphRAG, UPR-Chat integró un grafo de conocimiento construido con datos universitarios locales (se utilizaron herramientas como Neo4j y LangChain) para proporcionar contexto relevante, que permitió generar respuestas más precisas y contextualizadas. La metodología incluyó revisión bibliográfica, análisis de requerimientos y el diseño de agentes especializados basados en los procesos fundamentales universitarios, con conjuntos de herramientas adaptados a las necesidades docentes e investigativas, para ofrecer una solución eficiente y de hardware accesible para la comunidad universitaria.

Palabras clave: agente inteligente; educación; inteligencia artificial; GraphRAG.


ABSTRACT

The UPR-Chat proposal was presented, an intelligent agent system designed to improve access to university-specific information, addressing the limitations of large language models, such as outdated knowledge and inconsistencies. Based on GraphRAG technology, UPR-Chat integrated a knowledge graph built with local university data (using tools such as Neo4j and LangChain) to provide relevant context, enabling more accurate and contextualized responses. The methodology included a literature review, requirements analysis, and the design of specialized agents based on fundamental university processes, with toolsets adapted to teaching and research needs, to offer an efficient and hardware-accessible solution for the university community.

Keywords: artificial intelligence; education; inteligent agent; GraphRAG.


 

INTRODUCCIÓN

En una era caracterizada por una disponibilidad de información sin precedentes, el crecimiento exponencial del volumen de datos ha generado una paradoja: la dificultad creciente para localizar información específica y relevante. Este fenómeno, análogo a navegar en un vasto océano de datos, subraya la necesidad de herramientas de búsqueda más eficientes.

En respuesta a este desafío, han emergido tecnologías disruptivas como los Grandes Modelos de Lenguaje (LLM), ejemplificados por sistemas como ChatGPT, Deepseek o Gemini. Estos modelos han transformado la investigación y el acceso al conocimiento y ofrecen nuevas vías para explorar temas complejos. Su aplicación en el entorno universitario, mediante un sistema inteligente capaz de responder consultas con información contextualizada, representa una utilidad significativa tanto para el personal docente como para los estudiantes.

No obstante, los LLM presentan limitaciones inherentes. Su conocimiento está acotado por sus datos de entrenamiento, lo que puede derivar en respuestas desactualizadas o la generación de información incorrecta (alucinaciones) al abordar temas fuera de su dominio. Además, el entrenamiento y despliegue de modelos propios implican un consumo considerable de recursos computacionales, ello representa una barrera técnica y económica.

Para superar estas limitaciones y dotar a la comunidad universitaria de una herramienta avanzada de acceso a la información, se propone el desarrollo de UPR-Chat. Esta aplicación, se fundamenta en la creación de un grafo de conocimiento construido a partir de diversas fuentes de información universitarias, capturando las entidades y sus interrelaciones.

Este grafo proporciona el contexto necesario a un LLM (potencialmente externo) para generar respuestas precisas y relevantes a las consultas de los usuarios, y se implementa la técnica conocida como GraphRAG (Graph-based Retrieval Augmented Generation) (Enzo, 2024).

GraphRAG mejora la metodología RAG tradicional (Recuperación y Generación) al estructurar la información en un grafo. En lugar de una simple búsqueda vectorial, GraphRAG consulta el grafo para identificar entidades y relaciones pertinentes y suministrar este contexto estructurado al LLM, junto con la consulta original. Esto permite al modelo establecer conexiones más profundas y generar respuestas más coherentes, precisas y contextualizadas, para superar las limitaciones de conocimiento y comprensión relacional de los LLM estándar.

UPR-Chat, mediante GraphRAG, ofrece respuestas más actualizadas y pertinentes al ámbito universitario que las obtenibles con LLM genéricos, requiere además una infraestructura de hardware significativamente más accesible.

A partir de lo expuesto, se trazó como objetivo desarrollar un sistema inteligente (UPR-Chat) que mejore significativamente la búsqueda y acceso a información relevante y precisa en el ámbito universitario, supere las limitaciones de los modelos de lenguaje tradicionales y aproveche la representación gráfica del conocimiento.

 

MATERIALES Y MÉTODOS

La metodología empleada para el desarrollo de UPR-Chat comprendió las siguientes fases:

  1. Revisión sistemática de la literatura: se realizó una revisión exhaustiva de la literatura científica y técnica relevante en las áreas de agentes inteligentes, LLM, RAG y, específicamente, GraphRAG. Se analizaron las potencialidades, limitaciones y arquitecturas propuestas en la literatura reciente.
  2. Análisis de requerimientos y casos de uso: se llevó a cabo un análisis detallado de las actividades y necesidades de información dentro de la comunidad universitaria (docentes, investigadores, estudiantes). A partir de este análisis, se definieron los casos de uso específicos que cubrieron los agentes inteligentes de UPR-Chat (agente profesor, agente investigador).
  3. Diseño de la arquitectura: basado en los hallazgos de la revisión literaria y los casos de uso definidos, se diseñó la arquitectura del sistema UPR-Chat. Se seleccionó la tecnología GraphRAG como núcleo y se propuso el uso de una base de datos de grafos (Neo4j) para almacenar el grafo de conocimiento universitario y un framework (LangChain) para orquestar la interacción entre el grafo, el recuperador y el LLM generador.
  4. Selección de herramientas y modelos: se identificaron y seleccionaron las herramientas específicas para la implementación, se incluyeron el LLM base, las librerías para la construcción del grafo, la extracción de entidades y relaciones, y las herramientas para los agentes específicos (herramientas de búsqueda, resumen, notificación, análisis de datos).

 

RESULTADOS Y DISCUSIÓN

La revisión sistemática de la literatura arrojó hallazgos clave que fundamentaron la propuesta de UPR-Chat:

Desafíos de los LLMs: diversas fuentes resaltaron los riesgos asociados a los LLM, sus sesgos, generación de contenido dañino, privacidad y la necesidad de transparencia y control humano, aspectos cruciales a considerar en el entorno universitario (Buyl et al., 2025; Huang et al., 2023; Zhao et al., 2023).

Implementación de RAG: se analizaron artículos y guías prácticas para implementar arquitecturas RAG, se destacó la integración de recuperadores (bases vectoriales) y generadores (LLM) para mejorar la precisión factual (Bach et al., 2022; Zhao et al., 2024).

Potencial de GraphRAG: múltiples fuentes convergieron en señalar las ventajas de GraphRAG sobre RAG tradicional. Al modelar explícitamente las relaciones en un grafo de conocimiento, GraphRAG actuó como una memoria estructurada, permitió recuperar información contextualizada y realizar inferencias más complejas que resultaron en respuestas más precisas, menor latencia (como en el caso de estudio de datos de fútbol) y una reducción significativa de las alucinaciones. La combinación de Neo4j y LangChain se identificó como una vía robusta para su implementación (Enzo, 2024; Edge et al., 2024)

Aplicaciones universitarias y evaluaciones: investigaciones como "Development and Evaluation of a University Chatbot Using Deep Learning: A RAG-Based Approach" demostraron empíricamente la superioridad de un enfoque RAG (logró un 90 % de exactitud frente al 66 % de GPT-4 base) para chatbots universitarios, ello validó la pertinencia de esta arquitectura en el contexto investigativo. Aunque usó RAG vectorial, sentó precedente para la mejora esperada con GraphRAG (Olawore et al., 2025).

Los agentes en los sistemas de tipo GraphRAG estuvieron definidos principalmente por las herramientas a las que tuvieron acceso. Como resultado del análisis de necesidades, se definieron los perfiles de agentes con sus respectivas cajas de herramientas iniciales de UPR-Chat.

Agente profesor: orientado a tareas docentes como generación de contenido, revisión de exámenes, elaboración de informes, respuesta a preguntas temáticas o recomendación de material de estudio o notificaciones académicas.

Agente investigador: enfocado en apoyar el proceso de investigación con herramientas para la búsqueda y recolección de información (web scraping), extracción de datos de documentos, generación de resúmenes y filtrado/clasificación de información, gestión bibliográfica, análisis y visualización de datos, asistencia en redacción científica y detección de plagio, traducción y asistencia metodológica, y generación de plantillas y documentos.

Al construir un grafo de conocimiento específico de la UPR y utilizarlo para contextualizar un LLM, UPR-Chat pudo ofrecer acceso a la información significativamente más preciso, relevante y eficiente que los LLM genéricos o los sistemas RAG basados únicamente en vectores, y mitigar los altos requerimientos computacionales de entrenar un modelo desde cero. La especificidad de los agentes propuestos aseguró la cobertura de necesidades clave dentro de la comunidad universitaria.

En resumen, se identificó que si bien los LLM ofrecieron capacidades avanzadas, sus limitaciones (conocimiento acotado, alucinaciones, coste computacional) dificultaron su aplicación directa y óptima para necesidades específicas de información universitaria. La arquitectura para UPR-Chat basada en GraphRAG utilizó un grafo de conocimiento universitario construido a partir de fuentes locales y herramientas como Neo4j y LangChain, ello permitió generar respuestas contextualizadas, precisas y actualizadas con requerimientos de hardware más accesibles.

 

REFERENCIAS BIBLIOGRÁFICAS

Bach, S. H., Sanh, V., Yong, Z., Webson, A., Colin, R., Nayak, N., Sharma, A., & Taewoon, K. (2022). PromptSource: An Integrated Development Environment and Repository for Natural Language Prompts (arXiv:2202.01279). arXiv. https://doi.org/10.48550/arXiv.2202.01279

Buyl, M., Rogiers, A., Noels, S., Bied, G., Dominguez-Catena, I., Heiter, E., Johary, I., Mara, A., Romero, R., Lijffijt, J., & Bie, T. (2025). Large Language Models Reflect the Ideology of their Creators (arXiv:2410.18417). arXiv. https://doi.org/10.48550/arXiv.2410.18417

Edge, D., Trinh, H., Cheng, N., Bradley, J., Chao, A., Mody, A., Truitt, S., & Larson, J. (2024). From Local to Global: A Graph RAG Approach to Query-Focused Summarization (arXiv:2404.16130; Versión 1). arXiv. https://doi.org/10.48550/arXiv.2404.16130

Enzo. (2024, julio 11). The GraphRAG Manifesto: Adding Knowledge to GenAI. Graph Database & Analytics. https://neo4j.com/blog/graphrag-manifesto

Huang, S., Dong, L., Wang, W., Hao, Y., Singhal, S., Ma, S., Lv, T., Cui, L., Mohammed, O., Patra, B., Liu, Q., Aggarwal, K., Chi, Z., Bjorck, J., Chaudhary, V., Som, S., Song, X., & Wei, F. (2023). Language Is Not All You Need: Aligning Perception with Language Models (arXiv:2302.14045). arXiv. https://doi.org/10.48550/arXiv.2302.14045

Olawore, K., McTear, M., & Bi, Y. (2025). Development and Evaluation of a University Chatbot Using Deep Learning: A RAG-Based Approach. Chatbots and Human-Centered AI, 96-111. https://doi.org/10.1007/978-3-031-88045-2_7

Zhao, S., Yang, Y., Wang, Z., He, Z., Qiu, L., & Qiu, L. (2024). Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely (arXiv:2409.14924; Versión 1). arXiv. https://doi.org/10.48550/arXiv.2409.14924

Zhao, W., Zhou, K., Li, J., Tang, T., Wang, X., Hou, Y., Min, Y., Zhang, B., Zhang, J., Dong, Z., Du, Y., Yang, Ch., Chen, Y., Chen, Z., Jiang, J., Ren, R., Li, Y., Tang, X., Liu, Z., Wen, J. (2023). A Survey of Large Language Models (arXiv:2303.18223; Versión 10). arXiv. https://doi.org/10.48550/arXiv.2303.18223

 

Conflicto de intereses

Los autores declaran no tener conflictos de intereses.

 

Contribución de los autores

Todos los autores revisaron la redacción del manuscrito y aprueban la versión finalmente remitida.

 


Esta obra está bajo una licencia Creative Commons Reconocimiento-NoComercial 4.0 Internacional