DETECCIÓN DE INTENCIONES DE COMPRA Y DE SERVICIOS MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL
DOI:
https://doi.org/10.56238/ERR01v10n4-031Palabras clave:
Búsqueda Semántica, Procesamiento de Lenguaje Natural (PLN), Clasificación de Consultas, Sistemas de Recomendación, TransformersResumen
Introducción: La creciente complejidad de las interacciones en plataformas de comercio electrónico plantea desafíos significativos para la recuperación precisa de productos y servicios, particularmente en consultas cortas y ruidosas en portugués brasileño. En este contexto, los modelos monolingües basados en arquitecturas Transformer emergen como soluciones prometedoras para capturar los matices lingüísticos locales, con el objetivo de reducir las reformulaciones y el abandono de la búsqueda, elementos críticos para la experiencia del usuario y las tasas de conversión. Objetivo: El presente trabajo tuvo como objetivo principal desarrollar y evaluar un clasificador de intenciones de compra y contratación de servicios en consultas de comercio electrónico, empleando la técnica de aprendizaje por transferencia con modelos BERT pre-entrenados específicamente para el portugués brasileño. Materiales y Métodos: Para ello, se recopiló y anotó manualmente un corpus de consultas obtenidas en la región de Parnaíba, categorizado en 92 intenciones distintas. El preprocesamiento incluyó limpieza, anonimización, normalización textual y la aplicación de técnicas de balanceo y aumento de datos (data augmentation) para mitigar el desequilibrio de clases. Se realizó el ajuste fino (fine-tuning) del modelo neuralmind/bert-large-portuguese-cased (BERTimbau) utilizando las bibliotecas Hugging Face y PyTorch, con la tokenización configurada para max_length = 128. La división de los datos fue estratificada (test_size = 0,10), complementada por validación cruzada estratificada, y el entrenamiento incorporó estrategias de regularización y parada temprana (early stopping). La evaluación del rendimiento se basó en métricas como la exactitud (accuracy), precisión, exhaustividad (recall) y F1-score, con la fijación de semillas y el guardado de puntos de control (checkpoints) para garantizar la reproducibilidad. Resultado: En el conjunto de validación, compuesto por 2.940 muestras, el modelo alcanzó una exactitud global del 96,43% y un F1-score promedio ponderado de aproximadamente 0,96. Las matrices de confusión exhibieron un patrón predominantemente diagonal, indicando alta precisión, aunque se observó una mayor confusión entre categorías semánticamente cercanas y un rendimiento ligeramente inferior en clases con bajo soporte. El entrenamiento demostró una convergencia eficiente en 3–5 épocas, seleccionándose el mejor punto de control basándose en la exactitud. Conclusión: Los hallazgos demuestran que el aprendizaje por transferencia con modelos BERT en portugués constituye una solución viable y altamente eficaz para la detección de intenciones en consultas de comercio electrónico. Este trabajo resultó en la entrega de un conjunto de datos etiquetado de alta calidad y un modelo funcional, que puede integrarse para mejorar la experiencia del usuario y optimizar los sistemas de recomendación. Para futuras implementaciones en producción, se recomienda la integración de señales contextuales (como el historial del usuario y los atributos del producto), así como la exploración del sobremuestreo (oversampling) y la jerarquización de categorías para refinar el rendimiento en clases más desafiantes.
Descargas
Referencias
BORGES, Hilda Biazatti. IMPLEMENTAÇÃO DE BUSCA SEMÂNTICA EM E-COMMERCES COMO APOIO A PESQUISAS INTELIGENTES. Cachoeiro de Itapemirim: INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO ESPÍRITO SANTO, 2024.
CASELI, Helena; FREITAS, Cláudia; VIOLA, Roberta. Processamento de Linguagem Natural. In: SILVA, Ticiana et al. (Orgs.). Minicursos do SBBD 2022. 1. ed. [S.l.]: SBC, 2022. p. 1–25.
DEVLIN, Jacob et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv, , 24 maio 2019. Disponível em: <http://arxiv.org/abs/1810.04805>. Acesso em: 14 set. 2025
HAMMES, Luiz Otávio Alves; FREITAS, Larissa Astrogildo De. Utilizando BERTimbau para a Classificação de Emoções em Português. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA. Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021). Brasil: Sociedade Brasileira de Computação, 29 nov. 2021. Disponível em: <https://sol.sbc.org.br/index.php/stil/article/view/17784>. Acesso em: 14 set. 2025
KHURANA, Diksha et al. Natural language processing: state of the art, current trends and challenges. Multimedia Tools and Applications, v. 82, n. 3, p. 3713–3744, jan. 2023.
KIM, Hiun et al. Intent-based Product Collections for E-commerce using Pretrained Language Models. arXiv, , 15 out. 2021. Disponível em: <http://arxiv.org/abs/2110.08241>. Acesso em: 14 set. 2025
LECUN, Yann; BENGIO, Yoshua; HINTON, Geoffrey. Deep learning. Nature, v. 521, n. 7553, p. 436–444, 28 maio 2015.
PAN, Sinno Jialin; YANG, Qiang. A Survey on Transfer Learning. IEEE Transactions on Knowledge and Data Engineering, v. 22, n. 10, p. 1345–1359, out. 2010.
PEETERS, Ralph; BIZER, Christian. Supervised Contrastive Learning for Product Matching. In: WWW ’22: THE ACM WEB CONFERENCE 2022. Companion Proceedings of the Web Conference 2022. Virtual Event, Lyon France: ACM, 25 abr. 2022. Disponível em: <https://dl.acm.org/doi/10.1145/3487553.3524254>. Acesso em: 14 set. 2025
SCHMIDHUBER, Juergen. Deep Learning in Neural Networks: An Overview. Neural Networks, v. 61, p. 85–117, jan. 2015.
SPECIA, Lucia; RINO, Lucia Helena Machado. O desenvolvimento de um léxico para a geração de estruturas conceituais UNL. [S.l.: S.n.].
VASWANI, Ashish et al. Attention Is All You Need. arXiv, , 2 ago. 2023. Disponível em: <http://arxiv.org/abs/1706.03762>. Acesso em: 14 set. 2025
XIE, Yubo et al. Natural Language Processing with Commonsense Knowledge: A Survey. arXiv, , 13 set. 2024. Disponível em: <http://arxiv.org/abs/2108.04674>. Acesso em: 14 set. 2025
YULIANTON, Heribertus; CANDRA NOOR SANTI, Rina. Product Matching using Sentence-BERT: A Deep Learning Approach to E-Commerce Product Deduplication. Engineering and Technology Journal, v. 09, n. 12, 31 dez. 2024.
ZHANG, Han et al. Towards Personalized and Semantic Retrieval: An End-to-End Solution for E-commerce Search via Embedding Learning. arXiv, , 5 jun. 2020. Disponível em: <http://arxiv.org/abs/2006.02282>. Acesso em: 14 set. 2025