APRENDIZADO PROFUNDO BASEADO EM CNN-LSTM PARA LEGENDAGEM AUTOMÁTICA DE IMAGENS

Maria Vitória Sousa  Ribeiro; Tiago do Carmo  Nogueira; Gelson da Cruz  Junior; Cássio Dener Noronha  Vinhal; Matheus Rudolfo Diedrich  Ullmann; Deller James  Ferreira; Caio Henrique Rodrigues  Carvalho; Danyele de Oliveira  Santana

doi:10.56238/arev6n3-145

APRENDIZADO PROFUNDO BASEADO EM CNN-LSTM PARA LEGENDAGEM AUTOMÁTICA DE IMAGENS

Autores/as

Maria Vitória Sousa Ribeiro Autor/a
Tiago do Carmo Nogueira Autor/a
Gelson da Cruz Junior Autor/a
Cássio Dener Noronha Vinhal Autor/a
Matheus Rudolfo Diedrich Ullmann Autor/a
Deller James Ferreira Autor/a
Caio Henrique Rodrigues Carvalho Autor/a
Danyele de Oliveira Santana Autor/a

DOI:

https://doi.org/10.56238/arev6n3-145

Palabras clave:

Aprendizado de Máquina, Aprendizado Profundo, Redes Neurais Convolucionais, Memória Longa de Curto Prazo, Legendagem de Imagens

Resumen

A evolução da Visão Computacional e Aprendizado de Máquina permite que técnicas de descrição de imagens em linguagem natural sejam mais eficientes e precisas, por meio de redes neurais profundas. Este estudo utilizou uma estrutura codificador-decodificador para identificação e legendagem de objetos, através de uma imagem de entrada. O modelo proposto utilizou as arquiteturas VGG16 e Inception-V3 como codificadores e LSTM como decodificador. Para a realização dos experimentos, foi utilizado o conjunto de dados Flickr8k, possuindo 8.000 imagens. O modelo foi avaliado pelas métricas Bleu, Meteor, CIDEr e Rouge. Alcançando 58,40% de precisão conforme a métrica Bleu, garantindo assim descrições compreensíveis para o ser humano.

Descargas

Los datos de descarga aún no están disponibles.

Descargas

Publicado

2024-11-13

Número

Vol. 6 Núm. 3 (2024)

Sección

Articles

Cómo citar

RIBEIRO, Maria Vitória Sousa; NOGUEIRA, Tiago do Carmo; JUNIOR, Gelson da Cruz; VINHAL, Cássio Dener Noronha; ULLMANN, Matheus Rudolfo Diedrich; FERREIRA, Deller James; CARVALHO, Caio Henrique Rodrigues; SANTANA, Danyele de Oliveira. APRENDIZADO PROFUNDO BASEADO EM CNN-LSTM PARA LEGENDAGEM AUTOMÁTICA DE IMAGENS. ARACÊ , [S. l.], v. 6, n. 3, p. 6725–6749, 2024. DOI: 10.56238/arev6n3-145. Disponível em: https://periodicos.newsciencepubl.com/arace/article/view/1339. Acesso em: 3 apr. 2025.

Descargar cita

APRENDIZADO PROFUNDO BASEADO EM CNN-LSTM PARA LEGENDAGEM AUTOMÁTICA DE IMAGENS

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Descargas

Publicado

Número

Sección

Cómo citar

Últimas publicaciones

Idioma

Enviar un artículo

Palabras clave

Información