Un nuevo enfoque de clasificación de imágenes a través de modelos mejorados de MobileNet con expansión del campo receptivo local en capas poco profundas
Autores: Wei, Wang; Yiyang, Hu; Ting, Zou; Hongmei, Liu; Jin, Wang; Xin, Wang
Idioma: Inglés
Editor: Hindawi
Año: 2020
Disponible con Suscripción Virtualpro
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Dado que las redes neuronales profundas (DNN) requieren mucha memoria y cálculo, son difíciles de aplicar en sistemas integrados con recursos de hardware limitados. Por eso, los modelos de DNN deben comprimirse y acelerarse. Aplicando convoluciones separables en profundidad, MobileNet puede reducir el número de parámetros y la complejidad computacional con una menor pérdida de precisión en la clasificación. Basándose en MobileNet, se proponen 3 modelos MobileNet mejorados con expansión del campo receptivo local en capas poco profundas, también llamados modelos Dilated-MobileNet (Dilated Convolution MobileNet), en los que se introducen convoluciones dilatadas en una capa convolucional específica del modelo MobileNet. Sin aumentar el número de parámetros, las convoluciones dilatadas se utilizan para aumentar el campo receptivo de los filtros de convolución y obtener una mayor precisión de clasificación. Los experimentos se realizaron con los conjuntos de datos Caltech-101, Caltech-256 y Tubingen con atributos, respectivamente. Los resultados muestran que Dilated-MobileNets puede obtener una precisión de clasificación hasta un 2% mayor que MobileNet.
Descripción
Dado que las redes neuronales profundas (DNN) requieren mucha memoria y cálculo, son difíciles de aplicar en sistemas integrados con recursos de hardware limitados. Por eso, los modelos de DNN deben comprimirse y acelerarse. Aplicando convoluciones separables en profundidad, MobileNet puede reducir el número de parámetros y la complejidad computacional con una menor pérdida de precisión en la clasificación. Basándose en MobileNet, se proponen 3 modelos MobileNet mejorados con expansión del campo receptivo local en capas poco profundas, también llamados modelos Dilated-MobileNet (Dilated Convolution MobileNet), en los que se introducen convoluciones dilatadas en una capa convolucional específica del modelo MobileNet. Sin aumentar el número de parámetros, las convoluciones dilatadas se utilizan para aumentar el campo receptivo de los filtros de convolución y obtener una mayor precisión de clasificación. Los experimentos se realizaron con los conjuntos de datos Caltech-101, Caltech-256 y Tubingen con atributos, respectivamente. Los resultados muestran que Dilated-MobileNets puede obtener una precisión de clasificación hasta un 2% mayor que MobileNet.