Un método de múltiples etapas para la detección de logotipos en documentos oficiales escaneados basado en el procesamiento de imagen
Autores: Guijarro, María; Bayon, Juan; Martín-Carabias, Daniel; Recas, Joaquín
Idioma: Inglés
Editor: MDPI
Año: 2024
Disponible con Suscripción Virtualpro
Artículos
Categoría
Ingeniería y Tecnología
Licencia
Atribución – Compartir igual
Consultas: 1
Citaciones: Sin citaciones
Un logotipo es una región rectangular definida por un conjunto de características, que provienen de la información de píxeles y la forma de la región, que difieren de las del texto. En este documento, se propone y se prueba un nuevo método para la detección automática de logotipos utilizando la base de datos pública Tobacco800. Nuestro método genera un conjunto de regiones de un documento oficial con una alta probabilidad de contener un logotipo utilizando un nuevo enfoque basado en la variación del método de rectángulos de características disponible en la literatura. Las regiones candidatas se calcularon utilizando el algoritmo de la secuencia creciente más larga sobre los índices de líneas en blanco del documento. Estas regiones se refinaron aún más utilizando un método de expansión de rectángulos de características con verificación adelantada, donde la expansión del rectángulo puede ocurrir en paralelo en cada región. Finalmente, se entrenó y probó un árbol de decisión C4.5 contra un conjunto de 1291 documentos oficiales para evaluar su rendimiento. La combinación estratégica de los tres pasos anteriores ofrece una precisión y recuperación para la detección de logotipos del 98.9% y 89.9%, respectivamente, siendo también resistente al ruido y a documentos de baja calidad. El método también es capaz de reducir el área de procesamiento del documento manteniendo un bajo porcentaje de falsos negativos.
Descripción
Un logotipo es una región rectangular definida por un conjunto de características, que provienen de la información de píxeles y la forma de la región, que difieren de las del texto. En este documento, se propone y se prueba un nuevo método para la detección automática de logotipos utilizando la base de datos pública Tobacco800. Nuestro método genera un conjunto de regiones de un documento oficial con una alta probabilidad de contener un logotipo utilizando un nuevo enfoque basado en la variación del método de rectángulos de características disponible en la literatura. Las regiones candidatas se calcularon utilizando el algoritmo de la secuencia creciente más larga sobre los índices de líneas en blanco del documento. Estas regiones se refinaron aún más utilizando un método de expansión de rectángulos de características con verificación adelantada, donde la expansión del rectángulo puede ocurrir en paralelo en cada región. Finalmente, se entrenó y probó un árbol de decisión C4.5 contra un conjunto de 1291 documentos oficiales para evaluar su rendimiento. La combinación estratégica de los tres pasos anteriores ofrece una precisión y recuperación para la detección de logotipos del 98.9% y 89.9%, respectivamente, siendo también resistente al ruido y a documentos de baja calidad. El método también es capaz de reducir el área de procesamiento del documento manteniendo un bajo porcentaje de falsos negativos.