Un algoritmo TEDE estudia el efecto de agrupar conjuntos de datos en la precisión del aprendizaje supervisado
Autores: Wang, Xufei; Wang, Penghui; Song, Jeongyoung; Hao, Taotao; Duan, Xinlu
Idioma: Inglés
Editor: MDPI
Año: 2023
Disponible con Suscripción Virtualpro
Artículos
Categoría
Ingeniería y Tecnología
Licencia
Atribución – Compartir igual
Consultas: 9
Citaciones: Sin citaciones
Los conjuntos de datos son la base para la investigación sobre métodos de aprendizaje profundo en visión por computadora. El impacto del porcentaje de conjuntos de entrenamiento en un conjunto de datos en el rendimiento de los modelos de redes neuronales necesita ser explorado más a fondo. En este documento, se propone un algoritmo de enumeración de diferencia igual doble (TEDE) para investigar el efecto de diferentes porcentajes de conjuntos de entrenamiento en el conjunto de datos en el rendimiento del modelo de red, y se determina el porcentaje óptimo de conjunto de entrenamiento. Al seleccionar el conjunto de datos de Pascal VOC y dividirlo en seis conjuntos de datos diferentes de mayor a menor, y luego dividir cada conjunto de datos en los conjuntos de datos a analizar según cinco porcentajes diferentes de conjuntos de entrenamiento, se utiliza la red neuronal convolucional YOLOv5 para entrenar y probar los 30 conjuntos de datos para determinar el modelo de red neuronal óptimo correspondiente a los porcentajes de conjunto de entrenamiento. Finalmente, se realizaron pruebas utilizando el conjunto de datos de Udacity Self-Driving con un conjunto de datos de Defectos de Banda de Rodadura de Neumáticos (TTD) hecho por uno mismo. Los resultados muestran que el rendimiento del modelo de red es superior cuando el conjunto de entrenamiento representa entre el 85% y el 90% del conjunto de datos en general. Los resultados de la partición del conjunto de datos obtenidos por el algoritmo TEDE pueden proporcionar una referencia para la investigación de aprendizaje profundo.
Descripción
Los conjuntos de datos son la base para la investigación sobre métodos de aprendizaje profundo en visión por computadora. El impacto del porcentaje de conjuntos de entrenamiento en un conjunto de datos en el rendimiento de los modelos de redes neuronales necesita ser explorado más a fondo. En este documento, se propone un algoritmo de enumeración de diferencia igual doble (TEDE) para investigar el efecto de diferentes porcentajes de conjuntos de entrenamiento en el conjunto de datos en el rendimiento del modelo de red, y se determina el porcentaje óptimo de conjunto de entrenamiento. Al seleccionar el conjunto de datos de Pascal VOC y dividirlo en seis conjuntos de datos diferentes de mayor a menor, y luego dividir cada conjunto de datos en los conjuntos de datos a analizar según cinco porcentajes diferentes de conjuntos de entrenamiento, se utiliza la red neuronal convolucional YOLOv5 para entrenar y probar los 30 conjuntos de datos para determinar el modelo de red neuronal óptimo correspondiente a los porcentajes de conjunto de entrenamiento. Finalmente, se realizaron pruebas utilizando el conjunto de datos de Udacity Self-Driving con un conjunto de datos de Defectos de Banda de Rodadura de Neumáticos (TTD) hecho por uno mismo. Los resultados muestran que el rendimiento del modelo de red es superior cuando el conjunto de entrenamiento representa entre el 85% y el 90% del conjunto de datos en general. Los resultados de la partición del conjunto de datos obtenidos por el algoritmo TEDE pueden proporcionar una referencia para la investigación de aprendizaje profundo.