Estudio y diseño de arquitecturas digitales para la implementación eficiente de redes neuronales convolucionales

Título

Estudio y diseño de arquitecturas digitales para la implementación eficiente de redes neuronales convolucionales

Colaborador

Lutenberg, Ariel

Editor

Universidad de Buenos Aires. Facultad de Ingeniería

Fecha

2025-10

Extensión

xx, 258 p.

Resumen

Esta tesis doctoral presenta dos contribuciones principales al campo de la implementación eficiente de redes neuronales en hardware digital: una metodología sistemática para la implementación de redes neuronales convolucionales (CNNs) en hardware embebido y un esquema de cuantización flexible que optimiza el equilibrio entre precisión y eficiencia de implementación. La metodología propuesta descompone el proceso de implementación en nueve fases bien definidas, desde el diseño funcional de alto nivel hasta la verificación final. La arquitectura se organiza en tres clases de bloques especializados: procesamiento, flujo de datos y organización de memoria. Esta organización modular permite una implementación escalable y reutilizable que facilita la adaptación a diferentes plataformas. La cuantización flexible constituye la segunda contribución principal, resolviendo las limitaciones de los esquemas uniforme y no uniforme al desacoplar el número de bits del número de niveles. Esto permite optimizar ambos parámetros de manera independiente, manteniendo la compatibilidad con implementaciones de hardware eficientes mediante aritmética de punto fijo. Se desarrollaron dos enfoques para la optimización: cuantización post-entrenamiento (PTQ) y entrenamiento consciente de cuantización (QAT). Los resultados experimentales demuestran que la cuantización flexible permite alcanzar compresiones significativas con pérdidas mínimas de precisión, superando el rendimiento de la cuantización uniforme tradicional. Las contribuciones de esta tesis proporcionan un marco sistemático y reproducible para la implementación eficiente de CNNs en hardware digital, combinando una metodología de diseño estructurada con técnicas avanzadas de cuantización que mantienen la precisión mientras optimizan los recursos de hardware disponibles.