Viernes 19 de agosto - 15:30 hs
Enzo Ferrante
"Cirugía de gradientes en redes neuronales para generalización de dominio”
Resumen. En aplicaciones de la vida real, como la clasificación de imágenes, los modelos
de redes neuronales artificiales a menudo se enfrentan a escenarios en los que hay un
cambio en la distribución de datos entre los dominios de entrenamiento y prueba. Cuando el
objetivo es hacer predicciones sobre distribuciones de datos diferentes a las que han sido
vistas durante el entrenamiento, se incurre en un problema de generalización de dominio.
Los métodos para abordar este problema aprenden un modelo utilizando datos de múltiples
dominios de origen, y luego aplican este modelo al dominio de destino. Cuando se entrena
una red neuronal con datos provenientes de varios dominios por medio del algoritmo de
gradiente descendente, los gradientes provenientes de cada dominio contienen información
específica que es irrelevante para los demás, incluido el dominio de prueba. Nuestra
hipótesis es que dicho desacuerdo puede degradar la capacidad de generalización del
modelo. En este trabajo [1], caracterizamos los gradientes en conflicto que surgen en
escenarios de cambio de dominio y diseñamos nuevas estrategias de acuerdo de gradiente
basadas en "cirugía de gradientes" para aliviar su efecto. Nuestro enfoque es
validad experimentalmente en el problema de clasificación de imágenes con tres conjuntos
de datos multidominio, proveyendo evidencia empírica sobre las mejoras ofrecidas por
nuestro método.
[1]: Domain Generalization via Gradient Surgery. L Mansilla, R Echeveste, D Milone, E
Ferrante. International Conference on Computer Vision (ICCV 2021). Link: [
https://openaccess.thecvf.com/content/ICCV2021/papers/Mansilla_Domain_Gen...
|
https://openaccess.thecvf.com/content/ICCV2021/papers/Mansilla_Domain_Gen...
] .
Bio. Enzo estudió Ingeniería de Sistemas en la UNICEN (Tandil, Argentina), realizó el
Doctorado en Informática en la Université Paris-Saclay y el INRIA (París, Francia), fue
alumno visitante en la Universidad de Stanford (California, EEUU) e investigador
Fullbright en el Massachussets General Hospital y la Escuela de Medicina de Harvard
(Boston, EEUU), realizó su postdoctorado en el Imperial College London (Londres, Reino
Unido) y a fines de 2017 volvió a la Argentina como investigador repatriado al sinc(i):
Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional dependiente
del CONICET y la Universidad Nacional del Litoral. Allí lidera la línea de investigación
en Machine Learning para el análisis de imágenes biomédicas. Es también docente en la UNL,
en la Universidad Torcuato Di Tella y en la Universidad de San Andrés. En el año 2020
recibió el premio Estímulo de la Academia Nacional de Ciencias Exactas, Físicas y
Naturales, y el premio Ciencia y Tecnología del Mercosur, por sus contribuciones al área
de inteligencia artificial y el análisis de imágenes biomédicas. Es además miembro de la
Academia Joven de Argentina.
Modo de conexión : la charla será presencial y transmitida por ZOOM. Los datos de conexión
son:
[
https://conicet-gov-ar.zoom.us/j/89227430870?pwd=ZjI2a2Uybkl6dllDbktzQWZi... |
https://conicet-gov-ar.zoom.us/j/89227430870?pwd=ZjI2a2Uybkl6dllDbktzQWZi... ]
ID de reunión: 892 2743 0870
Código de acceso: ?*?11Xsixy
_______________________________________
Seminario del IMAL
Instituto de Matemática Aplicada del Litoral - UNL - CONICET
https://imal.conicet.gov.ar
Ruta Nac. No. 168, Paraje El Pozo - 3000 Santa Fe, Argentina
Teléfono:(342) 4511370 - ext 4001/4003
E-mail: seminarioimal(a)santafe-conicet.gov.ar