Los investigadores de RIKEN han logrado un progreso significativo en la mejora de las capacidades de reconocimiento de visión por computadora mediante el uso del aprendizaje autosupervisado para mejorar la detección de objetos en imágenes de baja resolución. Al degradar la calidad de las imágenes de alta resolución durante el entrenamiento, el algoritmo puede identificar mejor los objetos en imágenes de baja calidad. Este desarrollo no solo se limita a las aplicaciones tradicionales de visión por computadora, sino que también afecta la creación de avatares robóticos y la tecnología de imágenes de terahercios.
Los algoritmos de visión artificial suelen tener dificultades para detectar objetos con precisión en imágenes de baja calidad debido a la diferencia de escala. La mayoría de los sistemas de IA están entrenados en imágenes de alta resolución, lo que dificulta el reconocimiento de objetos en imágenes del mundo real de baja calidad, borrosas o distorsionadas. El equipo de RIKEN se inspiró en la cognición humana y desarrolló un modelo que reduce aleatoriamente la resolución, el ruido y el ruido de las imágenes de alta resolución. Este enfoque imita las técnicas de remodelación del hipocampo que utiliza el cerebro para formar recuerdos. Al entrenar en estas imágenes degradadas, el algoritmo puede realizar un autoaprendizaje y supervisar de manera efectiva los objetos en una imagen sin intervención humana.
Los investigadores creen que su trabajo tiene implicaciones de gran alcance más allá de las aplicaciones de visión artificial. Destacan la importancia de la representación sensorial continua en cyborgs y tecnologías relacionadas con avatares. Por ejemplo, hay un proyecto en marcha para crear una versión digital de un ministro del gobierno que pueda interactuar con los ciudadanos. Los investigadores también están colaborando con neurocientíficos para explorar la relación entre las representaciones sensoriales artificiales fijas y las representaciones reales en el cerebro.
Además de sus aplicaciones en visión por computadora, este método de aprendizaje autosupervisado se está aplicando a imágenes de terahercios, una tecnología de imágenes emergente con potencial en biomedicina, seguridad y caracterización de materiales. En colaboración con la Universidad de Oxford, el equipo de RIKEN está utilizando inteligencia artificial para mejorar la calidad y la precisión de los dispositivos de imágenes de terahercios.
En general, el uso del aprendizaje autosupervisado en la detección de objetos es prometedor para mejorar las capacidades de los automóviles autónomos, los avatares robóticos y la tecnología de imágenes de terahercios. Al entrenar algoritmos para reconocer objetos en imágenes de baja resolución, los investigadores allanan el camino para sistemas de visión por computadora más precisos y eficientes.