domingo, 21 de diciembre de 2014

Las redes neuronales ya rivalizan con los primates en reconocimiento visual

Los científicos comenzaron a construir redes neuronales en la década de los 70 con la esperanza de imitar la capacidad del cerebro para procesar la información visual, reconocer el habla y entender el lenguaje. Para las redes neuronales basadas en la visión, los científicos se inspiraron en la representación jerárquica que lleva a cabo el cerebro con la información visual: en su camino desde la retina al córtex inferotemporal, la información se reprocesa y se hace progresivamente más específica, hasta que finalmente permite llevar a cabo la identificación de objetos. Imitando esto, los diseñadores de las redes neuronales establecen varios niveles de cómputo en sus modelos: en cada uno de ellos se lleva a cabo una operación matemática y se desecha la información innecesaria.

Durante todos estos años, el objetivo de los neurocientíficos ha sido que estas redes fueran capaces de imitar las habilidades visuales del cerebro de los primates (capaz de reconocer objetos de forma rápida y precisa de un simple vistazo) hasta ahora sin éxito. Pero un nuevo estudio de neurocientíficos del MIT muestra que una de las las llamadas “redes neuronales profundas” de última generación, desarrollada por investigadores de la ciudad de Nueva York, podría haberse puesto ya a la altura del cerebro de los macacos.

Dado que estas redes se basan en el nivel de comprensión que la neurociencia tiene del funcionamiento del cerebro, esto indicaría que los neurocientíficos han conseguido hacerse una idea bastante exacta del funcionamiento del proceso de reconocimiento de objetos. Eso al menos es lo que sostiene James DiCarlo, autor principal de un paper sobre el citado estudio y director del Departamento de Ciencias del Cerebro y Cognitivas del MIT. Esta mejor comprensión de cómo funciona el cerebro de los primates podría conducir a una mejor inteligencia artificial y, algún día, a nuevas formas de reparar las disfunciones visuales.

Dos datos explican el reciente éxito de este tipo de red neuronal:

  • El aprovechamiento de la capacidad de computación de las GPU (las unidades de procesamiento de gráficos, nacidas para gestionar la información visual de los videojuegos).
  • El acceso por parte de los investigadores a bases de datos con millones de imágenes para ‘entrenar’ a los algoritmos en los diferentes niveles de identificación, con ayuda de las anotaciones añadidas por seres humanos. Por ejemplo: la foto de un pastor alemán sería etiquetada como “pastor alemán”, “perro”, “canino”, “animal”, etc. Así, cuanto mayor e el volumen de imágenes procesadas por las redes neuronal, más refinan sus cálculos y más precisas resultan sus identificaciones.

Vía | MIT News






from TICbeat http://ift.tt/1GKhGE4