Investigadores de Google encuentran “El Talón de Aquiles” de la Visión Computarizada

Según mediciones la visión computarizada es mejor que la visión humana, pero investigadores del área han descubierto una clase de “imágenes adversas” que pueden engañarla fácilmente.

Uno de los avances más espectaculares en la ciencia moderna es la visión computarizada o “visión de máquina”. En tan solo unos años, una nueva generación de técnicas de aprendizaje ha cambiado por completo la forma en que las computadoras “ven”.

adversarial-images.jpg

Las máquinas hoy día superan ampliamente a nuestra visión en reconocimiento facial y de objetos y están en un proceso de revolucionar muchas tareas que usan este tipo de algoritmos, por ej. conducción, monitoreo, seguridad y tantas otras.

Pero, recientemente se encontró una debilidad que puede poner a prueba todo lo dicho. Al parecer los algoritmos de visión por computadora tienen un “talón de Aquiles”, una debilidad en la que pueden ser engañados fácilmente por imágenes modificadas que son muy fáciles de detectar por cualquier ser humano. A estas se les ha llamado “imágenes adversas” y son un riesgo potencial. Por citar un ejemplo, una imagen adversa podría ser una foto de una persona a la cual se le han aplicado marcas específicas y muy sutiles que un humano reconocería perfectamente pero la visión por computadora la tomaría como a una persona diferente.

google-brain-team-1470829963

Alexey Kurakin y Samy Bengio de Google Brain e Ian Goodfellow de OpenAI han dicho que los sistemas de visión computarizados son muy nuevos y se sabe muy poco acerca de este tipo de engaño mediante “imágenes adversas”. Uno de los mejores sistemas de visión computarizada es Google Inception v3 el cual tiene un error top 5 del 3.46%. Los humanos que hacen el mismo test tienen un error top 5 del 5%, así que podemos decir que Inception tiene habilidades super humanas.

screenshot

Kurakin y su compañía crearon una base de datos de imágenes adversas modificando 50 mil imágenes de ImageNet de tres formas diferentes. Sus métodos aprovechan la idea que luego las redes neuronales procesan para identificar una imagen en particular y clasificarla. A través de un proceso complejo luego se testea todo en los algoritmos de Google Inception v3.

Notas Finales:

En los últimos años hemos aprendido mucho sobre que tan buenos pueden ser los sistemas de visión computarizado y ahora nos estamos dando cuenta de que tan fácil pueden ser engañados. Aún falta mucho camino por recorrer para que todo esto tengo un mínimo porcentaje de error y no haya forma de engañar a la máquina.

Fuente: technologyreview

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s