Tal y como su nombre indica, la visión artificial describe la capacidad de un dispositivo digital para captar datos visuales —fotos, vídeos e incluso imágenes en directo— y, a continuación, interpretarlos. Hoy en día, la visión artificial se utiliza en el mundo real para todo tipo de aplicaciones, desde la organización de bibliotecas de fotos y los coches semiautónomos hasta el análisis de logotipos de patrocinadores en vídeos deportivos y la inspección de calidad en las líneas de montaje de fábricas de chips de silicio.
Pero las posibilidades de la visión artificial son ilimitadas, y en la actualidad se están desarrollando muchas innovaciones menos conocidas, o incluso algunas que ya se están aplicando en el mundo real. Estas son solo algunas de ellas:
Mira, mamá, sin cámara: mapping 3D
Gracias a tecnologías como Google Tango, la próxima generación de smartphones contará cada vez más con sensores 3D que les permitirán identificar, medir y crear mapas 3D del mundo que les rodea. Se trata de una nueva capacidad que la startup Fantasmo, con sede en Santa Mónica, está aprovechando para crear una plataforma basada en la cartografía espacial 3D de colaboración colectiva. La información se puede almacenar en la nube y, posteriormente, utilizarse para todo tipo de fines, desde ayudar a los nuevos propietarios a visualizar cómo quedarían los muebles en su nueva vivienda hasta permitir a los creadores de Pokémon Go generar contenidos de realidad aumentada (RA) basados en una comprensión real y en tiempo real del mundo que rodea al jugador. Sin embargo, si se combina la tecnología de Project Tango con una cámara en directo, el juego transformará toda la habitación con superposiciones específicas del entorno y diversos Pokémon que reaccionarán a ese entorno sobre la marcha.
Para Fantasmo, el valor no reside en el escaneo 3D en sí mismo, sino en la plataforma de espacios 3D cartografiados mediante crowdsourcing que se recopilan y en la capacidad de controlar dicha plataforma. «Queremos ser el conducto por el que circulen estos datos», afirmó el director ejecutivo de Fantasmo, Jameson Detweiler, en una demostración realizada en la LDV Vision Summit, donde Fantasmo ganó el concurso de start-ups. «El objetivo final es un modelo del mundo en constante actualización, en el que realicemos un seguimiento activo de cada persona y luego incorporemos esa información a un motor de videojuegos o a cualquier otra herramienta que se desee utilizar. Así es, literalmente, como se fusionan el mundo digital y el mundo físico. Es la capa de realidad aumentada».
El pequeño ayudante de los patólogos: diagnóstico a través de los ojos, los rostros y las radiografías
Contrariamente a lo que se suele creer, los diagnósticos realizados por máquinas no pretenden realmente sustituir a los médicos ni a otros profesionales sanitarios, sino más bien potenciar sus capacidades. Un patólogo medio, por ejemplo, puede llegar a examinar unas 500 láminas de vidrio, cada una de las cuales contiene entre decenas y cientos de miles de células individuales. Todas esas células deben examinarse adecuadamente, lo cual es prácticamente imposible para una sola persona.
Aquí es donde la IA basada en la visión artificial —capaz de gestionar grandes volúmenes de imágenes siempre que busque elementos específicos— marca la diferencia. Los estudios realizados por PathAI, empresa que desarrolla y entrena modelos de visión artificial para ayudar a los patólogos a mejorar sus diagnósticos, revelaron que los índices de precisión en las biopsias de ganglios linfáticos en casos de cáncer de mama pasaron del 85 % al 99,5 % al comparar los enfoques basados únicamente en el ser humano con aquellos que combinan la intervención humana con la tecnología informática.
El sistema de aprendizaje automático de PathAI se encarga, básicamente, de señalar las zonas en las que detecta cáncer en esas aproximadamente 500 preparaciones. «Y ahora el trabajo de un patólogo consiste realmente en corregir o confirmar el diagnóstico proporcionado por el sistema de IA, para luego pasar al siguiente caso», afirmó el cofundador y director ejecutivo de PathAI en la reciente LDV Vision Summit. «Es un procedimiento mucho más rápido».
Camiones, drones y barcos: todo lo demás es autónomo
La mayoría de los titulares actuales sobre transporte se centran en los coches autónomos destinados al consumidor, que utilizan una combinación de cámaras, sensores, LiDAR y radar para «ver» lo que hay en la carretera delante y a su alrededor, pero se está dedicando el mismo esfuerzo en investigación y desarrollo a optimizar las capacidades de visión artificial en camiones, barcos e incluso coches de carreras autónomos.
Algunos expertos creen que los vehículos de carga autónomos estarán listos para su uso generalizado antes que los coches autónomos de consumo. En el futuro, veremos flotas de camiones eléctricos autónomos y a prueba de accidentes que podrán circular las 24 horas del día, los 7 días de la semana, sin fallos, quizá a una velocidad muy elevada, transportando productos agrícolas o paquetes —o, lo que es más importante, 2.000 cajas de cerveza— de un extremo al otro del país en un par de días. Mientras tanto, la startup Sea Machines ya está probando embarcaciones autónomas en el puerto de Boston; esta empresa está trabajando en sistemas de autocontrol para todo tipo de embarcaciones, desde barcos de bomberos hasta buques de carga. ¿Podría esto significar el fin de los vertidos de petróleo?
Pero no todo es cuestión de practicidad. El entretenimiento deportivo también se está volviendo autónomo. La startup Roborace y la Fórmula E (competición de coches eléctricos) se han unido para desarrollar coches de carreras autónomos que no solo pueden alcanzar las 199 millas por hora, sino que además son capaces de aprender en la pista —cuanto más se parezca a una carrera de obstáculos, mejor—, lo que hace que el potencial para batir récords sea exponencial, por decirlo suavemente.
Máquinas de mil caras: la visión artificial que te cala a la perfección
Puede que la IA carezca de empatía, habilidades sociales e inteligencia emocional, pero algunas de las tareas para las que se han entrenado recientemente las redes de reconocimiento facial ofrecen predicciones emocionales básicas y específicas. Disney, por ejemplo, ha desarrollado una red capaz de discernir qué opinan los espectadores sobre una película en 10 minutos o menos, con solo observar imágenes de sus rostros. Mediante cuatro cámaras de infrarrojos enfocadas hacia los rostros de los espectadores en una sala de cine de 400 butacas, los investigadores de Disney captaron alrededor de 16 millones de expresiones faciales a lo largo de 150 proyecciones.
Mediante una tecnología conocida como «codificadores automáticos variacionales factorizados» (FVAE), el programa de Disney realiza cálculos basados, por ejemplo, en si una persona se ríe o parece asustada en los momentos adecuados, lo que luego puede utilizarse para todo tipo de fines, desde proyecciones de prueba hasta motores de recomendación en el próximo servicio de streaming de vídeo de Disney, similar a Netflix.
Para no quedarse atrás en la carrera por la inteligencia emocional de las máquinas rudimentarias, esa otra gran marca típicamente estadounidense, Walmart, está desarrollando una tecnología de reconocimiento facial que analiza el estado de ánimo de los clientes a través de cámaras situadas en las cajas. Si un cliente está molesto porque el cajero tarda demasiado, el sistema detectará su malestar mediante el reconocimiento facial y avisará al instante a otros empleados para que acudan a ayudarle.
Pero, ¿por qué limitarse a la capacidad de lectura de las personas? Los animales también tienen caras, y por eso unos investigadores británicos entrenaron una red neuronal con 500 imágenes de ovejas que sentían dolor y otras que se encontraban perfectamente bien. Centrándose en los signos reveladores del «dolor», como las orejas inclinadas hacia delante y los ojos entrecerrados, la «Escala de expresiones faciales del dolor en ovejas» aprendió a predecir si una oveja está sufriendo con solo mirar una foto de su cara.
La visión «positiva» de Terminator: dispositivos wearables que realmente funcionan
Aunque puede que Google Glass no haya logrado conquistar al gran público, el sueño de los dispositivos wearables con realidad aumentada no ha desaparecido. Se rumorea incluso que Apple está trabajando en unas gafas con realidad aumentada. Por ahora, empresas como Vuzix ofrecen gafas inteligentes con capas similares a la realidad aumentada para ayudar a los conductores de tractores a trabajar de forma más eficiente y segura, mientras que Orcam ofrece gafas wearables capaces de leer texto e incluso identificar rostros para personas con discapacidad visual mediante visión artificial. Ambas monturas resultan un poco toscas por ahora, pero es solo cuestión de tiempo que empresas ópticas como Warby Parker y otras similares ofrezcan dispositivos wearables similares que tengan el mismo aspecto que unas gafas normales. Y, por supuesto, es muy posible que las lentes de contacto también ofrezcan estas experiencias similares a la realidad aumentada.
En el futuro, la posibilidad de disponer de una pantalla dinámica que reaccione al entorno permitirá desarrollar capacidades verdaderamente sobrehumanas. Habrá la posibilidad de recuperar información o analizar lo que se ve —el tipo de coche, árbol, edificio u obra de arte que tengas delante—, ampliar con teleobjetivo o a nivel microscópico lo que ves, y reproducir acontecimientos de hace unos instantes, días o años. Y no olvidemos que la realidad aumentada no se limita a superponer efectos llamativos sobre la imagen en directo de una cámara. También significa, por ejemplo, que los mapas de calor en tiempo real creados por cámaras termográficas —que ya se encuentran en muchos smartphones y cámaras portátiles— podrían incorporarse pronto también a los dispositivos wearables.
Ilustraciones de Andrew Colin Beck





