El sensor de lidar de un smartphone —diseñado para calcular distancias en fotografías cotidianas— puede detectar objetos físicamente ocultos tras una esquina, fuera de cualquier campo de visión directo. Un dispositivo de menos de 100 dólares, del tipo que llevan millones de personas en el bolsillo, haciendo algo que hasta ahora solo era posible con equipos de laboratorio de hasta un millón de dólares.
La brecha entre ambos mundos no podría ser mayor. Y sin embargo, un nuevo estudio publicado en Nature confirma que ese salto es real.
Una tecnología reservada a los laboratorios más equipados
La visión no-línea-de-vista —conocida en inglés como non-line-of-sight imaging— no es un concepto nuevo. Durante años, los investigadores han sabido que es posible «ver» objetos ocultos analizando los pulsos de luz láser que rebotan en superficies reflectantes antes de llegar al sensor. El lidar funciona de forma similar al radar, pero con luz: emite pulsos láser, mide el tiempo que tardan en regresar y construye mapas tridimensionales del entorno.
El problema era el coste. Los primeros sistemas capaces de realizar esta operación requerían equipos científicos especializados de entre 500.000 y un millón de dólares —voluminosos, delicados y completamente confinados a entornos de laboratorio controlados—. La idea era poderosa, pero su aplicación práctica quedaba fuera del alcance de cualquier hardware de consumo.
El salto inesperado: señales ocultas en un sensor de 100 dólares
Todo cambió cuando investigadores del MIT Media Lab comenzaron a experimentar con sensores lidar de consumidor. Al analizar los datos capturados, encontraron algo notable: estos dispositivos baratos ya estaban registrando señales débiles procedentes de objetos situados tras esquinas.
Detectar una señal, sin embargo, no significa poder usarla. El lidar de consumidor genera imágenes con mucho ruido, sus láseres son de baja potencia —una restricción impuesta por razones de seguridad ocular— y su resolución es bastante limitada. A eso se suma que el movimiento de la cámara o de los propios objetos introducía borrosidad adicional en las capturas. El resultado era una señal casi inaprovechable.
«Hubo momentos en los que no sabíamos si sería posible obtener imágenes significativas», reconoce Siddharth Somasundaram, doctorando del MIT Media Lab que lideró el trabajo. La señal estaba ahí, pero aprovecharla era otra cuestión.
La clave: combinar múltiples imágenes en lugar de analizar una sola
La solución no llegó mejorando el hardware, sino replanteando cómo procesar sus datos. En lugar de analizar cada fotograma de forma individual, el equipo desarrolló algoritmos que combinan información procedente de múltiples capturas sucesivas.
La inspiración vino de dos fuentes distintas: las ráfagas de fotos que hacen los smartphones para mejorar la calidad de imagen al fusionar varios disparos, y el radar de apertura sintética utilizado en satélites, que combina señales de múltiples antenas para obtener una resolución equivalente a la de una antena mucho mayor. Al aplicar este enfoque al lidar de consumidor, las señales ocultas comenzaron a emerger con suficiente claridad, sin necesidad de calibración especializada.
Qué puede hacer el sistema hoy y qué no puede hacer aún
El sistema experimental utilizó un lidar portátil de unos 100 píxeles, cada uno formado por un emisor láser y un detector de fotón único. Con él, los investigadores lograron reconstruir imágenes tridimensionales de objetos estáticos ocultos, rastrear el movimiento 3D de objetos de forma conocida y usar esos objetos como puntos de referencia para localizar el propio sensor —algo útil para robots que operan en espacios sin texturas donde habitualmente pierden la orientación—.
Conviene, no obstante, no exagerar lo que el sistema hace. «No produce imágenes fotográficas completas de escenas ocultas», advierte Somasundaram. Lo que recupera es información geométrica dispersa a partir de señales muy débiles: suficiente para detectar presencia y movimiento, pero lejos de la nitidez de una imagen convencional. El sistema también asume que las formas y movimientos de los objetos se mantienen relativamente estables entre fotogramas, suposición que puede fallar con personas que cambian de postura o ante movimientos bruscos del sensor.
Aplicaciones potenciales y el camino por recorrer
Las posibilidades prácticas son concretas. En conducción autónoma, este tipo de sensor podría detectar peatones, ciclistas o vehículos antes de que entren en el campo de visión directo, mejorando la seguridad en intersecciones con visibilidad reducida. En robótica, permitiría navegar entornos parcialmente ocultos o desordenados con mayor eficacia.
Los investigadores han publicado el código de forma abierta. «Cuando estas tecnologías se vuelven accesibles, la gente suele descubrir aplicaciones mucho más allá de lo que los investigadores originales imaginaron», señala Somasundaram. Las próximas líneas de trabajo apuntan en dos direcciones: reducir las suposiciones del sistema mediante mejores modelos físicos y aprendizaje automático, y diseñar hardware lidar pensado específicamente para la visión no-línea-de-vista. Si el lidar de consumidor ya puede ver lo que hay a la vuelta de la esquina sin haber sido diseñado para ello, cabe preguntarse qué será capaz de hacer cuando sí lo esté.
