El desarrollo de los vehículos autónomos requiere de costoso trabajo manual realizado por humanos.
Por Tim Bradshaw*
Los coches sin conductor parecen una idea mágica. El concepto de vehículos que pueden conducirse por sí solos, sin volantes ni pedales, sale directamente de las páginas de la ciencia ficción.
Pero al igual que tantas historias fantásticas, hay «magos» escondidos tras las cortinas; muchos de ellos. Resulta que la construcción del camino hacia la conducción totalmente automatizada requiere una gran cantidad de trabajo manual.
La mayoría de las compañías que trabajan en esta tecnología emplean a cientos o incluso miles de personas, muchas de ellas en centros externalizados en India o China, cuyo trabajo es enseñar a los coches-robots a reconocer a los peatones, ciclistas y otros obstáculos. Los trabajadores hacen esto manualmente, marcando o «etiquetando» miles de horas de metraje de vídeo, a menudo fotograma a fotograma, tomados de vehículos prototipo que conducen alrededor de bancos de prueba como Silicon Valley, Pittsburgh y Phoenix.
«El aprendizaje automático es un mito, todo funciona como El Mago de Oz», afirma Jeremy Conrad, un inversionista de Lemnos Labs en San Francisco. «Los equipos de etiquetado son increíblemente importantes en cada compañía, y tendrán que estar presentes por algún tiempo, porque el entorno exterior es muy dinámico».
Los grandes avances en el campo de la inteligencia artificial, la calidad de los sensores y la potencia informática han sentado las bases tecnológicas de la revolución de los coches sin conductor. Sin embargo, a pesar de estas innovaciones, los seres humanos seguirán siendo necesarios detrás de las escenas durante muchos años, dibujando cuadros alrededor de los árboles y resaltando las señales de las calles, con el fin de mantener estos sistemas actualizados.
«Los profesionales de la inteligencia artificial (IA), en mi opinión, tienen colectivamente un punto ciego arrogante, piensan que las computadoras lo resolverán todo», dice Matt Bencke, fundador y jefe ejecutivo de Mighty AI, que aprovecha una comunidad de trabajadores a tiempo parcial para filtrar y etiquetar datos de entrenamiento para las compañías tecnológicas.
El mismo problema le ocurre a cualquier sistema de inteligencia artificial: las computadoras «aprenden» al procesar grandes cantidades de información etiquetada manualmente y usan ese «modelo» para reconocer patrones y objetos cuando los vuelven a ver.
El desafío en la capacitación de los coches sin conductor es mayor que en la de otras aplicaciones de IA dada la amplia variedad de escenarios y situaciones en las que los vehículos pueden encontrarse. Incluso después de hacer los ajustes necesarios para adaptarse a los cambios de iluminación y las condiciones climáticas en diferentes momentos del día y del año, el entorno urbano puede cambiar de la noche a la mañana, debido a construcciones, eventos especiales o accidentes.
«El proceso de anotación es típicamente un costo oculto del que la gente no habla», dice Sameep Tandon, director ejecutivo de la empresa «startup» de conducción autónoma Drive.ai. «Es muy doloroso y complicado».
El nivel de exactitud que se les exige a los coches autónomos también es mayor que el de otros sistemas de IA. Los coches se guían comparando los alrededores que ven con sus cámaras y sensores con un detallado mapa en 3D integrado de las calles que los rodean. La seguridad es primordial: si el sistema de reconocimiento facial de Google Photos identifica incorrectamente a una persona en una foto, es sólo un inconveniente; si un vehículo de Waymo no detecta a un peatón, el resultado podría ser fatal.
En la carrera por crear coches sin conductor, uno de los criterios para evaluar el progreso es el número de millas que han circulado los vehículos de una compañía. Waymo, propiedad de Alphabet, dijo en mayo que sus automóviles sin conductor han recorrido 3 millones de millas en carreteras públicas, mientras que Tesla dijo el año pasado que había reunido datos de más de 100 millones de millas recorridas por los propietarios de los vehículos existentes para ayudar a desarrollar su sistema Autopilot.
Sin embargo, más millas significa más trabajo manual para los pequeños ejércitos de procesadores de datos en las trastiendas de estas compañías. Conducir sólo unas pocas millas puede crear decenas de gigabytes de datos, que se convierten rápidamente en un volumen demasiado grande como para ser cargado de forma inalámbrica desde el coche. En lugar de ello, deben ser guardados en un disco duro y enviados a un centro externalizado. Para una industria tan vanguardista, esta logística analógica parece arcaica.
Cada hora de conducción puede tomar cientos de horas para convertirse en información útil, dice David Liu, jefe ejecutivo de Plus.ai, otra empresa «startup» de Silicon Valley que desarrolla sistemas de conducción autónoma. «Necesitamos cientos de miles, tal vez millones de horas de datos» para que los coches sin conductor vayan a todas partes, dice, lo cual requiere «cientos de miles de personas para lograrlo» en todo el mundo.
Las grandes compañías tecnológicas prefieren no dar a conocer el aspecto manual de la conducción autónoma. Waymo, Uber y Tesla declinaron hacer comentarios para este artículo.
«Es muy difícil conseguir que la gente hable de esto», dice Dan Weld, profesor de ciencias de la computación e ingeniería en la Universidad de Washington en Seattle. «A todos les gusta decir que es la ‘magia’ del aprendizaje automático».
En un raro reconocimiento público, durante una charla en la Universidad de California, Berkeley, en 2013, el ex ingeniero de Waymo y Uber Anthony Levandowski describió un equipo de Google en India compuesto por lo que él llamó «robots humanos», quienes etiquetaban las imágenes de su servicio Street View.
Un proceso tan laborioso no es barato. Los estimados de la industria calculan que el costo de crear y mantener estos mapas para cada ciudad de EEUU será de miles de millones de dólares al año.
Varias empresas «startup» ven oportunidades en esto. Compañías como Plus.ai, Deepmap y Drive.ai dicen que pueden utilizar el «aprendizaje profundo» para reducir esta aportación humana, manteniendo la precisión necesaria para que los vehículos autónomos funcionen de forma segura. El aprendizaje profundo es un nuevo y más avanzado tipo de aprendizaje automático que intenta emular el funcionamiento analítico del cerebro humano.
«Con el aprendizaje automático, es muy difícil conseguir más de un 90 ó 95 por ciento de exactitud y precisión, pero con el aprendizaje profundo es mucho más fácil construir un modelo como ése», dice James Wu, director ejecutivo de Deepmap, que recaudó US$25 millones en mayo.
Sin embargo, otros en la industria se muestran escépticos de que el aprendizaje profundo eliminará completamente la necesidad de personas. El Sr. Bencke de Mighty.ai señala los retos que Facebook, YouTube y Twitter han enfrentado para combatir los abusos, desde la intimidación hasta el terrorismo, en sus plataformas sociales. «Si el aprendizaje profundo fuera tan competente, ¿no crees que ya habrían resuelto ese problema por ahora?», dice. «Eso es mucho menos complicado que los vehículos autónomos, y es un gran mercado».
Los investigadores de la IA a través del mundo están persiguiendo esta meta del «aprendizaje no supervisado», cuando las máquinas puedan aprender por sí mismas sin ayuda. En el ínterin, los empresarios de Silicon Valley y Detroit tienen la esperanza de que sus clientes e inversionistas continúen sin prestarles atención a todos los «magos» detrás de las cortinas.