José Manuel Molina López (UC3M)

Miembro de la Comisión de Inteligencia Artificial y Big Data, AMETIC
Research

Introducción

La Inteligencia Artificial está viviendo un enorme impulso en todas las áreas, y la investigación es una de ellas. En esta área de publicación vamos a reflejar los últimos desarrollos teóricos en las diversas líneas de investigación abiertas, desde los algoritmos de Machine Learning a los mecanismos de coordinación entre agentes inteligentes, pasando por las diferentes técnicas de aprendizaje y razonamiento que se vayan publicando, así como las aplicaciones reales de estas técnicas y su efecto sobre la sociedad. El número de investigadores en Inteligencia Artificial ha crecido exponencialmente en los últimos años, y muchas áreas se han visto en la necesidad de dar respuesta, desde la investigación, a problemas nuevos creados por los desarrollos de inteligencia artificial. Esta área de publicación pretende abrirse también a estos trabajos de investigación y el efecto que en algunos casos pueden tener sobre los futuros desarrollos de la IA. Muy habitualmente en este tipo de publicaciones se presentan trabajos que se han publicado y se intenta acercar al lector a esos nuevos desarrollos, no desde un punto de vista científico sino divulgativo. La idea de esta sección va un poco más allá y pretendemos presentar trabajos nuevos y que sean los propios desarrolladores los que describen su trabajo y su importancia en el área de investigación correspondiente.

Retos 

Los retos principales a los que se enfrentan los investigadores en Inteligencia Artificial se centran fundamentalmente en cómo aprender de los ejemplos y cómo contextualizar ese conocimiento aprendido de manera que los sistemas sean capaces de tener un comportamiento cada vez más parecido a lo que un ser humano espera como respuesta “inteligente”.

Por supuesto el reto más importante de todos los desarrollos de IA es, precisamente, conseguir esa “inteligencia” en los sistemas automáticos y que esta “inteligencia” permita confundir a las personas que usan los sistemas y hacerles sentir que el sistema les “entiende”.

La cantidad de información que son capaces de procesar los sistemas hoy en día ha puesto el reto de las técnicas en ser capaces de construir esa “inteligencia” de forma autónoma al desarrollador, de ahí los retos que se marcan los investigadores en ML, ser capaces de aprender y de transferir lo aprendido entre diferentes sistemas.

Las limitaciones para poder “adaptar” ese conocimiento aprendido a diferentes entornos se debe a que en muchas situaciones el conocimiento aprendido es muy básico (identificar un objeto, identificar un movimiento, extraer una emoción, etc..) y es necesario un marco de razonamiento mayor que permita “humanizar” dichas decisiones, es decir “adaptarlas” al contexto. Esa adaptación se lleva a cabo con sistemas de razonamiento más simbólicos, donde se representa la información de modo semántico y se llevan a cabo razonamientos en función de la información que lo rodea.

Tendencias

En los últimos años la tendencia central de la investigación en IA ha sido el aprendizaje, y dentro de esa línea de trabajo se han desarrollado nuevas técnicas de aprendizaje, siendo el Deep Learning la que sin duda se ha llevado un esfuerzo mayor de investigación a la vista de los prometedores resultados obtenidos con sus diferentes enfoques. Al mismo tiempo se ha trabajado mucho en temas relacionados con los datos almacenados: cómo procesarlos, cómo extraer los significativos, cómo identificar los outliers, cómo validar los sistemas aprendidos, etc…

En paralelo con la investigación centrada en datos y cómo extraer conocimiento de los datos, se han ido desarrollado nuevas investigaciones en campos relacionados con la capacidad de interpretar y entender los resultados de las técnicas de ML. Esta área ha ido cobrando mucha importancia debida a la regulación de muchas administraciones y la necesidad de “entender” cómo se toman las decisiones y explicárselas a los afectados.

Además, en los últimos tiempos, se está observando un crecimiento de las técnicas de IA más centradas en el simbolismo, la lógica, etc. que permiten introducir sistemas que razonan y que permiten utilizar la información del contexto para la toma de decisiones. Este tipo de sistemas son necesarios para introducir la IA en desarrollos reales: sistemas de recomendación, de IoT, de vigilancia, etc.

Ejemplos

A lo largo de 2020 los artículos premiados en las conferencias más importantes de IA y ML marcan los retos y tendencias del pasado 2020:

  • AAAI 2020 Outstanding Paper Award, “WinoGrande: An Adversarial Winograd Schema Challenge at Scale”, por Keisuke Sakaguchi, Ronan Le Bras, Chandra Bhagavatula, Yejin Choi de Allen Institute for Artificial Intelligence, University of Washington. link
  • CVPR 2020 Best Paper Award, “Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild” por Authors: Shangzhe Wu, Christian Rupprecht, Andrea Vedaldi de University of Oxford. link
  • ACL 2020 Best Overall Paper, “Beyond Accuracy: Behavioral Testing of NLP Models with CheckList” por Marco Tulio Ribeiro, Tongshuang Wu, Carlos Guestrin, Sameer Singh de Microsoft Research, University of Washington, University of California-Irvine. Link
  • ICML 2020 Outstanding Paper Awards, (1) “Efficiently Sampling Functions From Gaussian Process Posteriors” por James Wilson, Slava Borovitskiy, Alexander Terenin, Peter Mostowsky, Marc Deisenroth de Imperial College London, St. Petersburg State University, St. Petersburg Department of Steklov Mathematical Institute of Russian Academy of Sciences, University College London, y (2) “Generative Pretraining from Pixels” por Mark Chen, Alec Radford, Rewon Child, Jeffrey K Wu, Heewoo Jun, David Luan, Ilya Sutskever de OpenAI. Link
  • ECCV 2020 Best Paper Award, “Recurrent All-Pairs Field Transforms for Optical Flow” por Zachary Teed, Jia Deng de Princeton University.  link
  • CoRL 2020 Best Paper Award, “Learning Latent Representations to Influence Multi-Agent Interaction” por Annie Xie, Dylan P. Losey, Ryan Tolsma, Chelsea Finn, Dorsa Sadigh de Stanford University, Virginia Tech. Link
  • NeurIPS Outstanding Paper Awards,
    1. Language Models are Few-Shot Learners” por Tom Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplan, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, Sandhini Agarwal, Ariel Herbert-Voss, Gretchen Krueger, Tom Henighan, Rewon Child, Aditya Ramesh, Daniel M. Ziegler, Jeffrey Wu, Clemens Winter, Christopher Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever, Dario Amodei de OpenAI, link.
    2. No-Regret Learning Dynamics for Extensive-Form Correlated Equilibrium” por Andrea Celli, Alberto Marchesi, Gabriele Farina and Nicola Gatti de Politecnico di Milano y Carnegie Mellon University,  link 
    3. Improved Guarantees and a Multiple-Descent Curve for Column Subset Selection and the Nystrom Method” por Michał Dereziński, Rajiv Khanna, Michael W. Mahoney de University of California, link

Sin duda como primera aproximación estos son los ejemplos más directos de los retos y tendencias que ha seguido la IA durante el año pasado. Si observamos los premiados vemos que la tendencia está muy centrada en Machine Learning pero con cada vez más introducción de problemas, representaciones, etc. que permiten dotar a las técnicas de ML de algo más que la mera capacidad para aprender mediante fuerza bruta.

Probablemente esta hibridación será una constante en los años futuros, así como el campo de aplicación, que en los artículos se centra en temas de lenguaje natural y de procesamiento de imágenes, se ampliará a nuevos campos de aplicación donde la recolección de datos alcance magnitudes parecidas.

Conclusión 

La idea central que mueve esta sección es presentar los últimos trabajos en las diversas áreas de la IA, que abarcan no sólo el omnipresente ML y todas las derivaciones de las técnicas y problemas que se están abordando, sino también los sistemas de IA que permiten hacer uso del conocimiento extraído en entornos complejos haciendo uso del contexto y del razonamiento sobre el mismo. Además, no vamos a centrarnos únicamente en la discusión o presentación de técnicas o aplicaciones publicadas sino que vamos a intentar interaccionar con los investigadores para que nos presenten sus últimos avances de manera más personal.

La divulgación de los últimos avances científicos y de las últimas aplicaciones en el mundo real deben servir a los lectores para entender mejor las capacidades y los límites de estas técnicas, así como poder ver las posibles aplicaciones de las mismas en el dominio de trabajo del lector.