El Dr. Ajay Dholakia, Principal Engineer en el Lenovo Data Center Group ha publicado un artículo (en inglés) sobre la situación actual de la Inteligencia Artificial en las empresas y los retos que plantea. En él da un repaso a todos los elementos del ecosistema de la IA y hace una curiosa analogía entre los datos y los alimentos.
Menciona que la comparación mas habitual se produce entre los datos y el petróleo, pero cree que es más acertado compararlo con los alimentos. Los datos son el alimento que necesitamos hoy para sobrevivir y crecer. Además, al contrario que el petróleo, los alimentos son un recurso natural que se puede cultivar o hacer crecer de modo organizado.
Este camino de la granja a la mesa implica el crecimiento y recogida de comida, el procesamiento y preparación de los alimentos, la transformación de los mismos mediante recetas y, finalmente, su presentación en forma de apetitosa comida. Por lo que argumenta el Dr. Dholakia, todo este proceso guarda grandes similitudes con lo que requiere el tratamiento de los datos para hacer un buen aprovechamiento de los mismos en las empresas.
Desde el origen
El profesor recalca que los datos tienen raíces y gravedad. Los datos tienden a estar allí donde se han creado y atraen el crecimiento de datos similares en su cercanía. Esto hace que las empresas se planteen extraer todo el valor posible de los datos que ya tienen y que seguirán generando allí mismo. Todo esto lleva a disponer de unas capacidades de cómputo suficientes para extraer el valor de sus datos dentro de la misma compañía. Siguiendo su analogía aquí hablaríamos de la adquisición y cultivo de alimentos locales.
La primera fase sería la recogida de datos en bruto, que requiere la ingesta, transformación y almacenamiento de la información. Los datos estructurados irían a bases de datos y data warehouses, los datos sin estructurar se guardarían en clústeres Hadoop y los datos semi-estructurados en combinaciones de los dos anteriores.
Tratamiento de los alimentos (datos)
El siguiente paso consiste en la extracción y preparación de conjuntos de datos específicos que luego se pueden usar para entrenar los modelos de Machine Learning y Deep Learning. El homólogo en la alimentación sería la fase de lavado, limpieza y corte de los alimentos en bruto así como su clasificación en grupos de cara a ser usados en las distintas recetas.
Más tarde llega el turno del entrenamiento y la evaluación de los modelos implica una gran labor por parte de los científicos de datos (que también participan en la fase anterior) para llegar a modelos (recetas) adecuados.
A continuación pasaríamos a la fase de inferencia, en la que se incorporaría el modelo en la aplicación que lo va a emplear para obtener mejores conclusiones a partir de los datos. En esta etapa el Dr. Ajay Dholakia recalca que «al igual que aprendimos con Cloud Computing y Big Data, debemos evitar hacer proyectos experimentales aislados. Casi tres cuartas partes de estos proyectos fracasaron. La empresa debe experimentar un profundo cambio en la forma en la que opera».
Aconseja elegir una función de negocio como objetivo para la adopción de la IA, que sería como elegir el tipo de cocina a desarrollar. Luego se lanzaría un programa piloto, se le enviarían datos y se explorarían modelos de Machine Learning y Deep Learning mediante entrenamiento y benchmarking. Esto sería como elegir las recetas y los menús.
Entonces se seleccionarían los modelos mejores entrenados y se incorporarían a la aplicación objetivo. A partir de este momento se obtendrían todas las ventajas de este proceso y habría que trabajar con un sistema de refinamiento progresivo para mantener el modelo totalmente actualizado.A posteriori se llevarían estos aprendizajes a otras funciones de negocio de la organización.
Una analogía de extremo a extremo
El desarrollo de modelos de Machine Learning y Deep Learning se asemeja a la preparación de estos alimentos mediante recetas de cocina, y la puesta en producción de estos modelos una vez entrenados sería equivalente al emplatado y el momento de servir los platos preparados.
Para el recién llegado el proceso de desarrollo de recetas y cocinado puede parecer prácticamente magia, pero para los que ya tienen cierta experiencia o, como dice el Dr. Dholakia «a los que se beneficien del conocimiento de Lenovo en estas áreas» el proceso puede ser muy, pero que muy positivo.