Conecta con nosotros

A Fondo

Machine Learning: cinco plataformas en las que entrenar tu próximo modelo

Publicado el

Mejorar la forma en la que las máquinas nos comprenden e interactúan con nosotros, descubrir nuevos tratamientos médicos o desarrollar algoritmos que permiten a las empresas tomar mejores decisiones de negocio. Estas son solo algunas de las posibilidades que actualmente están explotando los científicos de datos, empleando técnicas de machine learning

Para conseguirlo, entrenar modelos que «aprendan más rápido», que sean más fáciles de poner en marcha y que puedan escalar, los data scientist necesitan plataformas no solo que sean potentes a la hora de procesar enormes cantidades de datos «en bruto», sino que también les ofrezcan todas las características que necesitan para por ejemplo, no tener que preocuparse en exceso por el lenguaje de programación que están utilizando u ofrecer una experiencia integrada. Si examinamos el panorama de la oferta disponible en estos momentos, las que os proponemos a continuación se encuentran entre las más interesantes.

AWS SageMaker

A nadie le debería sorprender que la que es la mayor compañía de infraestructura como servicio (IaaS), sea además una de las organizaciones que más ha avanzado en el terreno del machine learning. AWS lidera con mucha distancia el terreno de la nube pública y en sus servidores almacena los datos de más empresas que nadie, por lo que tiene una casi infinita capacidad para entrenar todo tipo de modelos ML.

En ese espacio, su producto más destacado es AWS SageMaker, una suite compuesta por distintas herramientas de aprendizaje automático y que permite que los usuarios puedan gestionar una amplia variedad de aplicaciones. Entre sus herramientas más interesantes destacan las siguientes:

  • Ground Truth, una función de gestión de conjuntos de datos de entrenamiento
  • Autopilot, que construye y afina automáticamente los modelos de ML
  • Data Wrangler, que agiliza la limpieza y visualización de datos
  • Studio, donde los usuarios pueden examinar y gestionar sus modelos de ML
  • Feature Store, que permite a los usuarios cargar y compartir características de ML

Todo ello convierte a AWS SageMaker en una de las plataformas de Machine Learning más completas de la actualidad, estando orientada tanto a analistas de negocios, como a científicos de datos e ingenieros de MLOps.

IBM Watson Studio

Esa bestia de la inteligencia artificial que responde al nombre de IBM Watson es sin lugar a dudas, uno de los proyectos tecnológicos más interesantes puestos en marcha por la multinacional americana en las últimas décadas.

De ser poco más que una curiosidad capaz de vencer a cualquier ser humano en un concurso de televisión, ha demostrado tener un enorme potencial para revolucionar campos de investigación como el bioquímico o el médico, ha ayudado a las empresas a tomar mejores decisiones basadas en datos y está consiguiendo que empecemos a «hablar» con las máquinas de forma natural. En el campo del machine learning, IBM Watson Studio ayuda a los científico de todo el mundo a desarrollar sus modelos de aprendizaje automático.

Uno de los aspectos más destacados de esta suite de aplicaciones es su accesibilidad. En este sentido, destaca por funciones como AutoAI, que permite a las empresas crear y desplegar modelos de ML sin necesidad de emplear código, contando además con la posibilidad de desplegar el modelo con un solo clic. Esto permite que incluso las compañías que tienen menos experiencia en este campo, puedan empezar a sacar provecho de una de las tecnologías más punteras del momento.

Google Cloud Vertex IA

Si hay una empresa que ha sido capaz de sacar el máximo partido de los algoritmos de machine learning es Google. Productos como su Google Assistant son un pequeño prodigio que se integra en todo tipo de productos, desde smartphones a altavoces inteligentes, pasando por wearables y productos de terceros.

No es de extrañar por lo tanto, que los científicos de datos interesados a entrenar sus modelos consideren los productos de Google como una de sus primeras opciones. En este terreno, la compañía promociona Vertex AI, una plataforma en la que la multinacional unifica sus servicios de IA, machine learning, deep learning y servicios de TensorFlow como parte de la misma oferta.

El tener una solución tan integrada, permite que los usuarios puedan trabajar con soltura en cada una de las etapas del desarrollo de su modelo de machine learning. Además y al igual que IBM, Google ofrece a las empresas menos experimentadas en este terreno la posibilidad de trabajar con herramientas «point and clic» en las que desaparece la necesidad de introducir código.

Dataiku DSS

Aunque desde luego, multinacionales como AWS, Google o IBM son las más «accesibles» para los que se introducen por primera vez en el mundo del aprendizaje automático, esto no quiere decir que no tengan unos cuantos competidores: startups que utilizando a veces aproximaciones originales y diferentes, tienen mucho que ofrecer a los científicos de datos. Una de las más interesantes es Dataiku.

Fundada en 2019 y con clientes como Sephora, General Electric o Unilever, su producto estrellas es Dtaiku Data Science Studio (DSS), una plataforma que tiene como objetivo centralizar las operaciones de machine learning, de modo que el despliegue de los algoritmos sea mucho más rápido y eficaz.

Para ello, la compañía ofrece herramientas para la recopilación, preparación y visualización de los datos antes de la fase de entrenamiento inicial. Los cuadros de mando facilitan el desarrollo de nuevos modelos incluso a equipos de trabajo sin demasiada experiencia y cuenta con herramientas de colaboración interna que facilitan compartir el trabajo.

Una de las características más notables de Dataiku DSS es su escalabilidad. La plataforma puede escalar fácilmente desde equipos pequeños hasta grandes empresas, lo que ayuda a las compañías a ampliar sus operaciones de ML a medida que crecen.

Databricks

Otra startup que ha conseguido hacerse con un nombre en el mundo del Machine Learning es Databricks, una compañía que ofrece su software de ML sobre la infraestructura de los principales players de nube pública, como AWS o Azure.

Aunque Databricks no ofrece programación sin código, sí que tiene soporte para múltiples lenguajes de programación, lo que lo hace accesible a todo tipo de desarrolladores. Además ofrece APIs que permite combinar distintos Data Lakes y silos de datos en una plataforma unificada, lo que lo convierte en una alternativa muy flexible.

Periodista tecnológico con más de una década de experiencia en el sector. Editor de MuyComputerPro y coordinador de MuySeguridad, la publicación de seguridad informática de referencia.

Lo más leído