
Weslley Rosalem, Líder de IA para Latinoamérica en Red Hat asegura que una empresa que necesita generar contenidos o automatizar prototipos visuales puede beneficiarse de modelos generativos. En cambio, una que busca predecir fallas o detectar fraudes podría obtener más valor con IA predictiva. La clave es recordar que la IA debe ser un medio al servicio de un objetivo, no un fin en sí mismo.
“Y si hablamos de IA generativa, hay que entender bien de qué se trata. Esta rama de la inteligencia artificial está diseñada para crear contenido nuevo a partir de grandes volúmenes de datos: desde textos y diseños hasta código y videos. Su potencial es enorme, sobre todo en áreas como marketing, atención al cliente, desarrollo de producto y creatividad asistida. Sin embargo, también requiere un enfoque estratégico: los modelos generativos pueden ser costosos, difíciles de explicar y demandan una buena gestión de riesgos”.
En los últimos años, los Large Language Models (LLM) como GPT-4 o Gemini han capturado la imaginación colectiva. Son potentes, versátiles y capaces de hacer de todo: escribir, programar, traducir, explicar. Pero también son caros, demandan mucha infraestructura y plantean desafíos de privacidad y control.
Por eso, los Small Language Models (SLM) están ganando terreno. Son una especie de versión “ultraliviana” que, sin tener la potencia de sus hermanos mayores, resuelve tareas específicas de forma más rápida, segura y con un costo menor. Hay que pensar en ellos como una caja de herramientas especializada: no tienen todo, pero lo que tienen, lo hacen bien. En muchos casos no es necesario un modelo que hable otros idiomas, como alemán, italiano o japonés. Allí es donde definir una estrategia clara al principio del camino, toma mayor relevancia. Un modelo más grande puede significar simplemente un mayor costo, sin realmente agregar más calidad o beneficios a su caso de uso comercial o desafío. Si una empresa, por ejemplo, solo necesita clasificar correos, automatizar respuestas internas o analizar formularios, un SLM entrenado con sus propios datos puede ser mucho más efectivo que un modelo enorme alojado en la nube.
Con la adquisición de Neural Magic, en Red Hat se enfocan en proporcionar recursos clave, tanto humanos como técnicos, para desarrollar modelos de inteligencia artificial optimizados y efectivos (ya sean LLM o SLM), con el beneficio adicional de poder ejecutarse en cualquier plataforma. El open source y su visión de «democratizar la IA» justamente apuntan a hacer estos modelos más accesibles y flexibles para diversas infraestructuras tecnológicas.