LLM vs. SLM: Los múltiples lenguajes de la IA Gen en el futuro de los negocios
Elegir entre un LLM y un SLM al trabajar con la IA generativa depende de las necesidades específicas que tenga cada empresa o industria para aplicarlos, indica GFT Technologies.
Las big techs y las empresas de diversos tamaños siguen firmes en la carrera por la mejor y más completa plataforma de inteligencia artificial (IA). Detrás de esta búsqueda se encuentran los grandes modelos de lenguaje (LLM), que son más que nunca estratégicos cuando se llevan al entorno empresarial. Hay diferencias importantes, pero algunas tendencias son más que claras.
Seguí algunos buenos debates y tuve conversaciones interesantes al respecto durante Febraban Tech 2024, el mayor evento de tecnología bancaria de América Latina, celebrado a fines del mes pasado en São Paulo (SP), Brasil. El uso de la IA generativa ha guiado gran parte de las discusiones entre ejecutivos y expertos en tecnología, y todavía hay mucho en el aire en torno a la elección de los mejores modelos funcionales.
Cuando hablamos de LLM, tenemos que recordar que, hace dos años, era más un tema teórico que práctico, bastante diferente al escenario actual de ebullición. El lanzamiento de ChatGPT en noviembre de 2022, considerado el gran hito en esta carrera de mil millones de dólares en torno a las plataformas de IA generativa, trató de reforzar el impacto que pueden tener en múltiples sectores, como las redes sociales y el periodismo profesional. En la misma línea, lo esencial que es formar esos motores con la mayor cantidad de datos posibles.
En el entorno bancario, existe una demanda latente de departamentos de TI que destaquen por su flexibilidad y permitan cambios en función de las estrategias del momento. No es que la eficiencia y el costo hayan perdido importancia: de hecho, estos dos elementos siguen siendo clave para una mejor entrega de ofertas y soluciones a los clientes, en un entorno desafiante para los desarrolladores.
Un buen marco de un entorno de LLM, abrazado por la IA generativa, permite multitud de tareas, desde la generación de contenidos en diversos formatos (texto, foto, video) y oportunidades de clasificación de grandes bases de datos, hasta la atención al cliente a través de chatbots que se acercan cada vez más a la interacción humana. La inspiración misma de un LLM es esta: es una red neuronal artificial, entrenada en conjuntos de datos masivos de texto y código, patrones de aprendizaje y reglas del lenguaje humano.
No es casualidad que hayamos visto que el mundo corporativo ya está mirando la posibilidad de no utilizar una sola plataforma LLM, sino múltiples LLM que interactúen entre sí, buscando así extraer lo mejor de cada uno. Hay una demanda de resultados cada vez más precisos y robustos, con procesos de validación cruzada, de mejora constante de la asertividad. En un entorno crítico como el financiero, estos aspectos son esenciales.
Sin embargo, al igual que con cualquier nueva tecnología que aún se está desarrollando, hay que reconocer que hay mucho trabajo por hacer. Los LLM siguen teniendo respuestas incorrectas o incoherentes, y pueden utilizarse con fines no positivos (los prejuicios, la desinformación y la falta de interpretabilidad son algunos de los factores que hay que ajustar). También están los aspectos de gasto y consumo, algo que da cabida a alternativas.
A diferencia de los LLM, los modelos pequeños de lenguaje (SLM, por su acrónimo en inglés) son menos complejos. También tienen miles o millones de parámetros, pero se entrenan en conjuntos de datos más pequeños, lo que los hace más rápidos y eficientes. Al centrarse en tareas más específicas, se vuelven más baratas, aunque más limitadas. Sin embargo, los usos sectorizados también pueden tener una ganancia significativa con los SLM.
Más allá de los bancos, el hecho concreto que tenemos es que la elección entre un LLM y un SLM depende de las necesidades específicas de aplicación de cada empresa o industria. Y la decisión sobre qué modelo seguir debe tener en cuenta factores como el tamaño del modelo, la capacidad deseada, el costo, la interpretabilidad y la generalización. Como consultor experimentado, veo que los LLM seguirán desempeñando un papel de liderazgo. ¿Hasta cuándo? No sabemos.
Lo que no cambia es la búsqueda de soluciones estratégicas y eficientes que se componen de proyectos sostenibles, inversiones tangibles y medición de la información de extremo a extremo. En este sentido, los debates en Febraban Tech 2024 indican que ya soplan buenos vientos para todos los actores involucrados, sin importar cuál sea su idioma preferido.
Alberto Rosati es CEO de GFT Technologies en México y LATAM SSC. Es un ejecutivo con más de 30 años de experiencia, conocedor del mercado de TI, software, consultoría, integración de sistemas, transformación digital y operación de negocios cognitivos. En los últimos 7 años, se ha dedicado a proyectos dirigidos a bancos, servicios financieros e industrias. Cuenta con amplia experiencia en Dirección, Evolución y Transformación de Empresas. Desempeñó funciones de liderazgo en empresas globales de consultoría de TI y como empresario. Es licenciado en Ingeniería por la Universidad Mackenzie de São Paulo, Brasil, y tiene un posgrado en Mercado de Capitales y Divisas por la Fundação Getúlio Vargas, además de especializaciones en Ciencias Políticas y Estrategia Global de Negocios.