Introducción
El código abierto se ha convertido en uno de los temas más candentes de la IA, y la fanfarria es bien merecida. La comunidad de código abierto mantiene un ritmo ágil con el estado de la técnica, ofreciendo modelos cada vez mayores y más capaces que a menudo compiten de forma impresionante con sus homólogos comerciales. Es apasionante. Como investigadores que queremos que la IA haga el mayor bien posible, esto tiene muchas ventajas: la IA nunca ha sido tan accesible, tanto en términos de coste como de viabilidad técnica, y esperamos que esta tendencia continúe. Para las innumerables empresas que no están preparadas para crear modelos desde cero, pero que necesitan un nivel de control, privacidad y fiabilidad que las API de terceros no pueden ofrecer, el código abierto es una opción cada vez más atractiva.
Sin embargo, los modelos de código abierto no sustituyen a un socio técnico como Salesforce, que no sólo entienda de IA, sino de IA empresarial. Para empezar, los modelos de código abierto siguen siendo insuficientes para una amplia gama de problemas, incluidos aquellos que exigen una escala y un rendimiento de vanguardia o que dependen de una multimodalidad sofisticada (la combinación de datos en distintos medios, como texto e imágenes). Pero incluso cuando una opción de código abierto se adapta perfectamente a las necesidades de cada uno, hay una serie de razones por las que son sólo una pieza del rompecabezas. En el tipo de entorno de producción en el que operan nuestros clientes, los modelos son sólo el principio -incluso los más grandes y mejores- y se necesita mucho más para crear el tipo de herramienta fiable e integral que exigen esos entornos. Por eso, aunque estamos orgullosos de nuestra tecnología, ofrecemos mucho más que eso.
Cuatro retos para la IA de código abierto en la empresa
La realidad de la IA es compleja, y disponer de un modelo es sólo el principio de un proceso de integración que conecta la potencia de la IA con las personas, organizaciones y procesos que la necesitan. En Salesforce, ésta es una de nuestras misiones fundacionales como empresa. Durante décadas, hemos convertido la vanguardia de los datos, las aplicaciones, los servicios en la nube y la IA en productos y servicios orientados al cliente. De hecho, muchos de nuestros clientes no tienen ninguna experiencia particular en IA, a pesar de ser conscientes del papel esencial que ya está desempeñando en su mundo. Permitirles simplemente aprovechar su potencia a través de las mismas API e interfaces que utilizan para todo lo demás marca la diferencia.
Reto nº 1 de la IA empresarial: Confianza y seguridad
Creemos que cualquier conversación sobre IA debe empezar hablando de confianza y seguridad, y esto es especialmente importante cuando se consideran las opciones de código abierto. A pesar de todo su evidente poder, lo que es menos obvio es cómo se convierte exactamente la IA generativa en una tecnología tan fiable que las marcas más grandes del mundo puedan desplegarla de forma segura a escala global, un reto bastante difícil cuando se construye algo totalmente interno. Los contenidos sesgados, tóxicos o simplemente poco fiables son un lastre a cualquier escala, tanto si se trata de un modelo que crea una imagen novedosa con fines de marketing como de un LLM que compone un análisis textual de datos de clientes.
Al mismo tiempo, los derechos de autor se perfilan como uno de los mayores obstáculos para alcanzar el pleno potencial de la IA generativa, con una presión creciente en todo el mundo para garantizar que los modelos produzcan contenidos que no violen la propiedad de escritores, artistas y desarrolladores. Por supuesto, se trata de un objetivo meritorio por razones éticas. Pero para aplicaciones profesionales de todo tipo, desde pequeñas empresas a líderes mundiales, incluso una sola violación de los derechos de autor es demasiado. Esto por sí solo puede descalificar los modelos de código abierto preentrenados para muchas empresas, ya que una contabilidad completa de los datos de entrenamiento utilizados para llegar al producto final es poco práctica. Además, la influencia de los datos no deseados se ha dispersado a través de cientos de millones de pesos, es casi imposible de contrarrestar.
Esto es tan complejo como los desafíos, y exactamente lo que una organización de investigación como la nuestra enfrenta todos los días. Hemos invertido mucho, por ejemplo, en un conjunto de herramientas cada vez mayor para detectar y contrarrestar las violaciones de la propiedad de los contenidos, la parcialidad, la toxicidad y similares. Pero incluso nuestras capacidades como investigadores son sólo una pieza del rompecabezas. Otra son las décadas de experiencia práctica que nuestros clientes han compartido con nosotros desde nuestra fundación, lo que nos ha permitido no sólo hacer progresos mensurables en la seguridad de la IA en la teoría, sino también en la práctica específica del sector. En pocas palabras, dedicamos tanto tiempo a garantizar la seguridad de nuestros modelos como a construirlos.
Desafío nº 2 de la IA empresarial: Infraestructura
En concreto, la infraestructura es uno de los aspectos más desafiantes de cualquier despliegue de IA, y los datos presentan un reto particular en la empresa.
Seguridad y cumplimiento
Lo más urgente es que cualquier despliegue se construya sobre una base de seguridad que convierta la infraestructura en un recurso de confianza continua. Esto es un reto en sí mismo, por supuesto, pero la IA Generativa lo complica considerablemente. Aparte de su funcionalidad principal, cualquier modelo de IA generativa debe integrarse de forma fiable y eficaz con el régimen de seguridad y cumplimiento de una organización, respetando los controles de acceso y la privacidad de los datos tan rigurosamente como cualquier otro despliegue.
Personalización y calidad
A medida que aumentan nuestros estándares de personalización y calidad, las capacidades de IA generativa deben basarse en repositorios de datos armonizados. Imaginemos, por ejemplo, la automatización de campañas de marketing por correo electrónico; con un modelo de stock, los resultados serán probablemente insípidos e impersonales. Pero con un volumen suficiente de datos armonizados que lo guíen, ese mismo modelo puede encarnar la voz de su marca e incluso incorporar toques personalizados. Además, a medida que proliferen técnicas como la RAG (Retrieval Augmented Generation, que combina la potencia tradicional de las búsquedas en bases de datos con la flexibilidad humana de un LLM), la integración con bases de datos vectoriales también será esencial.
Pruebas A/B
Por último, los administradores necesitarán herramientas flexibles para realizar pruebas A/B de modelos competidores, especialmente a medida que aumente el número de opciones de código abierto y sus variaciones en cuanto a fiabilidad de rendimiento se vuelvan más importantes. Conviene recordar que, aunque a menudo se considere exótica y única, la IA es, al fin y al cabo, una herramienta como cualquier otra. La optimización de los resultados depende de la flexibilidad, la capacidad de elección y la capacidad de comparar opciones de forma rápida y clara.
Estos no son ni mucho menos problemas triviales -tanto en términos de sofisticación técnica como de coste- y resolverlos requiere una mezcla de experiencia en la IA y la empresa.
Reto nº 3 de la IA empresarial: el ajuste fino
El ajuste fino es otro obstáculo para que las empresas de todo el mundo aprovechen eficazmente la IA. Se trata del proceso mediante el cual un modelo estándar se optimiza para su uso en un sector, dominio o conjunto de problemas específicos y, aunque no recibe la atención de la prensa en temas tan llamativos como el hardware, los macrodatos y las últimas arquitecturas de modelos, a menudo marca la diferencia entre el éxito y el fracaso. La recompensa del ajuste fino es a menudo transformadora: al aprovechar adecuadamente las señales de retroalimentación de los usuarios, especialmente a escala empresarial, el rendimiento del modelo puede seguir creciendo significativamente. Con el tiempo, esto se traduce en una alineación cada vez mayor con la cultura, los valores y los diferenciadores de datos de una empresa: un modelo verdaderamente personalizado, que fija los diferenciadores y aprovecha su experiencia.
Pero estos beneficios no son tan fáciles de cosechar como cabría suponer. El ajuste fino es una habilidad en sí misma -algunos incluso podrían llamarla una especie de arte- y determinar las formas y cantidades precisas de datos necesarias para lograrlo, junto con la aplicación de tareas laboriosas como el etiquetado de datos, el ajuste de hiperparámetros y la interacción entre los distintos métodos de ajuste (LORA, Adaptor, ajuste fino completo del modelo o alguna mezcla de los anteriores) depende de expertos con intuiciones ganadas a pulso. Y lo que es peor, el potencial de un modelo bien ajustado se refleja en escollos como el ajuste excesivo del modelo y el olvido catastrófico. Saber cómo evitar estos resultados es igualmente vital.
Desafío nº 4 de la IA empresarial: identificación de problemas
También merece la pena señalar que simplemente determinar dónde y cómo se puede aplicar la IA -exactamente- es una habilidad tan importante como cualquier otra. Adecuar un despliegue de IA a un problema del mundo real no sólo es una de las decisiones más importantes que puede tomar una organización, sino también la más inesperadamente compleja. Por ejemplo, ¿puede un modelo determinado ayudar de forma fiable a los usuarios de la empresa a mantenerse al día con la sobrecarga de información resumiendo un canal de enjambre en Slack? ¿Y la generación de segmentos, incluida la producción de contenidos personalizados para un equipo de marketing? Estas son sólo dos de las innumerables aplicaciones que estamos viendo que adoptan cada vez más de nuestros clientes, muchos de los cuales no se dieron cuenta de que eran posibles hasta que se les mostraron.
Pero la decisión de desplegar IA generativa en la empresa -incluso para un problema perfectamente adecuado y claramente definido- es sólo la primera de las innumerables decisiones en el camino hacia un despliegue exitoso. Fundamentalmente, ¿cómo debe organizarse y asignarse exactamente la infraestructura? Después de todo, la naturaleza accesible de los modelos de código abierto no niega su necesidad de un hardware significativo, ya que incluso los modelos de tamaño modesto requieren una potencia de cálculo sustancial, soluciones de almacenamiento robustas y conectividad de alta velocidad. Además, hay que explorar una amplia gama de modelos candidatos, que varían tanto en tamaño como en arquitectura, así como el papel del ajuste fino para optimizar el rendimiento del modelo en función de las necesidades específicas de sus usuarios. Ya sea directa o indirectamente, todas estas cuestiones influirán a la hora de determinar el coste total final del despliegue. Los modelos grandes pueden ofrecer un rendimiento transformador, pero conllevan unos costes de infraestructura elevados, a menudo prohibitivos. Por el contrario, los modelos pequeños suelen ser bastante más asequibles y pueden aproximarse al rendimiento de sus homólogos de mayor tamaño cuando se aplican de forma inteligente a tareas más específicas, e incluso superarlos en algunos casos aprovechando conjuntos de entrenamiento óptimamente enfocados. Pero llegar hasta ahí puede ser un reto técnico mucho mayor. E incluso esto no es más que arañar la superficie. ¿Qué arquitecturas son las mejores para una aplicación y una estrategia de optimización determinadas? ¿Qué ocurre con técnicas avanzadas como la GAR? Son preguntas esenciales, pero -una vez más- responderlas requiere un nivel de conocimientos que un modelo de código abierto no puede proporcionar por sí solo. En otras palabras, saber cómo aplicar la IA es tan esencial como saber dónde aplicarla.
Las aplicaciones de la IA generativa son casi ilimitadas, por supuesto, desde aumentar el servicio al cliente (a menudo hasta un punto transformador) hasta acelerar los equipos de soporte interno y ayudar a los desarrolladores a trabajar más rápido. Pero también lo son las consideraciones de despliegue que hay que tener en cuenta para que todo funcione en la práctica. Como empresa con años de experiencia en la vanguardia de este campo, trabajamos constantemente para ayudar a nuestros clientes a identificar exactamente dónde la IA puede marcar la diferencia más tangible para sus organizaciones y sus usuarios finales, y sólo vemos crecer esta demanda.
Una pregunta aún más grande: Cuando los modelos de código abierto no se aplican
Por último, está el reto más fundamental para el código abierto, y es que estos modelos representan generalmente un subconjunto de lo que es posible con la IA generativa, en lugar de su totalidad. Incluso los mejores ejemplos tienden a ir a la zaga del estado del arte por márgenes pequeños pero significativos (márgenes que pueden significarlo todo a escala empresarial) y se centran en los casos de uso más comunes. Para las empresas que no pueden aceptar un rendimiento inferior a la vanguardia o que simplemente se enfrentan a un reto único, no hay forma de evitar la carga de crear un modelo realmente a medida, desde cero, con un control total de cada paso del proceso, desde la formación hasta el ajuste y la implementación, ya sea internamente o asociándose con un equipo que pueda hacerlo, como Salesforce. Para empresas como éstas, el código abierto es sencillamente inviable.
Conclusión
La IA de código abierto apunta a un futuro asombroso, que todos esperamos con impaciencia. De hecho, el código abierto constituye una gran parte de nuestra propia estrategia. Pero para aprovechar todo el poder de la IA, incluida la capacidad innegociable de confiar en ella, creemos que es necesario el trabajo de una organización como Salesforce, con nuestros recursos, experiencia y reputación. Por eso, por muy potente que sea esta tecnología por sí sola, siempre será la experiencia construida a su alrededor, de tú a tú, la que ofrezca realmente el tipo de valor en el que las empresas pueden confiar.
Un agradecimiento especial a Alex Michael por su contribución a la redacción de este artículo.