Este blog detalla el proceso detrás del primer Red Teaming Hackathon de IA de Salesforce para crear seguridad en nuestra familia xGen de modelos de IA.
Categoría: Discover Magazine
World’s #1 CRM introduce su primer LLM de ventas
Los representantes de ventas están en constante movimiento, pasando de un sitio de cliente a otro, con reuniones programadas de forma consecutiva. Las exigencias de gestionar un pipeline complejo y la necesidad de cambiar de contexto pueden ser abrumadoras. Por no mencionar que los representantes de ventas pueden
Introducción
Imagina que estás trabajando en un producto de IA que puede resumir las llamadas telefónicas de éxito de los clientes con fines de formación. El producto de su empresa utiliza grandes modelos lingüísticos (LLM) para resumir, sintetizar, clasificar y generar resultados relevantes. Es consciente de que los LLM pueden alucinar, generar resultados perjudiciales o sesgados
TLDR; Salesforce acaba de lanzar Generative Lightning Canvas (Piloto) en AppExchange, lo que permite a los usuarios visualizar e interactuar fácilmente con sus datos empresariales y flujos de trabajo de una forma completamente nueva.
A medida que se acelera el desarrollo y despliegue de grandes modelos lingüísticos (LLMs), la evaluación de los resultados de los modelos se ha vuelto cada vez más importante. El método establecido para evaluar las respuestas normalmente implica reclutar y entrenar a evaluadores humanos, hacer que evalúen las respuestas del modelo y luego auditar la calidad de las evaluaciones. Por desgracia, este proceso no
Hemos introducido xLAM, nuestra familia de modelos internos de grandes acciones, diseñados para la llamada a funciones, el razonamiento y la planificación. Estos modelos están diseñados para agilizar y simplificar la integración de la IA en sus flujos de trabajo, reduciendo la complejidad a menudo asociada con los LLM.
Huan Wang, Shelby Heinecke, Juan Carlos Niebles, Caiming Xiong
![image.png](https://blog.salesforceairesearch.com/content/images/2024/08/data-src-image-e8813fca-1109-4843-9b82-1a18facec161.png)
TL;DR: Lanzamos xLAM, una serie de LLMs optimizados para la llamada a funciones y Agentes AI. Ofrece varias variantes diseñadas para servir a diferentes dominios de aplicación, desde el uso móvil hasta contextos de rendimiento de alta demanda. Muestran un rendimiento competitivo en varios agentes clave
Salesforce AI Research y Tableau AI colaboraron para crear la función de resumen de información Pulse, GA para todos los clientes de Tableau Cloud a partir de principios de 2024.
Salesforce premia con miles de euros a un empleado por revelar debilidades clave de un producto en "Bug Bounty."
Con la coautoría de Hannah Cha, Orlando Lugo y Sarah Tan
En Salesforce, nuestro equipo responsable de IA y tecnología emplea prácticas de red teaming para mejorar la seguridad de nuestros productos de IA mediante pruebas de uso malintencionado, intencionado
Inteligencia y Inteligencia
La Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) no sólo ha ganado fuerza como una de las áreas de investigación con mayor inversión en IA generativa, sino que también ha reunido una considerable popularidad y oportunidades de comercialización. La RAG se aplica normalmente a problemas de respuesta de preguntas, en los que se proporciona cierta información contextual externa recuperada de una fuente de datos (potencialmente privada)
La Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) no sólo ha ganado fuerza como una de las áreas de investigación con mayor inversión en IA generativa, sino que también ha reunido una considerable popularidad y oportunidades de comercialización. La RAG se aplica normalmente a problemas de respuesta de preguntas, en los que se proporciona cierta información contextual externa recuperada de una fuente de datos (potencialmente privada)
Como parte de nuestro compromiso con la innovación en GAR empresarial e IA de confianza, nos complace lanzar SFR LlamaRank, un reranker de última generación de Salesforce AI Research. LlamaRank es un modelo lingüístico especializado en la clasificación por relevancia de documentos. LlamaRank consigue un rendimiento al menos comparable al de las API líderes en documentos generales
En pocas palabras, los asistentes de IA están diseñados para ser personalizados, mientras que los agentes de IA están diseñados para ser compartidos (y ampliados), y ambas técnicas prometen oportunidades extraordinarias en toda la empresa.
Estamos muy contentos de abrir el código 🍃MINT-1T, el primer conjunto de datos intercalados multimodales de un billón de tokens y un valioso recurso para que la comunidad estudie y construya grandes modelos multimodales.
TL;DR: Presentamos INDICT, un novedoso marco que dota a los Grandes Modelos de Lenguaje (LLMs) de Diálogos Internos de Críticas para la orientación tanto en seguridad como en utilidad. El diálogo interno es un sistema cooperativo dual entre un crítico orientado a la seguridad y un crítico orientado a la utilidad, cada uno equipado con conocimientos relevantes de herramientas externas.
LLMs
Creación del primer punto de referencia LLM del mundo para CRM
HIVE ha sido aceptado en CVPR 2024.
Otros autores son: Chia-Chih Chen, Ning Yu, Zeyuan Chen, Huan Wang, Silvio Savarese, Stefano Ermon, Caiming Xiong
Hemos visto el éxito de ChatGPT, que incorpora feedback humano para alinear el texto generado por grandes modelos lingüísticos con las preferencias humanas. ¿Es posible alinear
¿Cómo puede un ordenador discernir el significado de una frase? Por «discernir su significado» me refiero a comprender las palabras de la frase, su contexto, sus matices y sus relaciones con otras palabras.
Para celebrar el Mes de la Historia de la Mujer, la Red de Mujeres de Salesforce organizó su evento inaugural del Día de la Mujer en la IA el 26 de marzo de 2024 en la Torre Salesforce de San Francisco. El evento fue una reunión de mujeres de Salesforce que lideran el trabajo sobre IA ética y responsable en Salesforce.
Aunque en los últimos años hemos visto mejoras asombrosas en el rendimiento de los modelos, debemos ser conscientes de los inconvenientes que aún presentan. Creemos que la mejora conjunta de estos modelos, así como la evolución de nuestros enfoques para evaluarlos, es esencial de cara al futuro.
TL;DR: Moirai es un modelo fundacional de series temporales de vanguardia, que ofrece capacidades de previsión universales. Destaca como un modelo versátil de previsión de series temporales capaz de abordar diversas tareas de previsión a través de múltiples dominios, frecuencias y variables de una manera zero-shot. Para lograrlo, Moirai aborda cuatro grandes retos: (i)
Estamos encantados de anunciar la integración de la concordancia difusa en todas las funciones del objeto de contacto, proporcionando a los clientes las soluciones a medida que necesitan.
El SFR-Embedding-Mistral supone un avance significativo en los modelos de incrustación de textos y se basa en los sólidos cimientos de E5-mistral-7b-instruct y Mistral-7B-v0.1.
Presentamos una arquitectura novedosa, BootPIG, que permite la generación de imágenes personalizadas sin necesidad de ajuste fino en tiempo de prueba.