Aunque en los últimos años hemos visto mejoras asombrosas en el rendimiento de los modelos, debemos ser conscientes de los inconvenientes que aún presentan. Creemos que la mejora conjunta de estos modelos, así como la evolución de nuestros enfoques para evaluarlos, es esencial de cara al futuro.
Categoría: Inteligencia Artificial
TL;DR: Moirai es un modelo fundacional de series temporales de vanguardia, que ofrece capacidades de previsión universales. Destaca como un modelo versátil de previsión de series temporales capaz de abordar diversas tareas de previsión a través de múltiples dominios, frecuencias y variables de una manera zero-shot. Para lograrlo, Moirai aborda cuatro grandes retos: (i)
Estamos encantados de anunciar la integración de la concordancia difusa en todas las funciones del objeto de contacto, proporcionando a los clientes las soluciones a medida que necesitan.
El SFR-Embedding-Mistral supone un avance significativo en los modelos de incrustación de textos y se basa en los sólidos cimientos de E5-mistral-7b-instruct y Mistral-7B-v0.1.
Presentamos una arquitectura novedosa, BootPIG, que permite la generación de imágenes personalizadas sin necesidad de ajuste fino en tiempo de prueba.
TLDR
El aprendizaje a partir de preferencias humanas, concretamente el Aprendizaje por Refuerzo a partir de la Retroalimentación Humana (RLHF) ha sido un componente reciente clave en el desarrollo de grandes modelos lingüísticos como ChatGPT o Llama2. Hasta hace poco, el impacto del entrenamiento a partir de la retroalimentación humana en los modelos texto-imagen era mucho más limitado. En este trabajo, Diffusion-DPO,
TLDR
Entrenamos una serie de LLMs 7B llamados XGen-7B con atención densa estándar hasta 8K de longitud de secuencia para hasta 1.5T tokens. También afinamos los modelos en datos de instrucción de dominio público. Los principales resultados son:
- En pruebas de PNL estándar, XGen consigue resultados comparables o mejores
Contribución equitativa entre Erik Nijkamp y Hiroaki Hayashi.
Paper
Code
Tweet
Abstract
La familia de modelos CodeGen de Salesforce crece con CodeGen2.5 – ¡un modelo pequeño, pero poderoso! Mientras que ha habido una tendencia reciente de grandes modelos de lenguaje (LLM) de tamaño cada vez mayor, mostramos que un modelo pequeño
CodeGen2.5 – pequeño pero poderoso
TL;DR:PyRCA es una biblioteca de aprendizaje automático de código abierto diseñada específicamente para realizar análisis de causa raíz (RCA) en operaciones de TI. Ofrece un marco integral que permite a los usuarios identificar fácilmente las dependencias causales métricas complicadas y localizar automáticamente las causas raíz de los incidentes. La biblioteca proporciona una interfaz unificada
TLDR
Los métodos de IA generativa para la generación de imágenes tienen una amplia variedad de aplicaciones potenciales en marketing, ventas y comercio electrónico. Con estas aplicaciones en mente, el equipo de Salesforce Research ha desarrollado varias técnicas basadas en modelos de difusión de generación de imágenes, incluyendo métodos para la edición de imágenes, guía mejorada de clasificadores y métodos mejorados de generación controlada
Introducción
El código abierto se ha convertido en uno de los temas más candentes de la IA, y la fanfarria es bien merecida. La comunidad de código abierto mantiene un ritmo ágil con el estado de la técnica, ofreciendo modelos cada vez mayores y más capaces que a menudo compiten de forma impresionante con sus homólogos comerciales. Es una época apasionante
La reciente cobertura mediática de la IA ha seguido un patrón familiar: se lanza un nuevo modelo masivo, que se da a conocer a los beta testers y, finalmente, al público, pero apenas pasan uno o dos meses antes de que empiecen a surgir rumores sobre el modelo aún mayor que supuestamente se está formando para sustituirlo.
La IA se ha convertido en una de las tecnologías más populares del mundo
Otros autores son: Can Qin, Stefano Ermon, Yun Fu
GlueGen fue aceptado por el ICCV.
En el campo de la síntesis de texto a imagen, que avanza con rapidez, los notables progresos en la generación de imágenes realistas a partir de indicaciones textuales han sido evidentes. Sin embargo, sigue existiendo un reto importante: ¿cómo podemos integrar a la perfección potentes codificadores de texto preentrenados en
sistemas de síntesis de texto a imagen?
Hace casi 5 años, se inauguró la Oficina de Uso Ético y Humano, con el objetivo de lograr la excelencia ética de los productos de Salesforce. Lo celebramos publicando 12 días de nuestro mejor contenido sobre uso ético.
TL;DR: Adaptamos nuestro modelo de lenguaje de proteínas ProGen para optimizar anticuerpos que se unen a una proteína llamada “CD40L”, un objetivo crítico para los trastornos autoinmunes. Probamos nuestros anticuerpos diseñados con IA en el laboratorio y descubrimos que se unían muy estrechamente a CD40L, lo que demuestra el potencial de este modelo
Conozca la Oficina de uso ético y humano
La Oficina de uso ético y humano de Salesforce proporciona una guía de navegación para las preguntas difíciles que surgen cuando el potencial humano se encuentra con la tecnología emergente. Trabajamos en toda la empresa para guiar el diseño, el desarrollo y la implantación de productos fiables, con un fuerte
enfoque en la ética y el uso humano
Resumen de la conferencia
La semana que viene se celebrará en Nueva Orleans, Luisiana, la trigésimo séptima Conferencia anual sobre Sistemas de Procesamiento de Información Neuronal (NeurIPS), del domingo 10 al sábado 16 de diciembre. NeurIPS incluirá charlas invitadas, demostraciones y presentaciones orales y en póster de los trabajos aceptados. NeurIPS 2023 se celebrará de nuevo en el
Sede de la Universidad de Nueva Orleans
TL;DR: Con CodeChain, un gran modelo de lenguaje (LLM) preentrenado puede resolver problemas de codificación desafiantes integrando la modularidad en muestras de generación y auto-mejorarse empleando una cadena de auto-revisiones en submódulos representativos. CodeChain puede lograr resultados de vanguardia tanto con los modelos GPT de OpenAI como con los LLM de código abierto en pruebas de codificación exigentes como
Introducción
En los últimos meses he escrito mucho sobre lo que yo llamo Large Action Models, o LAMs, una variación más activa y autónoma de los LLMs que no se limitan a generar contenido como texto o imágenes, sino que realizan tareas completas e incluso participan en flujos de trabajo, ya sea junto a personas
UniControl es aceptado en NeurIPS’23.¿Es posible que un único modelo domine el arte de crear imágenes a partir de bocetos, mapas, diagramas y mucho más? Aunque los generadores de texto a imagen basados en la difusión, como DALL-E-3, han mostrado resultados notables a partir de instrucciones en lenguaje natural, lograr un control preciso de los […]
Antecedentes
Los diseños de maquetación gráfica son la base de la comunicación entre los diseñadores de medios y su público objetivo. Desempeñan un papel fundamental en la organización de diversos elementos visuales, como texto renderizado, logotipos, imágenes de productos, llamadas a la acción (como botones) y texturas/imágenes de fondo. La disposición de estos elementos es el
protagonismo de la comunicación

De la Policía Militar Real Británica al ganador de la sudadera con capucha dorada: descubra cómo el Trailblazer Jonathan Fox consiguió el trabajo de sus sueños en tecnología y ayudó a otros veteranos y cónyuges de militares a desarrollar su potencial dentro de la Comunidad Trailblazer.

Así es como las empresas inteligentes utilizan la automatización para transformar el servicio al cliente de una tarea reactiva a una fuerza proactiva que mejora la experiencia del cliente.

Utilice estas mejores prácticas para ayudar a sus equipos a transformar y confiar en la tecnología de IA con nuevas habilidades y confianza.