modelo de lenguaje preentrenado

TLDR

Entrenamos una serie de LLMs 7B llamados XGen-7B con atención densa estándar hasta 8K de longitud de secuencia para hasta 1.5T tokens. También afinamos los modelos en datos de instrucción de dominio público. Los principales resultados son:

En pruebas de PNL estándar, XGen consigue resultados comparables o mejores

Seguir leyendo

ai AMA apex Apex Code Aplicaciones ChatGPT CI cli Cloud CodeGen Código abierto consulta Data Datos Escala ga generación de código github Google gpt INCLUDE INCLUDES LLM ML modelo de lenguaje preentrenado Otros PCI Performance PLN PLN multilingüe Prueba pruebas Salesforce Salesforce AI Scale Tarea TI UI

Etiqueta: modelo de lenguaje preentrenado

TLDR