TL;DR: Adaptamos nuestro modelo de lenguaje de proteínas ProGen para optimizar anticuerpos que se unen a una proteína llamada «CD40L», un objetivo crítico para los trastornos autoinmunes. Probamos nuestros anticuerpos diseñados por IA en el laboratorio y descubrimos que se unían muy estrechamente a CD40L, mostrando el potencial de este enfoque para el desarrollo de fármacos anticuerpos.
Salesforce AI Research ha estado adoptando sus avances en PNL para aplicaciones en el diseño de proteínas bajo nuestra carta de IA para el Bien Social. Desarrollamos el modelo de lenguaje de proteínas ProGen con la esperanza de que fuera un paso hacia el uso de la IA para desarrollar tratamientos para enfermedades. En nuestro trabajo anterior, entrenamos a ProGen con proteínas lisozimas antibacterianas y descubrimos que podía diseñar lisozimas muy novedosas que conservaban propiedades antibacterianas. En este trabajo, vamos un paso más allá y utilizamos ProGen para ayudar a diseñar proteínas de anticuerpos con aplicaciones clínicas directas. Los anticuerpos desempeñan un papel fundamental en las defensas de nuestro organismo contra las infecciones. Nuestro sistema inmunitario fabrica estas moléculas diminutas para que se adhieran a invasores extraños, conocidos como antígenos. Este proceso es crucial para el correcto funcionamiento de nuestro sistema inmunitario. Los anticuerpos desarrollados en laboratorio han demostrado ser muy eficaces en el tratamiento de diversas enfermedades, con más de 100 tratamientos con anticuerpos aprobados por la FDA. En este trabajo, utilizamos la IA para diseñar nanocuerpos, que son una clase especial de anticuerpos compuestos por una sola proteína.
El sistema diana de los anticuerpos diseñados en este estudio incluye 2 proteínas: CD40 y CD40L. Estas proteínas desempeñan un papel fundamental en la regulación del sistema inmunitario. Actúan uniendo células T y células presentadoras de antígenos para desencadenar una respuesta inmunitaria.

En personas con trastornos autoinmunes, esta respuesta inmunitaria puede descontrolarse y hacer que el organismo se ataque a sí mismo. Para abordar este problema, nos propusimos interrumpir la interacción entre CD40 y CD40L. Una forma de hacerlo es desarrollar un anticuerpo que se una fuertemente a CD40L, dificultando la conexión entre CD40 y CD40L. Nuestro objetivo era emplear la IA para identificar anticuerpos que muestren una alta afinidad de unión a CD40L.
Nuestros colaboradores de Twist Bioscience recopilaron datos mediante el cribado de un gran conjunto de anticuerpos aleatorios para determinar su capacidad de unión a CD40L. Estos datos iniciales nos proporcionaron un valioso punto de partida para el diseño de nuevos anticuerpos.
Empleamos varias técnicas para entrenar modelos de lenguaje de IA para predecir la afinidad de unión de nuevos anticuerpos a CD40L. Estas técnicas incluían el entrenamiento de nuestro modelo de lenguaje de proteínas interno, ProGen, para comprender las características de los anticuerpos más eficaces en los datos de laboratorio. También utilizamos otros métodos para predecir la afinidad de unión a partir de las representaciones de características aprendidas por los modelos de lenguaje de proteínas. Combinando todos estos modelos, creamos un sistema de puntuación para trazar el panorama de la aptitud de estos anticuerpos, lo que nos ayudó a seleccionar un conjunto diverso de anticuerpos de alto potencial para nuevas pruebas.


Además de estos, diseñamos otros 21 anticuerpos con más flexibilidad, no ligados a un anticuerpo semilla específico. En su lugar, combinaron de forma novedosa diferentes secuencias de anticuerpos conocidas como regiones determinantes de la complementariedad o «CDR». Dentro de este grupo, descubrimos un par de anticuerpos más que alcanzaban el límite de detección, así como fuertes ligantes que se encontraban hasta a 8 mutaciones de distancia del anticuerpo más cercano en nuestro conjunto de entrenamiento.

Nuestros métodos fueron capaces de optimizar cinco anticuerpos para alcanzar el límite de detección, independientemente de su afinidad de partida, y descubrir numerosos aglutinantes CD40L potentes que son prometedores como tratamientos potenciales para trastornos autoinmunes. Nuestro enfoque también podría aplicarse para ayudar a desarrollar anticuerpos que se unan a otras dianas y traten otras enfermedades. Estamos entusiasmados con las posibilidades que abre este trabajo, ya que acerca el campo al uso de modelos lingüísticos de IA para desarrollar terapias para enfermedades.
Autores y agradecimientos
Este trabajo fue una colaboración conjunta entre Salesforce AI Research, Twist Bioscience y la Facultad de Medicina de la Universidad de Vanderbilt, con los coautores Ben Krause, Subu Subramanian, Tom Yuan, Marisa Yang, Aaron Sato y Nikhil Naik. También agradecemos a Ali Madani, Richard Socher, Vanita Nemali, Audrey Cook, Caiming Xiong, y Silvio Saverese, Hoa Giang, Maxwell Stefan, Joyce Lai, y Sejal Petal por su apoyo.