TL;DR: Adaptamos nuestro modelo de lenguaje de proteínas ProGen para optimizar anticuerpos que se unen a una proteína llamada «CD40L», un objetivo crítico para los trastornos autoinmunes. Probamos nuestros anticuerpos diseñados por IA en el laboratorio y descubrimos que se unían muy estrechamente a CD40L, mostrando el potencial de este enfoque para el desarrollo de fármacos anticuerpos.
Salesforce AI Research ha estado adoptando sus avances en PNL para aplicaciones en el diseño de proteínas bajo nuestra carta de IA para el Bien Social. Desarrollamos el modelo de lenguaje de proteínas ProGen con la esperanza de que fuera un paso hacia el uso de la IA para desarrollar tratamientos para enfermedades. En nuestro trabajo anterior, entrenamos a ProGen con proteínas lisozimas antibacterianas y descubrimos que podía diseñar lisozimas muy novedosas que conservaban propiedades antibacterianas. En este trabajo, vamos un paso más allá y utilizamos ProGen para ayudar a diseñar proteínas de anticuerpos con aplicaciones clínicas directas. Los anticuerpos desempeñan un papel fundamental en las defensas de nuestro organismo contra las infecciones. Nuestro sistema inmunitario fabrica estas moléculas diminutas para que se adhieran a invasores extraños, conocidos como antígenos. Este proceso es crucial para el correcto funcionamiento de nuestro sistema inmunitario. Los anticuerpos desarrollados en laboratorio han demostrado ser muy eficaces en el tratamiento de diversas enfermedades, con más de 100 tratamientos con anticuerpos aprobados por la FDA. En este trabajo, utilizamos la IA para diseñar nanocuerpos, que son una clase especial de anticuerpos compuestos por una sola proteína.
El sistema diana de los anticuerpos diseñados en este estudio incluye 2 proteínas: CD40 y CD40L. Estas proteínas desempeñan un papel fundamental en la regulación del sistema inmunitario. Actúan uniendo células T y células presentadoras de antígenos para desencadenar una respuesta inmunitaria.
En personas con trastornos autoinmunes, esta respuesta inmunitaria puede descontrolarse y hacer que el organismo se ataque a sí mismo. Para abordar este problema, nos propusimos interrumpir la interacción entre CD40 y CD40L. Una forma de hacerlo es desarrollar un anticuerpo que se una fuertemente a CD40L, dificultando la conexión entre CD40 y CD40L. Nuestro objetivo era emplear la IA para identificar anticuerpos que muestren una alta afinidad de unión a CD40L.
Nuestros colaboradores de Twist Bioscience recopilaron datos mediante el cribado de un gran conjunto de anticuerpos aleatorios para determinar su capacidad de unión a CD40L. Estos datos iniciales nos proporcionaron un valioso punto de partida para el diseño de nuevos anticuerpos.
Empleamos varias técnicas para entrenar modelos de lenguaje de IA para predecir la afinidad de unión de nuevos anticuerpos a CD40L. Estas técnicas incluían el entrenamiento de nuestro modelo de lenguaje de proteínas interno, ProGen, para comprender las características de los anticuerpos más eficaces en los datos de laboratorio. También utilizamos otros métodos para predecir la afinidad de unión a partir de las representaciones de características aprendidas por los modelos de lenguaje de proteínas. Combinando todos estos modelos, creamos un sistema de puntuación para trazar el panorama de la aptitud de estos anticuerpos, lo que nos ayudó a seleccionar un conjunto diverso de anticuerpos de alto potencial para nuevas pruebas.