Un equipo de ingenieros químicos del MIT ha desarrollado un modelo de inteligencia artificial para optimizar la producción de proteínas en levaduras industriales. Este avance podría reducir significativamente los costos asociados al desarrollo y fabricación de fármacos proteicos.
La investigación se centra en la levadura Komagataella phaffii, analizando su código genético para identificar los codones más eficaces para la producción de proteínas. Los codones son secuencias de tres letras en el ADN que codifican aminoácidos, y su uso varía entre diferentes organismos.
Optimización de la producción de proteínas
El nuevo modelo del MIT ha aprendido a predecir los codones más adecuados para la producción de proteínas, lo que ha permitido aumentar la eficiencia en la fabricación de seis proteínas, entre ellas la hormona de crecimiento humano y un anticuerpo monoclonal para el tratamiento del cáncer.
J. Christopher Love, profesor de ingeniería química en el MIT y autor principal del estudio, destaca la importancia de contar con herramientas predictivas que faciliten el proceso de producción, señalando que la reducción de la incertidumbre puede ahorrar tiempo y recursos.
El proceso de codificación de proteínas
Las levaduras, como K. phaffii y Saccharomyces cerevisiae, son fundamentales en la industria biofarmacéutica, generando miles de millones de dólares en medicamentos y vacunas anualmente. Para optimizar la producción en estas levaduras, los investigadores introducen genes de otros organismos y modifican secuencias de ADN.
Este proceso puede representar entre el 15 y 20 por ciento del costo total de comercialización de nuevos fármacos biológicos. Actualmente, estas etapas se realizan a través de tareas experimentales que requieren mucho tiempo y esfuerzo.
Un enfoque innovador
El equipo del MIT ha utilizado un modelo de lenguaje de inteligencia artificial para analizar secuencias de ADN y aprender sobre las relaciones entre los codones. La base de datos utilizada incluye secuencias de aminoácidos y sus correspondientes secuencias de ADN de aproximadamente 5,000 proteínas producidas naturalmente por K. phaffii.
El modelo fue capaz de optimizar las secuencias de codones de seis proteínas diferentes, logrando resultados superiores al comparar con herramientas comerciales de optimización de codones. Esto demuestra la eficacia del enfoque del MIT en la mejora de la producción proteica.
Resultados y aplicaciones futuras
Investigaciones adicionales han explorado la aplicabilidad del modelo en diferentes organismos, sugiriendo la necesidad de modelos específicos para optimizar codones en proteínas objetivo. El equipo ha comenzado a utilizar el nuevo modelo para optimizar proteínas de interés en K. phaffii, y el código está disponible para otros investigadores.
El estudio fue respaldado por diversas instituciones, incluyendo el Fondo de Innovación de Investigación de la Facultad Daniel I.C. Wang del MIT y el Consorcio de Investigación AltHost del MIT.















