¿Qué significan las “estructuras disponibles” en el banco de datos de proteínas?

Cuando publica una estructura macromolecular, la mayoría de las revistas también requieren que envíe un archivo pdb con las coordenadas al Banco de datos de proteínas (www.pdb.org). Una vez enviado, se le asigna automáticamente una identificación única que facilita su recuperación, simplemente escriba cuatro caracteres del artículo en la base de datos y aparecerá la estructura. A casi todas las proteínas publicadas (o ADN / ARN / macromolécula biológicamente relevante) se les ha asignado una de estas ID de PDB. Por lo general, son arbitrarios, aunque las estructuras relacionadas publicadas en el mismo documento a menudo tienen ID de PDB secuenciales. Para las proteínas que se estudian mucho (es decir, IGF-1), encontrará muchas estructuras diferentes que, para el ojo inexperto, difieren solo ligeramente.

Hay muchas razones por las cuales los biólogos estructurales rara vez se contentan con una sola estructura de cada proteína. Aquí hay una lista de unos pocos sin ningún orden en particular:

  • Puede ser útil resolver estructuras de diferentes versiones de la misma proteína con mutaciones artificiales. Esto puede ayudar a identificar qué aminoácidos en particular son esenciales para crear o prevenir diversas características estructurales de un pliegue proteico.
  • Es posible que las estructuras de la misma proteína deban resolverse varias veces en complejo con diferentes iones metálicos, moléculas pequeñas, ácidos nucleicos o incluso otras proteínas que podrían tener un significado biológico diferente.
  • Puede ser más fácil expresar, purificar, cristalizar y difractar subdominios individuales o piezas de la misma proteína por separado.
  • Las proteínas no son estáticas y se mueven un poco. A menudo hay relevancia biológica para más de uno de estos estados. Puede ser útil resolver la estructura de múltiples estados creados por diferentes condiciones cristalográficas (o por RMN).
  • La estructura de proteínas homólogas con el mismo nombre puede haberse resuelto en diferentes organismos. Para las proteínas estrechamente relacionadas, generalmente solo hay diferencias marginales entre los dos, pero puede haber momentos en los que sea útil estudiar las diferencias entre dos homólogos.
  • Se pueden resolver grandes complejos de proteínas (a menudo mediante microscopía electrónica). Puede haber múltiples composiciones del mismo complejo con diferentes subunidades de proteínas.
  • Algunas proteínas existen como monómeros, dímeros u oligómeros de orden superior, cada uno de los cuales cumple una función biológica diferente que requiere su propia estructura.
  • Las modificaciones químicas que ocurren naturalmente, como la fosforilación, la adición de un grupo fosfato a una cadena lateral de aminoácidos, pueden cambiar drásticamente la estructura y la función de las proteínas, exponiendo regiones previamente enterradas que participan en una nueva química. Las estructuras antes y después de la modificación son útiles para estudiar estos cambios.
  • Una nueva estructura en una resolución más alta revela nuevos detalles sobre la proteína. Quizás los investigadores utilizaron una técnica diferente o mejoraron las condiciones de cristalización para obtener una red cristalina diferente que difractara a una resolución más alta.
  • ¡Hiciste un montón de trabajo en un problema interesante en biología estructural y tus rivales te recogieron justo después de obtener los datos! También podría publicar su estructura marginalmente diferente para que aún pueda graduarse (si alguien lo acepta).

Una vez que encuentre su archivo .pdb de interés, querrá poder visualizarlo y trabajar con él. Para obtener más información sobre cómo visualizar estos archivos pdb, consulte: ¿Qué software y métodos utilizan las personas para crear representaciones de estructuras de proteínas?