NCBI describe la base de datos NR como “Todas las traducciones de CDS GenBank no redundantes, PDB, Swiss Prot, PIR y PRF”. Entonces, la proteína NR es básicamente todas las entradas de proteína que hay y BLAST se usa para eliminar / hacer referencia a secuencias redundantes.
Env_NR es traducciones de la base de datos env.nt (nucleótido) y env.nt son secuencias de ADN directamente del medio ambiente (lo que significa que todos sus organismos se mezclan).
La relación entre ellos está explicada por el WGS … (y solo como referencia, WGS son proyectos de escopeta de genoma completo que son conjuntos de genomas incompletos o cromosomas incompletos). Si se identifica la secuencia de un organismo en particular, entonces está en la base de datos NR, y si el organismo aún no lo sabe, está en la base de datos env_nr.
- ¿Por qué las proteínas se desnaturalizan cuando se calientan?
- ¿Qué información obtenemos de la secuenciación de ARN 16S?
- ¿Cuál es el estado del arte en el modelado de redes reguladoras de genes?
- ¿Cómo CRISPR introduce nuevo material genético en el genoma objetivo?
- ¿Cuál es la importancia de un ADN de triple cadena?
¿Es esta pregunta para su información o está tratando de determinar qué base de datos utilizar para un proyecto?
Espero que esto ayude un poco.