¿Cuáles son las diferencias entre GRCh38 y GRCh37?

No me sorprendería si ya encontraras la respuesta a esta pregunta, pero solo para el registro:

GRCh38 destacados

  1. Genoma mitocondrial
    MITOMAP, la organización responsable del manejo de las secuencias mitocondriales humanas, ha permitido amablemente que el GRC incluya la secuencia de referencia mitocondrial con GRCh38. Al igual que en GRCh37, la secuencia de referencia MT actual es la Secuencia de referencia de Cambridge revisada (rCRS), representada por el número de acceso GenBank J01415.2 y el número de acceso RefSeq NC_012920.1.
  2. Representación de secuencia para centrómeros.
    En versiones de ensamblaje de referencia anteriores, los centrómeros estaban representados por espacios grandes, del tamaño de una megabase, (N en la secuencia de ensamblaje). En GRCh38, estas brechas se reemplazan por secuencias derivadas de las lecturas generadas durante la secuenciación del genoma HuRef. Estas secuencias se usaron para crear modelos de centrómeros, como se describe en Miga et al., 2013, que proporcionan el número de repetición aproximado y el orden de cada centrómero en el genoma. Se anticipa que estas secuencias de centrómeros modelo serán útiles para el mapeo de lectura y los estudios de variación. Esté atento a los próximos blogs de GRC con más información sobre estos centrómeros.
  3. Actualizaciones de ensamblaje general
    Los estudios a gran escala de la variación humana, como el Proyecto 1000 Genomas, identificaron una serie de bases e indeles en GRCh37 que nunca se vieron en ningún individuo, lo que sugiere que pueden representar errores en el ensamblaje. Varios miles de bases individuales se actualizaron en GRCh38, muchos de los cuales corrigieron errores en la secuencia de codificación. Además, una serie de regiones de ensamblaje que se ensamblaron incorrectamente en GRCh37, como 1T21, 10T11 y el chr. 9 regiones peri-centroméricas han sido retiradas. Varias regiones genómicas muy variantes, como el locus IGH, se han retilado con componentes derivados de un único recurso de haplotipo para garantizar que el ensamblaje de referencia proporcione una representación haplotípica válida. También se han actualizado más de 100 espacios de montaje; estos son cerrados o reducidos, en muchos casos con secuencias WGS disponibles públicamente de otros proyectos de secuenciación del genoma.
  4. Variación
    Al igual que GRCh37, el conjunto de referencia actualizado proporciona una representación de secuencia alternativa para regiones variantes en forma de andamios de loci alternativos (loci alt). Los loci alternativos son secuencias independientes y accesadas para las cuales se proporciona contexto cromosómico mediante alineación con los cromosomas de referencia. Todos los loci alternativos incluyen al menos una secuencia de anclaje, un componente que también se encuentra en los cromosomas de referencia, para garantizar que estas alineaciones sean de alta calidad. Los loci Alt pertenecen a unidades de ensamblaje de loci alternativos: la unidad de ensamblaje ALT_REF_LOCI_1 contiene la primera representación de secuencia alternativa para cualquier locus genómico, ALT_REF_LOCI_2 contiene la segunda representación de secuencia alternativa y así sucesivamente. GRCh38 contiene 261 andamios de loci alternativos, en 35 unidades de ensamblaje alternativas. 72 de estos loci alternativos estaban previamente disponibles como parches NOVEL para GRCh37. El complejo LRC / KIR en el cap. 19 tiene el mayor número de representaciones de secuencia alternativas (35), seguido por el MHC en chr. 6 (7).

Fuente: Anunciando GRCh38

Puedes encontrar más detalles aquí:

¡Ha llegado el nuevo navegador Grch38 del genoma humano!