¿Cómo se analizan los genes expresados ​​diferencialmente usando bioinfirmática?

Tal vez comenzaré la discusión presentando una forma posible de analizar los datos de expresión génica utilizando un método que conozco: PCR cuantitativa en tiempo real (qRT-PCR o qPCR).

El resultado de qPCR es un valor de CT, que indica cuántos ciclos atravesó la PCR antes de alcanzar una señal por encima del umbral. En la PCR, el valor de CT le da una indicación de (relativamente) cuántas transcripciones de ARNm estaban en su muestra (las transcripciones de ARNm se transcribieron primero al ADNc, pero esto no importa para la discusión). Los valores de CT sin procesar son excelentes, pero para tener una idea de lo que significan, debe tener en cuenta dos controles (el control para PCR es un gen de mantenimiento, como GAPDH o B-Actin, y una muestra de control que se dejó sin tratamiento) Un método robusto para cuantificar la expresión génica relativa de los datos de PCR es utilizar el método delta-delta-CT [1-2]:

Expresión relativa = [matemática] 2 ^ – [dCTsample – dCTcontrol] [/ math]

donde [math] dCTsample = CTsample – CTsample, control de limpieza [/ math]

[math] dCTcontrol = CTcontrol – CTcontrol, control de limpieza [/ math]

Se han propuesto otros métodos similares [3], pero este método debería proporcionarle un método robusto para comparar dos muestras diferentes (suponiendo que tenga un control de limpieza tanto para la muestra tratada como para la muestra de control).

Si tiene datos de expresión génica en otra forma, solo puedo especular sobre cómo analizarlos. Si tiene datos de “expresión relativa”, ¡el trabajo ya está hecho! Una vez que obtiene sus datos en algo utilizable, ¡comienza el análisis estadístico!

La expresión genética relativa de tres o más muestras se puede comparar usando pruebas de hipótesis típicas, como la prueba t de Student (si solo está comparando dos muestras) o unidireccional (si está comparando más de dos muestras que representan niveles únicos o múltiples de una variable distinta) o análisis de varianza de dos vías (si está comparando más de dos muestras con niveles únicos o múltiples de dos variables distintas). Si tiene más de dos variables, es posible que necesite un análisis multivariado a menos que pueda “bloquear” su análisis estadístico en dos variables o menos. No entraré en detalles aquí, ya que hay varios sitios web [4-5] y libros de texto [6] que pueden profundizar mucho más que una respuesta aquí. Para la cantidad de datos que genero, GraphPad Prism es suficiente para calcular la expresión génica relativa y para comparar muestras usando análisis estadísticos, pero esta puede no ser la herramienta para usar para grandes cantidades de datos de expresión génica. Aquí, debe compilar los datos y usar una herramienta como MATLAB para calcular los parámetros y generar matrices de valores p que se pueden usar para extraer datos estadísticamente significativos.

Dependiendo de la cantidad de datos a los que tenga acceso, podría ser posible sacar conclusiones biológicamente relevantes de los datos de expresión génica utilizando métodos para calificar genes particulares o genes relacionados que respondieron de una manera particular al tratamiento (este tipo de método tiene en cuenta señales cruzadas de señalización y rutas conservadas de señalización celular que le permiten a uno sacar conclusiones fuera de mirar los genes individuales por sí mismos) [7-8].


Referencias

[1] http: //www.gene-quantification.c…

[2] Análisis de datos relativos de expresión génica utilizando PCR cuantitativa en tiempo real y el método 2 (-Delta Delta C (T)).

[3] http://www.ncbi.nlm.nih.gov/pmc/…

[4] Análisis de varianza (¡Perdón por citar wikipedia! Utilice referencias internas para más detalles)

[5] http://www.statstutor.ac.uk/reso…

[6] Amazon.com: Experimentos: planificación, análisis y optimización (9780471699460): CF Jeff Wu, Michael S. Hamada: Libros

[7] Sobre los métodos para la calificación de la función génica como un medio para facilitar la interpretación de los resultados de microarrays.

[8] Clasificación de datos de microarrays por puntuación de genes basada en información múltiple integrada con ontología de genes.