¿Qué es un enfoque DID (diferencia en diferencia)?

La versión más simple de la diferencia en diferencias (o DD) es una comparación de los resultados previos y posteriores entre los grupos de tratamiento y control.

Consideremos un ejemplo de precios. Todos queremos saber si debemos aumentar o disminuir el precio para aumentar los ingresos. Si la elasticidad del precio (en valor absoluto) es mayor que 1, reducir el precio aumentará las compras lo suficiente como para aumentar los ingresos; Si es inferior a 1, el aumento de los precios aumentará los ingresos. ¿Cómo podemos saber dónde estamos en la curva de ingresos?

Una opción es configurarnos con un diseño DD. Por ejemplo, podríamos cambiar el precio en algunos geos (por ejemplo, estados o países), pero no en otros. Esto le da un “control” natural en los geos donde el precio no cambió. Para tener en cuenta cualquier otro sitio o cambios externos que podrían haber ocurrido simultáneamente, podemos usar los mercados de control, donde el precio no cambió, para calcular el contrafactual que habríamos esperado en nuestros mercados de tratamiento sin el cambio de precio. Al variar a nivel geográfico (versus usuario), también reducimos la importancia de la variación de precio en relación con las pruebas AB.

A continuación se muestra una representación gráfica de DD. Puede ver los geos de tratamiento y control en los períodos previos y posteriores al cambio. El delta entre los ingresos reales (aquí por cookie de sesión) en el grupo de tratamiento y los ingresos contrafácticos en ese grupo proporciona una estimación del efecto del tratamiento:

Si bien la visualización es útil (y con suerte intuitiva), también podemos implementar una versión de regresión de DD. En esencia, la regresión DD tiene un indicador para el estado del tratamiento (aquí es un mercado de tratamiento), un indicador para el momento posterior al cambio y la interacción de esos dos indicadores. El coeficiente en el término de interacción sirve es el efecto estimado del cambio de precio en los ingresos. Si hay tendencias de tiempo generales, también podemos controlar las de la regresión. En R:

ajuste <- lm (Y ~ post + treat + I (post * treat), data = …)
resumen (ajuste)

La suposición clave requerida para la validez interna de la estimación de DD son tendencias paralelas : sin el tratamiento en sí, los mercados de tratamiento y control habrían seguido las mismas tendencias. Es decir, cualquier variable omitida afecta el tratamiento y el control de la misma manera.

Para obtener más información sobre DD, consulte esta publicación.

La diferencia en diferencias (DID o DD) es una técnica estadística utilizada en la econometría y la investigación cuantitativa en las ciencias sociales que intenta imitar un diseño de investigación experimental utilizando datos de estudios observacionales, mediante el estudio del efecto diferencial de un tratamiento en un ‘grupo de tratamiento’ versus un “grupo de control”.