Esta no es la única forma de hacerlo, pero es con lo que estoy familiarizado.
En el contexto de regresión:
- utilizando una entrada directa (por ejemplo, latitud y longitud; fila y columna); esto puede ser cuantitativo, transformado o categórico
- crear una nueva variable, o varias variables nuevas (por ejemplo, reemplazar el código postal -> condado, estado, región)
- crear otras variables nuevas, como la distancia (lo probaría para su ejemplo de “cosas divertidas”)
En un contexto de regresión de modelo mixto (modelado espacial):
- ¿Quién mereció el Premio Nobel pero no recibió uno?
- ¿Quién era más inteligente Einstein o Newton?
- ¿Qué hubiera pasado si todos los científicos alemanes hubieran trabajado para la Alemania nazi durante la Segunda Guerra Mundial?
- ¿Quiénes son los grandes jóvenes científicos indios?
- ¿Por qué no se conocía a Grothendieck entre el público y Einstein?
- Modelado de estructura G: modelando la relación entre predictores en diferentes niveles
- Modelado de estructura R: modelando la relación entre los errores (es decir, errores no independientes)
Tenga en cuenta que hay equivalentes matemáticos (pero no computacionales) para ciertos modelos de estructura G y R.
En el “ejemplo de cosas divertidas”, podría crear un modelo predictivo para cada persona y actividad, con la distancia como otro predictor (o como un factor de peso, que matemáticamente es la misma idea).
En el caso de que esté describiendo con vivienda, un modelo de estructura R funcionaría bien. Las casas más cercanas entre sí tendrían una mayor covarianza. Un modelo clásico de estructura R tendría la covarianza en función de la distancia. (Hablando de “distancia”, ¡hay innumerables formas de medir la distancia!)