Esta no es la única forma de hacerlo, pero es con lo que estoy familiarizado.
En el contexto de regresión:
- utilizando una entrada directa (por ejemplo, latitud y longitud; fila y columna); esto puede ser cuantitativo, transformado o categórico
- crear una nueva variable, o varias variables nuevas (por ejemplo, reemplazar el código postal -> condado, estado, región)
- crear otras variables nuevas, como la distancia (lo probaría para su ejemplo de “cosas divertidas”)
En un contexto de regresión de modelo mixto (modelado espacial):
- ¿Cuáles son los puntos de vista de Einstein sobre la vida y la existencia?
- ¿Por qué los hombres del ejército indio y el personal de defensa son más respetados que los científicos / profesores / economistas?
- ¿Por qué algunos científicos niegan la posibilidad de extender la vida útil a través de la biotecnología?
- ¿Por qué generalmente los niños se interesan en la programación en sus primeras edades y luego, la mayoría de ellos, no se convertirán en un buen científico de la computación en el futuro?
- ¿Estaba Isaac Newton directamente involucrado en matar gente?
- Modelado de estructura G: modelando la relación entre predictores en diferentes niveles
- Modelado de estructura R: modelando la relación entre los errores (es decir, errores no independientes)
Tenga en cuenta que hay equivalentes matemáticos (pero no computacionales) para ciertos modelos de estructura G y R.
En el “ejemplo de cosas divertidas”, podría crear un modelo predictivo para cada persona y actividad, con la distancia como otro predictor (o como un factor de peso, que matemáticamente es la misma idea).
En el caso de que esté describiendo con vivienda, un modelo de estructura R funcionaría bien. Las casas más cercanas entre sí tendrían una mayor covarianza. Un modelo clásico de estructura R tendría la covarianza en función de la distancia. (Hablando de “distancia”, ¡hay innumerables formas de medir la distancia!)