¿Qué tan fácil es pasar de un LDA (un modelo paramétrico) a un modelo no paramétrico?

Bastante fácil. Para pasar de LDA a HDP en una muestra de Gibbs, básicamente cambia la ecuación de muestreo de
[matemáticas] \ left (n_ {d, k} + \ frac {\ alpha} {K} \ right) \ frac {t_ {k, w} + \ beta / V} {t_ {k, \ cdot} + \ beta} [/ matemáticas]
a uno de dos casos. Uno en el que ha usado el tema antes:
[matemáticas] \ left (n_ {d, k} \ right) \ frac {t_ {k, w} + \ beta / V} {t_ {k, \ cdot} + \ beta} [/ math]
y uno donde no has:
[matemáticas] \ left (\ alpha \ right) \ frac {t_ {k, w} + \ beta / V} {t_ {k, \ cdot} + \ beta} [/ math]

Dónde:

  • [matemáticas] K [/ matemáticas] es el número total de temas
  • [matemáticas] k [/ matemáticas] es el tema que está probando
  • [matemáticas] n_ {d, k} [/ matemáticas] es la cantidad de veces que se usa el tema k en el documento d
  • [matemáticas] t_ {k, w} [/ matemáticas] es la cantidad de veces que se usa el trabajo w en el tema k
  • [math] \ alpha [/ math] es el parámetro de Dirichlet (Proceso) de su documento
  • [math] \ beta [/ math] es el parámetro de Dirichlet del tema