No soy un profesional del procesamiento del lenguaje natural, así que esto está lejos de ser una lista completa, pero hay un par de trabajos que he notado que me recomiendan continuamente en un contexto de investigación o de curso:
- El artículo canónico sobre LDA: David M. Blei, Andrew Y. Ng y Michael I. Jordan. Asignación de Dirichlet latente. Journal of Machine Learning Research, 3: 993–1022, 2003. Disponible en Page en wustl.edu.
- El documento canónico sobre n-gramas: JT Goodman, “Un poco de progreso en el modelado del lenguaje”, informe técnico de Microsoft Research MSR-TR-2001-72, 2001. Disponible en la página de microsoft.com.
También recomendaría:
- Lawrence R. Rabiner. Un tutorial sobre modelos ocultos de Markov y aplicaciones seleccionadas en reconocimiento de voz. Actas del IEEE, 1989, páginas 257-286 Disponible en la página en ucsb.edu.
- Parsing: Dan Klein y Christopher D. Manning. Análisis exacto no digitalizado. En ACL, páginas 423–430, 2003. Disponible en Page en berkeley.edu.
Parece que su pregunta podría estar estrechamente relacionada con esta aquí en ¿Cuáles son los trabajos de investigación más importantes que todos los estudiantes de PNL deberían leer definitivamente? ¿Por qué?
- ¿Cuáles son algunas estrategias comunes o heurísticas mentales para identificar preguntas importantes de investigación que finalmente conducen a investigaciones / publicaciones de alto impacto?
- ¿Qué parte de un artículo científico escribe primero?
- Cómo preseleccionar las revistas si estuviera escribiendo un trabajo de investigación
- Cómo escribir un trabajo de investigación sobre animales terrestres
- ¿Qué hace que un trabajo de investigación sea ejemplar?