¿Por qué los investigadores de PNL están obsesionados con las métricas de rendimiento (recientemente)?

Es todo el campo de investigación.

Consideremos la traducción automática automática. La entrada al motor de traducción automática (MTE) es la oración en idioma_1 y la salida son las oraciones traducidas en idioma_2 . La mejor manera de evaluar MTE es contratar un intérprete profesional para hacer el trabajo, pero imaginemos que tenemos miles de pares (oración – oración) para verificar y, además, resulta que necesitamos varios intérpretes porque debemos asegurarnos de que la evaluación sea consistente. Ahora puede ver por qué estamos tan obsesionados con las métricas de evaluación.

“Las evaluaciones humanas de la traducción automática son extensas pero costosas … pueden tardar meses en terminar e involucran trabajo humano que no se puede reutilizar”. Esta fue la razón para desarrollar una métrica “económica e independiente del idioma” para medir la calidad de la traducción llamada Estudio Bilingüe de Evaluación. (BLEU) Los inventores de BLEU quieren que sea como un “suplente automatizado” y que sustituya a “jueces humanos calificados” siempre que se necesiten evaluaciones rápidas y frecuentes. Catorce años después de la publicación del documento, BLEU se ha convertido en el estándar de facto para evaluar la producción de traducción automática. [1]

Notas al pie

[1] Cómo BLEU mide la traducción y por qué es importante | Slator

More Interesting

Quiero comenzar un proyecto de investigación en química. ¿Qué tema es el mejor?

¿Cuáles son las casas de publicación de investigación en Pune?

¿Por qué las empresas que contratan / emplean investigadores de mercado suelen ser tan reservadas acerca de las personas que publican la investigación de mercado al público?

¿Qué debo decir en la primera reunión del grupo de investigación?

¿Cuáles son algunas investigaciones interesantes sobre la psicología de las redes sociales?

¿Qué están haciendo las investigaciones en el campo de la electrónica y la comunicación?

Soy CEO, tengo una maestría en psicología y quiero demostrar que mi aplicación de salud funciona. ¿Cómo me acerco a un académico para investigar conjuntamente mis preguntas de investigación?

¿Podría Watson de IBM ser utilizado para ayudar a la policía en las investigaciones de homicidios en serie?

¿Puede un año de experiencia investigadora relevante contrarrestar el efecto negativo de un CGPA bajo mientras se aplica al MIT o cuánto aumenta un año de experiencia investigadora la aplicación de uno al MIT?

¿Cómo se hace para cuantificar lo cualitativo?

Cómo analizar datos cualitativos y cuáles son los paquetes que se pueden usar

Tengo 17 años y no he hecho nada valioso en mi vida, pero quiero impactar a la sociedad (algo como lo hizo Elon Musk). ¿Cómo puedo hacerlo?

Investigación: ¿Usaría un servicio que analizara sus datos de investigación automáticamente por una pequeña tarifa?

Cómo contactar a dos posibles asesores de posgrado que preguntan sobre los puestos de posgrado abiertos si estoy interesado en un campo de investigación interdisciplinario

¿Qué permisos necesitas para ir a la Antártida como investigador autofinanciado?