Anthropic lanza un modelo de IA más rápido, más inteligente y más barato

Anthropic lanza un modelo de IA mejorado

Desde que OpenAI lanzó ChatGPT, muchas empresas han intentado crear sus propios modelos de IA, pero solo algunos han logrado destacar. Anthropic es uno de ellos.

La startup de IA lanzó su propio modelo de IA, Claude, en marzo. Ha demostrado ser un digno rival de GPT-3.5 y GPT-4 de OpenAI. Con ese lanzamiento inicial, Anthropic también lanzó Claude Instant, una versión más ligera, menos costosa y más rápida de Claude, según Anthropic. Ahora, está recibiendo una mejora.

También: Cómo la IA ayudó a que mi música esté en todos los principales servicios de streaming 

El miércoles, Anthropic lanzó Claude Instant 1.2, una versión mejorada del modelo que aprovecha Claude 2.0, la última versión de Claude que se lanzó en julio.

Debido a que utiliza las capacidades avanzadas de Claude 2.0, Claude Instant 1.2 ha mejorado significativamente en matemáticas, codificación, razonamiento y seguridad, y genera respuestas más largas y estructuradas, según el comunicado.

Para poner a prueba el modelo, Anthropic comparó el rendimiento de Claude Instant 1.1 y 1.2 en evaluaciones de referencia estándar, incluyendo la evaluación Codex y el benchmark de problemas de matemáticas de nivel de escuela primaria (GSM8k), que son buenos indicadores de habilidades matemáticas y de codificación.

También: Los creadores de TikTok deberán revelar contenido generado por IA, o si no

En ambos casos, 1.2 superó a 1.1 con una puntuación de 58.7% en comparación con el 52.8% original en la evaluación Codex y 86.7% en comparación con el 80.9% original en GSM8k.

Para el resto de los exámenes de referencia, el modelo más nuevo tuvo un rendimiento ligeramente inferior o superior al modelo anterior, con diferencias mínimas.

La calidad de las respuestas también mejoró con una disminución de las alucinaciones y un aumento de la resistencia a los intentos de violación de seguridad. Una evaluación de red teaming encontró que Claude 1.2 es el modelo más seguro de usar.

Las empresas pueden acceder al nuevo modelo completando un formulario de interés y los desarrolladores pueden utilizar la API, que es mucho menos costosa que Claude 2.