El último Gemini 2.5 Pro de Google domina las pruebas de IA y las tareas de razonamiento
Masterbitz
hace 1 día2 Min. de lectura
Google acaba de lanzar su último modelo insignia de IA Gemini 2.5 Pro. Por si no lo sabías, fue Google quien creó la arquitectura original del modelo Transformer que utilizan ChatGPT de OpenAI, Grok de xAI, Anthropic Claude y otros modelos. Google lleva un tiempo iterando su serie de modelos Gemini, y la compañía ha lanzado su versión más potente hasta la fecha: Gemini 2.5 Pro. Al tratarse de la familia v2.5, forma parte de los modelos pensantes, capaces de razonar sus pensamientos antes de producir resultados, lo que le permite reiterar sus «pensamientos» antes de ofrecer resultados óptimos. El razonamiento, realizado a través del aprendizaje por refuerzo y el estímulo de la cadena de pensamiento, obliga al modelo a analizar y trazar soluciones lógicas paso a paso, con lo que se obtienen mejores resultados.
En LMArea, que ofrece a los usuarios los resultados de un modelo de IA para que los evalúen y decidan cuál es el mejor, Gemini 2.5 Pro se situó en cabeza de la clasificación general, con el primer puesto en áreas como preguntas difíciles, codificación, matemáticas, escritura creativa, seguimiento de instrucciones, consultas más largas y respuestas de varios turnos. Se trata de un resultado impresionante para Google, ya que ahora lidera la clasificación en todas estas áreas y supera a Grok 3 de xAI y a GTP-4.5 de OpenAI. En las pruebas de referencia estandarizadas del sector de la IA, Gemini 2.5 Pro también es líder en la mayoría de las pruebas de referencia, como AIME, LiveCodeBench, Aider, SWE-Bench, SimpleQA y otras. Curiosamente, el 18,8% en Humanity's Last Exam es actualmente el benchmark de IA más difícil. Curiosamente, Gemini 2.5 Pro de Google puede procesar contexto masivo con una ventana de contexto de un millón de tokens, que pronto se ampliará a dos millones de tokens. Es, literalmente, suficiente para procesar libros enteros de contexto para dotar al modelo. Gemini 2.5 Pro ya está disponible en Google AI Studio, y los usuarios de Gemini Advanced pueden seleccionarlo en el desplegable de modelos en escritorio y móvil.
Comentários