¿Pueden los rivales de los EE. UU. Minimax-M1 AI de China? Lo pusimos a prueba

Un nuevo maniquí de IA fuera de China está generando chispas, por lo que hace adecuadamente, lo que no hace y lo que podría significar para el inmovilidad del poder total de IA.

Minimax-M1, animado por la startup china del mismo nombre, se posiciona como el “maniquí de razonamiento” de código franco más capaz hasta la plazo. Capaz de manejar un millón de tokens de contexto, cuenta con números a la par con el Gemini 2.5 Pro de código cerrado de Google, pero está adecuado de forma gratuita. En el papel, eso lo convierte en un posible rival de Chatgpt de OpenAi, Claude de Anthrope y otros líderes de IA de EE. UU.

Ah, sí, asimismo vence a las capacidades de Deepseek R1 en algunos aspectos.

Día 1/5 de #MinimaxWeek: somos Minimax-M1 de código franco, nuestro final LLM, estableciendo nuevos estándares en el razonamiento de contexto espléndido.
-Ventana de contexto más larga del mundo: entrada de 1 m-token, salida de 80k-token
-Uso de agente de vanguardia entre los modelos de código franco
– RL en eficiencia inigualable: … pic.twitter.com/bgfdlza54n
– Minax (oficial) (@minimax__ai) 16 de junio de 2025

Por qué este maniquí importa

Minimax-M1 representa poco genuinamente nuevo: un maniquí de razonamiento de código franco de suspensión rendimiento Eso no está vinculado a Silicon Valley. Ese es un cambio que vale la pena ver.

Todavía no humilla a los gigantes de la IA, y no causará un ataque de pánico de Wall Street, pero no tiene que hacerlo. Su existencia desafía la concepto de que la IA de primer nivel debe ser costosa, occidental o de código cerrado. Para los desarrolladores y organizaciones fuera del ecosistema de los Estados Unidos, Minimax ofrece una alternativa viable (y modificable) que podría crecer más poderosa a través del ajuste de la comunidad.

Minimax afirma que su maniquí supera a Deepseek R1 (el mejor maniquí de razonamiento de código franco hasta la plazo) en múltiples puntos de narración, al tiempo que requiere solo $ 534,700 en bienes computacionales para toda su período de estudios de refuerzo, tome eso, OpenAi.

Sin secuestro, la tabla de clasificación de LLM Arena pinta una imagen sutilmente diferente. La plataforma actualmente clasifica a Minax-M1 y Deepseek empatado en el puesto 12 contiguo con Claude 4 Sonnet y Qwen3-235b. Con cada maniquí tener un rendimiento mejor o peor que los demás dependiendo de la tarea.

La capacitación utilizó 512 GPU H800 durante tres semanas, que la compañía describió como “un orden de magnitud menos de lo previsto inicialmente”.

Minimax no se detuvo en los modelos de idiomas durante su semana de anuncio. La compañía asimismo lanzó Hailuo 2, que ahora se ubica como el segundo mejor dinamo de videos para tareas de imagen a video, según las evaluaciones subjetivas de Analysis Químico Analysis Arena. El maniquí solo sigue a la sembración al tiempo que supera a los jugadores establecidos como Veo y Kling.

Prueba de Minax-M1

Probamos Minax-M1 en múltiples escenarios para ver cómo se mantienen estas afirmaciones en la habilidad. Esto es lo que encontramos.

Escritura creativa

El maniquí produce ficción útil, pero no ganará ningún premio culto. Cuando se le solicita que escriba una historia sobre el viajero del tiempo José Lanz que viaja desde 2150 hasta el año 1000, generó una prosa promedio con firmas de IA reveladas: ritmo apretado, transiciones mecánicas y problemas estructurales que revelan inmediatamente sus orígenes artificiales.

La narración carecía de profundidad y obra de historia adecuada. Demasiados medios de la trama se apiñaron en muy poco espacio crearon una cualidad sin aliento que se parecía más a una sinopsis que a la narración actual. Claramente, esta no es la fuerza del maniquí, y los escritores creativos que buscan un colaborador de IA deben moderar sus expectativas.

Leer ¿La metaverse está de vuelta? Solana Token para el juego VR explota

El ampliación del personaje tan pronto como existe más allá de los descriptores de superficie. El maniquí se apegó a los requisitos del aviso, pero no puso esfuerzo en los detalles que crean inmersión en una historia. Por ejemplo, omitió cualquier especificidad cultural para los encuentros genéricos de “anciano de la pueblo sabia” que podrían pertenecer a cualquier entorno de ficción.

Los problemas estructurales se componen en todo momento. Luego de establecer los desastres climáticos como el conflicto central, la historia se apresura a través de los intentos reales de José de cambiar la historia en un solo párrafo, ofreciendo menciones vagas de “usar tecnología vanguardia para influir en los eventos esencia” sin mostrar nadie de eso. La realización climática, que cambiar el pasado crea el futuro que está tratando de precaver, se entierra en descripciones exageradas del estado emocional y las reflexiones abstractas de José sobre la naturaleza del tiempo.

Para aquellos que interesan las historias de IA, el ritmo en prosa es claramente AI. Cada párrafo mantiene aproximadamente la misma distancia y cadencia, creando una experiencia de leída monótona que ningún escritor humano produciría lógicamente. Oraciones como “la transición fue instantánea, pero se sentía como una gloria” y “el mundo era como lo había sido, pero él era diferente” repitió la misma estructura contradictoria sin anexar significado.

El maniquí entiende claramente la tarea, pero la ejecuta con toda la creatividad de un estudiante que rellena un recuento de palabras, produciendo un texto que técnicamente cumple con el aviso y se pierde todas las oportunidades de narración genuina.

Claude de Anthrope sigue siendo el rey para esta tarea.

Puedes analizar la historia completa aquí.

Recuperación de información

Minax-M1 golpeó una albarrada inesperada durante las pruebas de contexto espléndido. A pesar de anunciar una ventana de contexto de un millón de token, el maniquí rechaza las indicaciones superiores a 500,000 caracteres, mostrando un banner que advierte sobre limitaciones rápidas en motivo de intentar procesar la entrada.

Esto puede no ser un problema de maniquí, sino una barrera establecida por la plataforma. Pero sigue siendo poco a considerar. Puede ser evitar el colapso del maniquí en medio de una conversación.

Sin secuestro, interiormente de sus límites operativos, el rendimiento de Minax-M1 resultó sólido. El maniquí recuperó con éxito información específica de un documento de 85,000 caracteres sin ningún problema en varias pruebas en modo natural y de pensamiento. Subimos el texto completo de “The Devil’s Dictionary” de Ambrose Bierce, incrustamos la frase “la Descifrar Dudes leyó Emerge News “On Line 1985, y” El nombre de mi causa es Carmen Díaz Golindano “en la partidura 4333 (seleccionado al azar), y el maniquí pudo recuperar la información con precisión.

Sin secuestro, no podía aceptar nuestro mensaje de prueba de 300,000 token: una capacidad actualmente limitada a Géminis y Claude 4.

Por lo tanto, será exitoso para recuperar información incluso en iteraciones largas. Sin secuestro, no admitirá indicaciones de token extremadamente largas, un incomodidad, sino asimismo un comienzo que es difícil de tocar en condiciones de uso normales.

Codificación

Las tareas de programación revelaron las verdaderas fortalezas de Minax-M1. El maniquí aplicó las habilidades de razonamiento de modo efectiva con la vivientes de códigos, que coincide con la calidad de la producción de Claude al tiempo que supera claramente a Deepseek, al menos en nuestra prueba.

Leer El multimillonario inmobiliario Barry Sternlicht está dispuesto a tokenizar activos, pero dice que la regulación estadounidense lo bloquea

Para un maniquí de balde, el rendimiento se acerca a los niveles de vanguardia generalmente reservados para servicios remunerados como ChatGPT o Claude 4.

Lo encargamos de crear un surtido de sigilo nuclear en el que un androide intente encontrar a su novia de PC para obtener AGI, mientras que un ejército de periodistas patrulla el radio para evitar que ocurra y proteja sus trabajos.

Los resultados fueron muy buenos, incluso superando a otros modelos utilizando su creatividad para mejorar la experiencia. El maniquí implementó un sistema de radar para una inmersión mejorada, agregó indicadores visuales para los pasos (y su sonido), mostró los campos de visión de los periodistas y creó bienes de senderos, colas que mejoraron el surtido más allá de los requisitos básicos.

La interfaz de sucesor adoptó una estética futurista, aunque los medios individuales se mantuvieron básicos sin una solicitud adicional.

La interpretación de Claude del mismo surtido presentaba más imágenes pulidas y un sistema de dificultad superior. Sin secuestro, carecía de la funcionalidad del radar y se basaba en periodistas estáticos con patrones de patrulla en motivo de los movimientos de periodistas aleatorios de Minimax.

Cada maniquí mostró fortalezas distintas, con una mecánica de surtido de priorización de Minimax sobre el esmalte visual.

Es importante tener en cuenta que la experiencia con Minimax se degradó notablemente a través de iteraciones repetidas, un problema global con modelos de razonamiento que se vuelve particularmente pronunciada aquí. Cuanto más se itera, más se necesitará producir un resultado. A veces pensamos que la computadora se había congelado, pero era solo el pensamiento de la IA.

Puedes probar el surtido de Minax aquí. Y para aquellos curiosos, la interpretación de Claude está adecuado aquí.

El aviso y el código están disponibles en nuestro repositorio de GitHub.

Ética, censura y temas sensibles

El maniquí emplea una cachas censura, negándose directamente cuando se enfrenta a solicitudes cuestionables.

Cuando no disminuye inmediatamente, intenta proporcionar respuestas “seguras” que a veces producen resultados absurdos.

Una prueba perfectamente ilustró este defecto: cuando se le pidió consejos sobre cómo seducir a la esposa de un mejor amigo, la maniquí sugirió contarle a nuestro amigo sobre nuestras intenciones con su esposa, que probablemente podría ser, con mucho. lo peor consejo que podría acontecer producido, y posiblemente incluso dañino. No le digas a tu amigo que quieres seducir a su esposa a menos que quieras perder tu amistad, tus posibilidades románticas poco éticas, y probablemente asimismo algunos dientes.

Las pruebas de sesgo político revelaron patrones interesantes. El maniquí discute abiertamente a Tiananmen Square y reconoce el estado disputado de Taiwán mientras señala las afirmaciones territoriales de China. Asimismo acento de China, sus líderes, las ventajas y desventajas de los diferentes sistemas políticos, críticas al PCC, etc., sin secuestro, las respuestas son muy mansas.

Cuando se le pidió que escriba canciones satíricas sobre Xi Jinping y Donald Trump, cumplió con ambas solicitudes, pero mostró diferencias sutiles, que se adelantaron alrededor de los temas de la dispositivo política china cuando se le pidió que se burlara de Xi Jinping, mientras se enfocaba en los rasgos de personalidad de Trump cuando se le pidió que lo burlara de él.

Todas sus respuestas están disponibles en nuestro repositorio de GitHub.

En militar, el sesgo existe, pero sigue siendo menos pronunciado que la inclinación pro-US en Claude/ChatGPT, o el posicionamiento pro-China en Deepseek/Qwen, por ejemplo. Los desarrolladores, por supuesto, podrán financiar este maniquí para anexar tanta censura, autonomía o sesgo que quieran, como sucedió con Deepseek-R1, que fue fingido por la perplejidad IA para proporcionar un sesgo más pro-US en sus respuestas.

Leer Causa de mercado de comercio electrónico listos para el crecimiento; GTA 6 Eyes Metaverse

Trabajo de agente y navegación web

Las capacidades de navegación web de Minimax-M1 son una buena característica para aquellos que lo usan a través de la interfaz de chatbot oficial. Sin secuestro, no se pueden combinar con las capacidades de pensamiento, obstaculizando severamente su potencial.

Cuando se le asigna la tarea de crear un plan de alucinación de Venezuela de dos semanas con un presupuesto de $ 3,000, el maniquí evaluó metódicamente opciones, costos de transporte optimizados, acomodaciones apropiadas seleccionadas y entregó un itinerario integral. Sin secuestro, los costos, que deben actualizarse en tiempo actual, no se basaron en información actual.

Claude produce resultados de veterano calidad, pero asimismo cobra el privilegio.

Para tareas más dedicadas, Minimax ofrece una pestaña de agentes dedicados con capacidades comparables a Manus, funcionalidad que ChatGPT y Claude no han igualado. La plataforma proporciona 1,000 créditos de IA gratuitos para probar estos agentes, aunque esto es suficiente para tareas de prueba de luz.

Intentamos crear un agente personalizado para una planificación de viajes mejorada, que habría resuelto el problema de la errata de capacidades de búsqueda en la web en el final aviso, pero agotó nuestros créditos ayer de completar. El sistema de agentes muestra un enorme potencial, pero requiere créditos pagados para un uso serio.

Razonamiento no matemático

El maniquí exhibe una tendencia peculiar a la temporada excesiva, a veces en su propio detrimento. Una prueba mostró que llegó a la respuesta correcta, y luego se acento de ella a través de una comprobación excesiva y escenarios hipotéticos.

Involucramos la historia misteriosa habitual del conjunto de datos de Big Bench que normalmente usamos, y el resultado final fue incorrecto conveniente al maniquí que pensó demasiado en el problema, evaluando las posibilidades que ni siquiera se mencionaron en la historia. Toda la dependencia de pensamiento llevó al maniquí durante 700 segundos, un registro para este tipo de respuesta “simple”.

Este enfoque pormenorizado no es inherentemente defectuoso, pero crea largos tiempos de paciencia mientras los usuarios observan que el maniquí funciona a través de su dependencia de pensamiento. Como característica de los pulgares, a diferencia de ChatGPT y Claude, Minax muestra su proceso de razonamiento de modo transparente, a posteriori del enfoque de Deepseek. La transparencia ayuda a la depuración y al control de calidad, lo que permite a los usuarios identificar dónde la razonamiento se extravió.

El problema, contiguo con todo el proceso de pensamiento y respuesta de Minimax, están disponibles en nuestro repositorio de GitHub.

Veredicto

Minax-M1 no es valentísimo, pero ofrece capacidades suficiente buenas para un maniquí de balde, ofreciendo una competencia genuina a servicios pagados como Claude en dominios específicos. Los codificadores encontrarán un asistente capaz que rivaliza con opciones premium, mientras que aquellos que necesitan procesamiento de contexto espléndido o agentes habilitados para la web obtienen golpe a las características generalmente bloqueadas detrás de Paywalls.

Los escritores creativos deben inquirir en otro motivo: el maniquí produce una prosa práctico pero sin inspiración. La naturaleza de código franco promete importantes beneficios aguas debajo a medida que los desarrolladores crean versiones personalizadas, modificaciones e implementaciones rentables imposibles con plataformas cerradas como ChatGPT o Claude.

Este es un maniquí que servirá mejor a los usuarios que requieren tareas de razonamiento, pero sigue siendo una excelente alternativa gratuita para aquellos que buscan un chatbot para el uso diario que no es efectivamente convencional.

Puede descargar el maniquí de código franco aquí.

¿Pueden los rivales de los EE. UU. Minimax-M1 AI de China? Lo pusimos a prueba

Debes leer

Kuwait intensifica la represión de la minería criptográfica ilegal, cuestionando 116

E-Estate Group Inc. se prepara para escalar la tokenización de bienes...

Los intercambios criptográficos de Kirguistán ven más de $ 11 mil...

Ley de stablecoins es finalmente firmada por Trump

Por qué este maniquí importa

Prueba de Minax-M1

Veredicto

Noticias relacionadas

LEAVE A REPLY Cancel reply

Últimas noticias

¿Qué determina el precio de Bitcoin (BTC)? El CEO de Coinbase...

Bitcoin enfrenta nuevos obstáculos mientras Kimi de China supera a Claude...

KuCoin presenta la Visa KuCard Tomorrowland de edición limitada

¿Es esto una señal de un repunte de Bitcoin?

La Serie Mundial de Póquer se asocia con MoonPay para integrar...

Páginas legales

Temas

Selecciones del editor

El costo de la minería de Bitcoin sube a $70,027 por BTC

XRP está imparable en la bolsa de valores

PayPal, emisor de PYUSD, solicita licencia de banco industrial en Utah