OpenAI ha presentado EVMbench. Esta es una nueva aparejo que permite determinar el desempeño de los agentes de inteligencia químico en una serie de pruebas (benchmarks) mediante el descubrimiento, modificación y usufructo de contratos inteligentes en Ethereum. La empresa desarrolló EVMbench en colaboración con Paradigm, una empresa que financia proyectos de redes de criptomonedas.
Los bots OpenAI AI en Ethereum pueden evaluar tres aspectos importantes del protocolo.
eclosión, Vulnerabilidad auténtico detectada en el código extenso de Ethereum Utiliza datos de auditorías públicas. Luego evaluamos el peligro de vulnerabilidades y auditamos las recompensas para el resto de los desarrolladores de nuestro ecosistema.
Número 2, Sugerir parches para solucionar estas vulnerabilidades sin comprometer el funcionamiento del protocolo. “Los agentes deben modificar los contratos vulnerables para eliminar la explotabilidad y al mismo tiempo preservar la funcionalidad prevista. Esto se verifica mediante pruebas automatizadas y controles de explotación”, dijo OpenAI.
Tercero, Simule ataques que aprovechen estas fallas para extraer fondos. Entorno de simulación controlado (salvadera) Seguro. Sin retención, OpenAI aclara que EVMbench “no representa completamente la complejidad de la seguridad de los contratos inteligentes del mundo auténtico”.
EVMbench utiliza 120 vulnerabilidades del mundo auténtico extraídas de 40 auditorías de competencias públicas, incluido Code4rena. Las pruebas de rendimiento realizadas hasta ahora muestran que el maniquí de agente GPT-5.3-Codex logró una tasa de éxito del 72,2% al explotar la equivocación. La tasa de éxito del GPT-5 del maniquí preparatorio fue sólo del 31,9%.
Sin retención, la detección de vulnerabilidades y la aplicación de parches Los resultados del maniquí no son muy alentadores.
El rendimiento se degrada para las tareas de descubrimiento y aplicación de parches. Durante la etapa de descubrimiento, el agente puede detenerse a posteriori de identificar un único problema en espacio de auditar exhaustivamente el código almohadilla. Durante la etapa de aplicación de parches, sostener la funcionalidad completa y al mismo tiempo eliminar vulnerabilidades sutiles sigue siendo un desafío.
OpenAI, una empresa de inteligencia químico.
¿Por qué es importante EVMbench?
Según la compañía, la importancia de esta aparejo de auditoría de agentes radica en el hecho de que los contratos inteligentes garantizan asiduamente 100 mil millones de dólares en criptoactivos interiormente de protocolos de código extenso.
“A medida que los agentes de IA mejoran sus habilidades para interpretar, escribir y ejecutar código, se vuelve cada vez más importante determinar sus capacidades en entornos económicamente apropiados y fomentar el uso de sistemas de IA de forma defensiva para auditar y hacer cumplir los contratos implementados”, dijo la compañía en un comunicado en la presentación del producto.
Los agentes de OpenAI en Ethereum llegan en un momento en el que los agentes autónomos avanzan rápidamente interiormente del ecosistema de criptoactivos. Según informó CriptoNoticias, estos ya son capaces de interactuar con entornos complejos como Lightning Network. En esta segunda capalos agentes pueden dirigir canales de solvencia e interacciones económicas con otras IA.
Coinbase ha osado Agentic Wallet, una billetera que permite a los agentes de IA especular en la red Almohadilla sin fertilizar tarifas. Y Phantom, la billetera más popular de Solana, activó su servidor MCP para permitir que los agentes de IA administren saldos y operen de forma autónoma.
Según datos de Token Terminal, el número de transacciones semanales en la red Ethereum alcanzó los 17,3 millones. Arrebato de transacciones en la red Ocurre a posteriori del emanación de ERC-8004 en agosto de 2025. Es un tipificado que permite “descubrir, separar e interactuar con agentes a través de los límites organizacionales sin la requisito de una confianza preexistente” en la crematística abierta de agentes.
(Traducción de etiquetas) Anuencia inteligente



