OpenAI ha presentado EVMbench. Esta es una nueva aparejo que permite determinar el desempeΓ±o de los agentes de inteligencia quΓmico en una serie de pruebas (benchmarks) mediante el descubrimiento, modificaciΓ³n y usufructo de contratos inteligentes en Ethereum. La empresa desarrollΓ³ EVMbench en colaboraciΓ³n con Paradigm, una empresa que financia proyectos de redes de criptomonedas.
Los bots OpenAI AI en Ethereum pueden evaluar tres aspectos importantes del protocolo.
eclosiΓ³n, Vulnerabilidad autΓ©ntico detectada en el cΓ³digo extenso de Ethereum Utiliza datos de auditorΓas pΓΊblicas. Luego evaluamos el peligro de vulnerabilidades y auditamos las recompensas para el resto de los desarrolladores de nuestro ecosistema.
NΓΊmero 2, Sugerir parches para solucionar estas vulnerabilidades sin comprometer el funcionamiento del protocolo. “Los agentes deben modificar los contratos vulnerables para eliminar la explotabilidad y al mismo tiempo preservar la funcionalidad prevista. Esto se verifica mediante pruebas automatizadas y controles de explotaciΓ³n”, dijo OpenAI.
Tercero, Simule ataques que aprovechen estas fallas para extraer fondos. Entorno de simulaciΓ³n controlado (salvadera) Seguro. Sin retenciΓ³n, OpenAI aclara que EVMbench “no representa completamente la complejidad de la seguridad de los contratos inteligentes del mundo autΓ©ntico”.
EVMbench utiliza 120 vulnerabilidades del mundo autΓ©ntico extraΓdas de 40 auditorΓas de competencias pΓΊblicas, incluido Code4rena. Las pruebas de rendimiento realizadas hasta ahora muestran que el maniquΓ de agente GPT-5.3-Codex logrΓ³ una tasa de Γ©xito del 72,2% al explotar la equivocaciΓ³n. La tasa de Γ©xito del GPT-5 del maniquΓ preparatorio fue sΓ³lo del 31,9%.
Sin retenciΓ³n, la detecciΓ³n de vulnerabilidades y la aplicaciΓ³n de parches Los resultados del maniquΓ no son muy alentadores.
El rendimiento se degrada para las tareas de descubrimiento y aplicaciΓ³n de parches. Durante la etapa de descubrimiento, el agente puede detenerse a posteriori de identificar un ΓΊnico problema en espacio de auditar exhaustivamente el cΓ³digo almohadilla. Durante la etapa de aplicaciΓ³n de parches, sostener la funcionalidad completa y al mismo tiempo eliminar vulnerabilidades sutiles sigue siendo un desafΓo.
OpenAI, una empresa de inteligencia quΓmico.
ΒΏPor quΓ© es importante EVMbench?
SegΓΊn la compaΓ±Γa, la importancia de esta aparejo de auditorΓa de agentes radica en el hecho de que los contratos inteligentes garantizan asiduamente 100 mil millones de dΓ³lares en criptoactivos interiormente de protocolos de cΓ³digo extenso.
“A medida que los agentes de IA mejoran sus habilidades para interpretar, escribir y ejecutar cΓ³digo, se vuelve cada vez mΓ‘s importante determinar sus capacidades en entornos econΓ³micamente apropiados y fomentar el uso de sistemas de IA de forma defensiva para auditar y hacer cumplir los contratos implementados”, dijo la compaΓ±Γa en un comunicado en la presentaciΓ³n del producto.
Los agentes de OpenAI en Ethereum llegan en un momento en el que los agentes autΓ³nomos avanzan rΓ‘pidamente interiormente del ecosistema de criptoactivos. SegΓΊn informΓ³ CriptoNoticias, estos ya son capaces de interactuar con entornos complejos como Lightning Network. En esta segunda capalos agentes pueden dirigir canales de solvencia e interacciones econΓ³micas con otras IA.
Coinbase ha osado Agentic Wallet, una billetera que permite a los agentes de IA especular en la red Almohadilla sin fertilizar tarifas. Y Phantom, la billetera mΓ‘s popular de Solana, activΓ³ su servidor MCP para permitir que los agentes de IA administren saldos y operen de forma autΓ³noma.
SegΓΊn datos de Token Terminal, el nΓΊmero de transacciones semanales en la red Ethereum alcanzΓ³ los 17,3 millones. Arrebato de transacciones en la red Ocurre a posteriori del emanaciΓ³n de ERC-8004 en agosto de 2025. Es un tipificado que permite “descubrir, separar e interactuar con agentes a travΓ©s de los lΓmites organizacionales sin la requisito de una confianza preexistente” en la crematΓstica abierta de agentes.
(TraducciΓ³n de etiquetas) Anuencia inteligente



