OpenAI ha presentado EVMbench. Esta es una nueva aparejo que permite determinar el desempe帽o de los agentes de inteligencia qu铆mico en una serie de pruebas (benchmarks) mediante el descubrimiento, modificaci贸n y usufructo de contratos inteligentes en Ethereum. La empresa desarroll贸 EVMbench en colaboraci贸n con Paradigm, una empresa que financia proyectos de redes de criptomonedas.
Los bots OpenAI AI en Ethereum pueden evaluar tres aspectos importantes del protocolo.
eclosi贸n, Vulnerabilidad aut茅ntico detectada en el c贸digo extenso de Ethereum Utiliza datos de auditor铆as p煤blicas. Luego evaluamos el peligro de vulnerabilidades y auditamos las recompensas para el resto de los desarrolladores de nuestro ecosistema.
N煤mero 2, Sugerir parches para solucionar estas vulnerabilidades sin comprometer el funcionamiento del protocolo. “Los agentes deben modificar los contratos vulnerables para eliminar la explotabilidad y al mismo tiempo preservar la funcionalidad prevista. Esto se verifica mediante pruebas automatizadas y controles de explotaci贸n”, dijo OpenAI.
Tercero, Simule ataques que aprovechen estas fallas para extraer fondos. Entorno de simulaci贸n controlado (salvadera) Seguro. Sin retenci贸n, OpenAI aclara que EVMbench “no representa completamente la complejidad de la seguridad de los contratos inteligentes del mundo aut茅ntico”.
EVMbench utiliza 120 vulnerabilidades del mundo aut茅ntico extra铆das de 40 auditor铆as de competencias p煤blicas, incluido Code4rena. Las pruebas de rendimiento realizadas hasta ahora muestran que el maniqu铆 de agente GPT-5.3-Codex logr贸 una tasa de 茅xito del 72,2% al explotar la equivocaci贸n. La tasa de 茅xito del GPT-5 del maniqu铆 preparatorio fue s贸lo del 31,9%.
Sin retenci贸n, la detecci贸n de vulnerabilidades y la aplicaci贸n de parches Los resultados del maniqu铆 no son muy alentadores.
El rendimiento se degrada para las tareas de descubrimiento y aplicaci贸n de parches. Durante la etapa de descubrimiento, el agente puede detenerse a posteriori de identificar un 煤nico problema en espacio de auditar exhaustivamente el c贸digo almohadilla. Durante la etapa de aplicaci贸n de parches, sostener la funcionalidad completa y al mismo tiempo eliminar vulnerabilidades sutiles sigue siendo un desaf铆o.
OpenAI, una empresa de inteligencia qu铆mico.
驴Por qu茅 es importante EVMbench?
Seg煤n la compa帽铆a, la importancia de esta aparejo de auditor铆a de agentes radica en el hecho de que los contratos inteligentes garantizan asiduamente 100 mil millones de d贸lares en criptoactivos interiormente de protocolos de c贸digo extenso.
“A medida que los agentes de IA mejoran sus habilidades para interpretar, escribir y ejecutar c贸digo, se vuelve cada vez m谩s importante determinar sus capacidades en entornos econ贸micamente apropiados y fomentar el uso de sistemas de IA de forma defensiva para auditar y hacer cumplir los contratos implementados”, dijo la compa帽铆a en un comunicado en la presentaci贸n del producto.
Los agentes de OpenAI en Ethereum llegan en un momento en el que los agentes aut贸nomos avanzan r谩pidamente interiormente del ecosistema de criptoactivos. Seg煤n inform贸 CriptoNoticias, estos ya son capaces de interactuar con entornos complejos como Lightning Network. En esta segunda capalos agentes pueden dirigir canales de solvencia e interacciones econ贸micas con otras IA.
Coinbase ha osado Agentic Wallet, una billetera que permite a los agentes de IA especular en la red Almohadilla sin fertilizar tarifas. Y Phantom, la billetera m谩s popular de Solana, activ贸 su servidor MCP para permitir que los agentes de IA administren saldos y operen de forma aut贸noma.
Seg煤n datos de Token Terminal, el n煤mero de transacciones semanales en la red Ethereum alcanz贸 los 17,3 millones. Arrebato de transacciones en la red Ocurre a posteriori del emanaci贸n de ERC-8004 en agosto de 2025. Es un tipificado que permite “descubrir, separar e interactuar con agentes a trav茅s de los l铆mites organizacionales sin la requisito de una confianza preexistente” en la cremat铆stica abierta de agentes.
(Traducci贸n de etiquetas) Anuencia inteligente



