Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Química autónoma de molécula única: cuando el aprendizaje por refuerzo profundo rompe enlaces uno a uno
Romper un enlace químico específico en una sola molécula —dejando intactas a sus vecinas— es una de las cosas más difíciles que puedes hacer en química. Una punta STM puede hacerlo inyectando electrones tunelados en una ubicación precisa, pero estos experimentos requieren un experto que ajuste manualmente la posición de la punta, el voltaje de polarización y la corriente en cada intento. Demasiado poco y no pasa nada; Demasiado y destruyes la molécula.
Zhiwen Zhu y sus coautores demuestran ahora una plataforma totalmente autónoma que realiza reacciones selectivas de vínculos en varios pasos sin intervención humana. Su sistema es una porfirina tetrabrominada (TPP-Br₄) sobre Au(111)—cuatro enlaces equivalentes C–Br alrededor de un núcleo de porfirina, disociados secuencialmente a lo largo de vías predefinidas (orto, para, orto*, orto-Z) a través de diferentes intermediarios.
El oleoducto tiene tres etapas. La detección de puntos clave YOLOv7 y la segmentación U-Net localizan moléculas y determinan la orientación. Un clasificador ResNet-18 lee parches alrededor de cada sitio bromo para codificar el estado molecular como un vector binario de 4 bits. Luego, un agente Actor Suave y Crítico Real decide la colocación de la punta, el voltaje y la corriente. El agente interactúa directamente con el STM mediante TCP, manipula, vuelve a escanear y recibe recompensas escalonadas: positivas por la correcta clive de enlace único, negativas por ninguna reacción, activación en el sitio incorrecto o degradación.
Para hacer frente a la escasez de datos—solo 948 eventos en 36 horas—explotan la simetría D₄h de la molécula mediante la repetición de la experiencia con transformadas invariantes, generando trayectorias virtuales equivalentes sin experimentos adicionales.
El agente descubre la física real. El sesgo óptimo aumenta con cada paso de desbrominación (~2,5 V para el primer enlace, ~3,2 V para el último), reflejando la evolución de la estructura electrónica de los intermediarios radicales. Posiciona la punta por encima de los enlaces objetivo, coherente con la desintegración espacial de la excitación electrónica en túnel, y se adapta a los cambios en tiempo real en la condición de la punta. Las tasas de éxito en un solo paso alcanzan el 50–79%, con la finalización completa de cuatro pasos entre el 29 y el 35%, completamente sin supervisión humana.
Desde la perspectiva de la ML, el algoritmo navega por limitaciones extremas: regiones de éxito diminutas, recompensas escasas y ruidosas, entornos no estacionarios y modos de fallo irreversibles. La regularización de entropía de SAC proporciona equilibrio en la exploración, mientras que la repetición aumentada por simetría previene el colapso de políticas.
Esto apunta a agentes de IA que realizan experimentos activamente, aprendiendo protocolos óptimos a partir de la interacción directa con sistemas físicos.
Papel:

Populares
Ranking
Favoritas
