Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Chimia autonomă a unei molecule: când învățarea prin întărire profundă rupe legăturile una câte una
Ruperea unei legături chimice specifice într-o singură moleculă — lăsând vecinii neatinși — este unul dintre cele mai dificile lucruri pe care le poți face în chimie. Un vârf STM poate face acest lucru injectând electroni tunelați într-o locație precisă, dar aceste experimente necesită un expert care ajustează manual poziția vârfului, tensiunea de polarizare și curentul pentru fiecare încercare. Prea puțin și nu se întâmplă nimic; Prea mult și distrugi molecula.
Zhiwen Zhu și coautorii demonstrează acum o platformă complet autonomă care realizează reacții selective în mai mulți pași, fără intervenție umană. Sistemul lor este o porfirină tetrabrominată (TPP-Br₄) pe Au(111) — patru legături C–Br echivalente în jurul unui nucleu de porfirină, disociate secvențial de-a lungul unor căi predefinite (orto, para, orto*, orto-Z) prin diferiți intermediari.
Conducta are trei etape. Detectarea punctelor cheie YOLOv7 și segmentarea U-Net localizează moleculele și determină orientarea. Un clasificator ResNet-18 citește patch-uri din jurul fiecărui sit brom pentru a codifica starea moleculară ca un vector binar pe 4 biți. Apoi, un agent Soft Actor-Critic RL decide poziționarea vârfului, tensiunea și curentul. Agentul interacționează direct cu STM prin TCP, manipulează, rescanează și primește recompense pe niveluri—pozitive pentru clivag corect al legăturii simple, negative pentru lipsă de reacție, activare la locul greșit sau degradare.
Pentru a face față penuriei de date—doar 948 de evenimente în 36 de ore—ei exploatează simetria D₄h a moleculei prin reluarea experienței prin transformare invariantă, generând traiectorii virtuale echivalente fără experimente suplimentare.
Agentul descoperă fizica reală. Polarizarea optimă crește cu fiecare pas de debrominare (~2,5 V pentru prima legătură, ~3,2 V pentru ultima), reflectând structura electronică în evoluție a intermediarilor radicali. Poziționează vârful deasupra legăturilor țintă, în concordanță cu dezintegrarea spațială a excitației electronice de tunelare și se adaptează la schimbările de condiție ale vârfului în timp real. Ratele de succes pe un singur pas ajung la 50–79%, cu finalizarea completă a celor patru pași la 29–35% — complet fără îndrumare umană.
Din perspectiva ML, algoritmul navighează constrângeri extreme: regiuni de succes foarte mici, recompense zgomotoase și rare, medii nestaționare și moduri de defectare ireversibile. Regularizarea entropiei din SAC oferă echilibru în explorare, în timp ce rejucarea augmentată de simetrie previne prăbușirea politicilor.
Acest lucru indică agenții AI care desfășoară activ experimente, învățând protocoale optime din interacțiunea directă cu sistemele fizice.
Hârtie:

Limită superioară
Clasament
Favorite
