Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jorge Bravo Abad
Professor i fysikk @UAM_Madrid | Professor. PI for AI for Materials Lab | Direktør for AI for Materials Lab.
Generativ AI avkoder MOF-strukturer direkte fra røntgendiffraksjonsmønstre
Metall-organiske systemer (MOF-er) er svært nyttige materialer – porøse, justerbare, relevante for alt fra gasslagring til legemiddellevering. Men å identifisere strukturene deres fra pulverrøntgendiffraksjonsdata er fortsatt en flaskehals, spesielt for automatiserte laboratorier hvor du ikke kan la en ekspert tolke hvert mønster manuelt.
Kjerneproblemet: MOF-er kan inneholde hundrevis av atomer arrangert i komplekse tredimensjonale nettverk. Standard tilnærminger til XRD-tolkning sliter med overlappende topper og den enorme strukturelle variasjonen.
Bin Feng, Bingxu Wang og kolleger omformulerer problemet som bildegenerering. Deres modell, Xrd2Mof, behandler XRD-mønstre som tekstprompter og MOF-strukturer som bildene som skal genereres—og anvender deretter Stable Diffusion-arkitekturen for å lære kartleggingen mellom dem.
Den viktigste innsikten er grovkorning. I stedet for å prøve å forutsi hver atomposisjon, representerer de MOF-er som nettverk av metallnoder koblet sammen med linker-sentrasjoner. Dette fungerer fordi de skarpe toppene i XRD-mønstre stort sett kommer fra tungmetallatomer uansett. Å redusere hundrevis av atomer til dusinvis av tilkoblingspunkter komprimerer problemet med en størrelsesorden, samtidig som den strukturelle informasjonen som faktisk betyr noe for diffraksjon, bevares.
Trent på nesten 80 000 MOF-strukturer fra Cambridge Structural Database, oppnår Xrd2Mof over 93 % nøyaktighet i å matche XRD-mønstre med deres riktige strukturer. Den dekker i hovedsak alle kjente rammeverkstopologier og validerer vellykket på eksperimentelle data.
Den praktiske implikasjonen: selvkjørende laboratorier kan nå gå fra rå diffraksjonsdata til rekonstruerte krystallstrukturer uten menneskelig inngripen – en evne som har manglet i automatiserte MOF-oppdagelsespipelines.
Artikkel:

32
Maskinlæring for å forutsi hvilke MOF-er som faktisk kan lages i laboratoriet
Metallorganiske rammeverk (MOF) er blant de mest justerbare materialene som noen gang er laget – porøse krystaller satt sammen av metallnoder og organiske forbindelser, med anvendelser fra gasslagring til katalyse. Beregningsmessig kan vi generere billioner av mulige strukturer. Problemet er at nesten ingen av dem blir syntetisert. Av tusenvis av MOF-screeninger publisert til dags dato, har bare rundt et dusin ført til faktisk laboratoriesyntese, og selv da velger kjemikere ofte «trygge» design som ligner kjente strukturer fremfor de beregningsoptimale.
Andre Niyongabo Rubungo og medforfattere tar tak i denne flaskehalsen med tre ingredienser: (1) MOFMinE, et nykuratert datasett med nesten én million MOF-er med simulerte tøyningsenergier og frie energier for et undersett med 65 000 strukturer; (2) MOFSeq, en sekvensrepresentasjon som koder både lokale funksjoner (SMILES av byggeklosser) og globale funksjoner (topologi og tilkobling); og (3) LLM-Prop, en 35-million-parameter språkmodell forhåndstrent på data om rikelig deformasjon, og deretter finjustert på de dyrere frienergiberegningene.
Resultatene er slående: en gjennomsnittlig absolutt feil på 0,789 kJ/mol, 97 % nøyaktighet i prediksjon av syntesebarhet, og 78 % nøyaktighet i valg av riktig polymorf blant konkurrerende strukturer. Selv når to polymorfer skiller seg med bare 0,16 kJ/mol, velger modellen fortsatt den riktige over 60 % av gangene.
Implikasjonen er praktisk: det som en gang krevde dager med molekylær simulering, går nå fremover gjennom et nevralt nettverk. Dette åpner en vei for rutinemessig filtrering av beregningsmessige MOF-screeninger ved predikert syntesetilgjengelighet – slik at eksperimentelle forskere kan bevege seg utover «intuite» design og inn i uutforskede områder av kjemisk rom, samtidig som sjansene for at det som ser bra ut på datamaskinen faktisk kan lages i laboratoriet.
Artikkel:

54
Komprimere høyereordens nettverk uten å miste det som betyr noe
Mange ekte systemer består ikke bare av parvise lenker. En gruppechat, en medforfattet artikkel, et klasserom eller et biokjemisk kompleks er gruppeinteraksjoner som involverer 3, 4 eller flere enheter samtidig. Hypergrafer er den naturlige måten å modellere dette på: du setter noder for entitetene og "hyperkanter" for hver gruppe, med ett lag for par, et annet for trippeler, et annet for firekanter, og så videre. Fangsten: disse høyere ordens modellene blir raskt enorme, vanskelige å regne med og vanskelige å tolke. Hovedspørsmålet er: hvor mye av den høyere ordens strukturen er egentlig ny informasjon, og hvor mye er bare overflødig med lavere orden? 
Alec Kirkley, Helcio Felippe og Federico Battiston tar for seg dette med et informasjonsteoretisk begrep om strukturell reduserbarhet for hypergrafer. Tenk deg å prøve å sende et helt nettverk av høyere orden over en veldig dyr datalink. Et alternativ er "naivt": send hvert lag (par, trippeler, 4-tupler, ...) uavhengig. Alternativet deres er smartere: send bare et lite sett med "representative" lag, og beskriv de resterende som støyende kopier av disse, kun ved å bruke forskjellene. Jo mer overlappende struktur det er mellom ordener (for eksempel når alle 2- og 3-legeme interaksjoner allerede er implisert av 5-legeme), desto mer kan du komprimere.
De gjør dette om til en normalisert score η mellom 0 (ingen komprimerbarhet) og 1 (perfekt nestet, fullt reduserbar), og en eksplisitt redusert modell som bare beholder de ikke-redundante interaksjonsstørrelsene. Figurene i artikkelen viser enkle eksempler der en firelags hypergraf optimalt kan reduseres til bare to lag samtidig som den essensielle høyere ordens organiseringen fanges. 
De stresstester dette deretter på syntetiske og ekte data. På kontrollerte «nestede» leketøyshypergrafer avtar η jevnt når de tilfører tilfeldighet—og oppfører seg som en bryter fra «perfekt strukturert» til «fullstendig tilfeldig». På reelle systemer (medforfatterskap, kontaktnettverk, e-posttråder, taggingssystemer osv.) viser mange seg å være overraskende komprimerbare: du kan droppe flere hyperedge-ordrer og beholde bare et lite utvalg av lag, men samtidig bevare global tilkobling, fellesskapsstruktur og til og med oppførselen til høyere ordens velgermodelldynamikk på toppen av nettverket. 
Konklusjonen: du trenger ofte ikke den fulle, uhåndterlige høyere ordens beskrivelsen for å studere et komplekst system. Med riktig informasjonsteoretisk linse kan du identifisere hvilke gruppestørrelser som faktisk tilfører ny struktur, bygge en mye mindre hypergraf, og likevel tro fange de kollektive mønstrene og dynamikkene du bryr deg om. 
Artikkel:

99
Topp
Rangering
Favoritter
