Blogi

Molekulaartehnoloogia õppetool

Vihmaussides pestitsiidide tasakaalustamata andmetel reproduktiivtoksilisuse ennustav modelleerimine rakendades masinõppe tulemusi tõlgendatavaid tehnikaid

Uko Maran

Vihmaussidel on tähtis roll mullaviljakuse säilitamisel, vee- ja õhutus-süsteemide moodustumisel ja püsimisel. See teeb vihmaussist mulla ökosüsteemide põhilise indikaatororganismi. See omakorda muudab vihmaussides keemiliste ühendite (näiteks pestitsiidide) reproduktiivtoksilisuse huvipakkuvaks omaduseks ja selle omaduse arvutusmudelid vajalikuks kemikaalide mõju kirjeldamisel ja vastava omaduse ennustamiseks. Seetõttu oli käesoleva uurimuse eesmärk välja töötada kvantitatiivse struktuuri-aktiivsus sõltuvus ja selle tuletamise viis, mis annaks piisavalt hea tulemuse tasakaalustamata eksperimendi andmete korral. Koostatud originaalne modelleerimis viis integreeris gradiendi abil võimendatud otsustuspuud klassifikaatoritena koos geneetilise algoritmiga molekulaartunnuste valimiseks ja Bayesi optimeerimisega hüperparameetrite häälestamiseks. Täiendav eesmärk oli analüüsida ja tõlgendada SHAP väärtusi kasutades molekulaarsete sturktuuritunnuste poolt kodeeritud struktuurseid muutusi andmete seerias, mis aitavad kirjeldada pestitsiidide toksilisuse ja mittetoksilisuse põhjuseid lähtudes keemiliste ühendite struktuurist. Struktuuri-tunnustest kõige tähelepanuväärsemad on solvatatsioonientroopia ja hüdrolüüsitavte sidemete arv. Lõplik arvutusmudel konstrueeriti virnastatud mudelite ansamblina ja ühendas üksikute mudelite tugevad küljed. Mudeli valideerimine 147 ühendist koosneva välise testikomplektiga näitas täpselt määratletud mudeli rakenduspiirkonda ja piisavat ennustamisvõimet tasakaalustatud täpsusega 77%. Mudeli esitus järgib FAIR (leitavuse, kättesaadavuse, ühilduvuse, taaskasutatavuse) põhimõtteid ja on saadaval QsarDB.org andmehoidlas.

Artikkel: https://doi.org/10.1021/acsomega.4c09719

FAIR andmed ja mudelid: http://dx.doi.org/10.15152/QDB.263