Analyzing protein-nanocluster interactions with graph-based machine learning for molecular dynamics
In this work a custom graph convolutional network was succesfully constructed and
trained to predict interaction energies in molecular dynamics simulations between
Au25(SR)18 nanoclusters and BSA proteins based on their physical and chemical
features. Data from molecular dynamics simulations was used as target data in supervised learning. The performance of this model was compared to a feed forward neural
network with Weisfeiler-Lehman updates on graph form data. The energy terms
predicted were the non-bonded Lennard-Jones and Coulombic terms for the force field
used in the simulations. The models were created using the Keras Tensorflow package.
Both neural network architectures showed valid performance and the graph convolutional network based on localised spectral filters on graphs was at least as effective
as the feed forward neural network with Weisfeiler-Lehman updates. The results
show that these machine learning methods could be used in the future to improve
molecular dynamics simulations by creating a better initialization for the simulations.
To get more reliable results and generalise the models a larger data set would be
required.
...
Tässä tutkielmassa tutkittiin vuorovaikutusenergioiden ennustamista Au25(SR)18
nanoklusterien ja BSA-proteiinien välillä kahdella eri neuroverkkoarkkitehtuurilla.
Mallien kouluttaminen toteutettiin nanoklusterien ja proteiinien graafimuotoista
esitystä hyödyntäen. Ennustetut vuorovaikutusenergiatermit olivat Lennard-Jones ja
Coulombinen vuorovaikutusenergia simulaatioissa käytetylle voimakentälle. Ensimmäinen käytetty neuroverkkoarkkitehtuuri oli yksinkertainen eteenpäinsyöttävä malli,
jossa datan esikäsittelyssä käytettiin Weisfeiler-Lehman -päivityksiä graafiesityksen
parantamiseksi. Toinen käytetty koneoppimismalli oli graafikonvoluutioverkko, joka
perustui graafien lokalisoituihin spektraalifilttereihin. Verkot rakennettiin hyödyntämällä Keras Tensorflow -pakettia.
Molempien mallien ennustuksien ja validaatiodatan välinen suhde oli hyvin lineaarinen. Molemmat mallit toimivat siis hyvin vuorovaikutusenergioiden ennustamiseen.
Näiden tulosten pohjalta työssä käytettyä graafineuroverkkoa ja eteenpäinsyöttävää
neuroverkkoa voisi hyödyntää molekyylidynamiikkasimulaatioiden alustamisen parantamiseen tulevaisuudessa. Suurin rajoittava tekijä tutkimuksessa oli käytetyn datan
määrä. Luotettavampien tulosten saamiseksi ja mallien yleistämiseksi vaadittaisiin
suurempi määrä dataa. Datamäärän lisääminen auttaisi luotettavampien johtopäätösten muodostamiseen myös siitä, kumpi neuroverkkoarkkitehtuuri on luotettavampi
ja tehokkaampi vuorovaikutusenergioiden ennustamisessa.
...
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29564]
License
Related items
Showing items with similar title or keywords.
-
Taxonomy-Informed Neural Networks for Smart Manufacturing
Terziyan, Vagan; Vitko, Oleksandra (Elsevier, 2024)A neural network (NN) is known to be an efficient and learnable tool supporting decision-making processes particularly in Industry 4.0. The majority of NNs are data-driven and, therefore, depend on training data quantity ... -
GraphBNC : Machine Learning‐Aided Prediction of Interactions Between Metal Nanoclusters and Blood Proteins
Pihlajamäki, Antti; Matus, María Francisca; Malola, Sami; Häkkinen, Hannu (Wiley-VCH Verlag, 2024)Hybrid nanostructures between biomolecules and inorganic nanomaterials constitute a largely unexplored field of research, with the potential for novel applications in bioimaging, biosensing, and nanomedicine. Developing ... -
Assessment of microalgae species, biomass, and distribution from spectral images using a convolution neural network
Salmi, Pauliina; Calderini, Marco; Pääkkönen, Salli; Taipale, Sami; Pölönen, Ilkka (Springer Science and Business Media LLC, 2022)Effective monitoring of microalgae growth is crucial for environmental observation, while the applications of this monitoring could also be expanded to commercial and research-focused microalgae cultivation. Currently, the ... -
Node co-activations as a means of error detection : Towards fault-tolerant neural networks
Myllyaho, Lalli; Nurminen, Jukka K.; Mikkonen, Tommi (Elsevier, 2022)Context: Machine learning has proved an efficient tool, but the systems need tools to mitigate risks during runtime. One approach is fault tolerance: detecting and handling errors before they cause harm. Objective: This ... -
Quantification of Errors Generated by Uncertain Data in a Linear Boundary Value Problem Using Neural Networks
Halonen, Vilho; Pölönen, Ilkka (Society for Industrial & Applied Mathematics (SIAM), 2023)Quantifying errors caused by indeterminacy in data is currently computationally expensive even in relatively simple PDE problems. Efficient methods could prove very useful in, for example, scientific experiments done with ...