is Íslenska en English

Lokaverkefni (Meistara)

Háskóli Íslands > Verkfræði- og náttúruvísindasvið > Meistaraprófsritgerðir - Verkfræði- og náttúruvísindasvið >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/41511

Titill: 
  • Titill er á ensku Distributed Deep Learning for Surface Soil Moisture Estimations
Námsstig: 
  • Meistara
Efnisorð: 
Útdráttur: 
  • Útdráttur er á ensku

    Soil Moisture Content (SMC) is of importance in many scientific and business environments. Accurate SMC estimations can be vital to crop yield and may have important implications for ecology, wildlife, and public health. In this thesis, multiple datasets were analyzed, pre-processing of the data was performed, and multiple Neural Network (NN) models for SMC estimation were developed, modeled, and evaluated. High-Performance Computing (HPC) systems were utilized to perform hyperparameter tuning at scale, running on multiple Central Processing Units (CPUs) and Graphics Processing Units (GPUs) simultaneously. The business partner for this project already has operational Machine Learning (ML) models for SMC estimation. The goal of the project was to firstly reproduce their current best-performing model, then develop new NN models that have the potential to offer more accuracy than the Random Forest (RF) model currently in use. Apart from that goal, the thesis also involved speeding up the learning process using HPC and to find the right hyperparameter setup for different ML models. The results show that various NN models provide increased accuracy over the RF model. The training time of many of these models is however longer than when training the RF model, but the NN models are more scalable for future use with increased accuracy expectations. The thesis code runs in the Jupyter notebook environment which enables interoperability between cloud solutions, allowing code to be run on various HPC systems with minimal changes needed.

  • Þekking á rakastigi jarðvegs er mikilvæg á mörgum sviðum vísinda og viðskipta. Nákvæmt mat á rakastigi jarðvegs getur gagnast í landbúnaði og hjálpað til við hámörkun uppskeru, ásamt því að veita mikilvægar upplýsingar á sviði dýralífs, vistfræði og lýðheilsu. Í þessari ritgerð var lagt mat á mörg gagnasöfn, forvinnsla framkvæmd á gögnunum og margvísleg gervigreindarlíkön byggð á tauganetum voru þróuð og metin í því að áætla rakastig jarðvegs. Ofurtölvur voru notaðar til að framkvæma val hástika þar sem keyrslur notuðu fjölda miðlægra (CPU) og grafískra vinnslueininga (GPU) samtímis. Samstarfsaðilinn í þessu verkefni hefur nú þegar starfhæf gervigreindarlíkön fyrir mat á rakastigi jarðvegs. Markmið verkefnisins var í fyrsta lagi að endurskapa þeirra besta líkan til þessa, svo að þróa ný líkön sem geta mögulega skilað meiri nákvæmni en Random Forest (RF) líkanið sem nú er í notkun. Auk þess var einnig rannsakað hvernig mætti hraða lærdómsferlinu með notkun ofurtölva og finna réttu hástikana fyrir hin ýmsu gervigreindarlíkön. Niðurstöður sýna að ýmis gervigreindarlíkön veita aukna nákvæmni umfram RF líkanið. Þjálfunartími margra þessara líkana er lengri en þegar RF líkanið er þjálfað, en tauganet eru skalanlegri og eru vænlegri til að skila aukinni nákvæmni. Frumkóði verkefnisins keyrir í Jupyter notebook umhverfi sem tryggir samvirkni á milli skýjalausna, þar sem keyra má kóða á ýmsum ofurtölvum með minni háttar breytingum.

Samþykkt: 
  • 2.6.2022
URI: 
  • http://hdl.handle.net/1946/41511


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
M_Sc__thesis_Thor_Curtis.pdf2.28 MBLokaður til...26.06.2027HeildartextiPDF
Scan2022-06-02_104229.pdf607.6 kBLokaðurYfirlýsingPDF