is Íslenska en English

Lokaverkefni (Meistara)

Háskólinn í Reykjavík > Tæknisvið / School of Technology > MEd/MPM/MSc Verkfræðideild (áður Tækni- og verkfræðideild) og íþróttafræðideild -2019 / Department of Engineering (was Dep. of Science and Engineering) >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/39406

Titill: 
  • Titill er á ensku Classification of aluminum sample measurements using machine learning
  • Notkun vitvéla við flokkun mæligilda á álsýnum
Námsstig: 
  • Meistara
Útdráttur: 
  • Útdráttur er á ensku

    Uncertainty regarding results of measured chemical components of aluminum samples from the production pots can cause various issues during aluminum manufacturing. Samples that are collected from the production pots can get mixed up at the sampling site, leading to erroneous order of analysis in the laboratory. Values of the analyzed samples are used to fine tune the production. An accurate classification model that can classify sample measurements according to the production pots, could increase the accuracy of the data analysis. The benefit is to return more precise status of the pot condition and improve the production schedule. In this thesis, machine learning methods are used to analyze sample data from production pots at Norðurál. The data comprises of 638.815 sample measurements from the years 2011-2020. One of the main problems with applying such methods to this dataset, is the uncertainty of whether the samples are accurately registered to the correct production pots. Conventional statistical methods are applied to the data to clear out measurements that stand out as outliers. Three machine learning algorithms are then used to construct a multi-class classification models to classify the sample measurements into 520 production pots. The methods that are used are: Decision Tree, Random Forest, and Artificial Neural Network. The results show that it is difficult to achieve good classification accuracy when the number of categories is 520. To improve this, a modified model based on binary classification approach is used. The method uses predicted values for all 520 production pots, and these are classified into two classes (true or false) according to the size of the predicted values. The main conclusion is that the modified binary classification yielded acceptable results.

  • Óvissa í tengslum við niðurstöður efnagreindra álsýna getur valdið ýmsum vandkvæðum við framleiðslu áls. Uppröðun á sýnum sem eru tekin úr framleiðslukerjum geta ruglast á leið sinni yfir á rannsóknarstofu og valdið því að mæligildin eru skráð á röng sýni. Niðurstöður efnagreininga eru m.a. notaðar til að skipuleggja framleiðsluna og fylgjast með ástandi og gæðum álsins í framleiðslukerjunum. Með nákvæmu flokkunarlíkani sem flokkar sýnin niður á framleiðsluker er mögulegt að auka áreiðanleika efnagreininganna, með því að meta líkur á fölskum mæligildum. Ávinningur þess er að veita skýrari mynd af gæðum framleiðslunnar og stuðla að bættu framleiðsluskipulagi. Í þessu verkefni er fjallað um þau úrlausnarefni sem snúa að niðurstöðum efnagreindra álsýna hjá Norðuráli. Gögnin samanstanda af 638.815 mæligildum á álsýnum frá árunum 2011-2020. Eitt helsta vandkvæðið við að beita slíkum aðferðum á gögnin sem eru rannsóknarefni þessa verkefnis, er óvissa um hvort sýnin hafi verið skráð á rétt framleiðsluker. Hefðbundnum tölfræðilegum aðferðum er fyrst beitt á gögnin til þess að hreinsa út mælingar sem eru áberandi útgildi. Þrjár flokkunar aðferðir eru síðan notaðar á gögnin til þess að byggja upp mismunandi stærðfræðileg flokkunarlíkön með því markmiði að flokka sýnin niður á 520 framleiðsluker (e. multi-class classification). Aðferðirnar sem eru notaðar eru; ákvörðunartré (e. Decision Tree), slembi skógur (e. Random forest) og tauganet (e. Artificial Neural Network). Helsta niðurstaðan var að erfitt er að ná góðri flokkunarnákvæmni þegar fjöldi flokka eru 520. Til að bæta úr því var notast við breytt líkan sem byggist á tvenndarflokkun (e. binary classification). Aðferðin byggist á því að spágildi fyrir öll 520 framleiðslukerin eru flokkuð í tennt eftir stærð spágilda. Niðurstaða var að tvenndarflokkunin skilaði ásættanlegri niðurstöðu.

Samþykkt: 
  • 22.6.2021
URI: 
  • http://hdl.handle.net/1946/39406


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
MSC_ErlaGuðmundsdóttir_Spring2021_Skemman.pdf2.37 MBOpinnHeildartextiPDFSkoða/Opna