is Íslenska en English

Lokaverkefni (Meistara)

Háskólinn í Reykjavík > Tæknisvið / School of Technology > MEd/MPM/MSc Verkfræðideild (áður Tækni- og verkfræðideild) og íþróttafræðideild -2019 / Department of Engineering (was Dep. of Science and Engineering) >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/39458

Titill: 
  • Titill er á ensku Optimization of two-level classification trees
  • Bestunaraðferðir tveggja þrepa ákvarðanatrjáa
Námsstig: 
  • Meistara
Útdráttur: 
  • Útdráttur er á ensku

    As technology advances, the emphasis on artificial intelligence (AI), machine learning (ML), and data mining becomes ever more important. Decision trees, a predictive model for both classification and regression, created with AI and ML tend to create each split without any regard to other splits and risk therefore ignoring an important feature or an ensemble of features of the data set which might be beneficial for current or future splits. By employing a pure optimization model which solves the entire decision tree in one run and with information on all other splits made, a comparison is made with two of the most state-of-the-art ML and AI decision tree models available today, the Classification and Regression Tree (CART) model and the Random Forest (RF) model. Two types of optimization models are used for comparison, one univariate model and one multivariate model with the maximum depth of two levels. The comparison is based on both open source data sets, the Iris data set, the Wine data set, and the Breast Cancer data set, as well as Icelandic data sets provided by the University of Reykjavik on the overall academic result of engineering students, the author's prior research on ethical decision making in management, and an Icelandic research on the health and life quality of senior citizens. The results will be followed by a discussion on fairness and efficiency in optimization models as well as the benefits of simplicity and clarity when employing them.

  • Á tímum mikillar tækniþróunar og -nýjunga hefur æ ríkari þungi verið lagður á gervigreind og gagnanám í úrlausnum og greiningum. Ákvarðanatré sem byggð eru með gervigreind og vitvélum hafa til þessa einungis ákvarðað kvíslanir eða skiptingu gagna án þess að taka tillit til fyrri eða annarra skiptinga í trénu. Slíkt getur leitt til þess að mikilvægir eiginleikar gagnasettsins fari forgörðum eða sé alfarið virt að vettugi. Með beitingu bestunarlíkans á ákvarðanatré er fýsileg lausn fundin með því að skoða allar kvíslanir í sömu andrá. Verkefni þetta hefur að markmiði að bera saman tveggja þrepa ákvarðanatré, byggð á slíkum bestunarlíkönum, við tvö fremstu líkön ákvarðanatrjáa sem byggja á gervigreind og vitvélum, annars vegar CART-líkanið og hins vegar Random Forest-líkanið. Tvær tegundir bestunarlíkana verða settar fram þar sem önnur byggir sérhverja kvíslun á einungis einum eiginleika gagnasetts en hin leyfir einum eða fleiri eiginleikum að hafa áhrif á kvíslun hverju sinni. Samanburðurinn byggir í senn á vel þekktum, opinberum gagnasettum sem og íslenskum gagnasettum sem fengin eru frá Háskóla Reykjavíkur um námsárangur verkfræðinema, rannsókn höfundar á siðferðislega ákvarðanatöku í rekstri auk íslenskrar rannsóknar á heilsu og lífsgæði aldraðs fólks. Í lokin verður umræða um réttlæti og hagnýtingu bestunarlíkana við lausn ákvarðanatrjáa með hliðsjón af flækjustigi þeirra og skýrleika.

Samþykkt: 
  • 24.6.2021
URI: 
  • http://hdl.handle.net/1946/39458


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
Master_Thesis_Heidar_Jonasson.pdf1.06 MBOpinnHeildartextiPDFSkoða/Opna