is Íslenska en English

Lokaverkefni (Meistara)

Háskóli Íslands > Hugvísindasvið > Meistaraprófsritgerðir - Hugvísindasvið >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/29474

Titill: 
 • Þjálfun málfræðimarkarans Stagger með nýjum gullstaðli
Námsstig: 
 • Meistara
Leiðbeinandi: 
Efnisorð: 
Útdráttur: 
 • Til grundvallar mörgum máltækniverkefnum liggur málfræðimörkun. Nákvæmni mörkunar íslenskra texta er enn fremur lág meðal annars vegna þess hver ríkt tungumálið er af beygingum og vegna smæðar þeirrar mörkuðu málheildar, eða gullstaðals, sem til umráða er. Nýverið leit dagsins ljós nýr gullstaðall sem er tvöfalt stærri en sá sem fyrir var. Því þótti vert að leita svara við því hvort og þá hversu mikið mörkunarnákvæmni ykist þegar Stagger, sá gagnagmarkari sem mestri nákvæmni hefur náð hingað til við mörkun íslenskra texta, væri þjálfaður á honum. Einnig var kannað hvort mikill munur væri á nákvæmni mörkunar á ólíkum textategundum.
  Flestar fyrri tilraunir til mörkunar íslenskra texta hafa falið í sér að mismunandi markarar eru þjálfaðir á gamla gullstaðlinum sem er bæði minni og mun einsleitari en sá nýi. Einsleitni hans hefur einnig gert allar tilraunir á mörkun ólíkra textategunda erfiðar. Í ljósi þess að nýi gullstaðallin er mun fjölbreyttari að gerð en sá eldri ættu þvílíkar tilraunir að verða auðveldari og marktækari.
  Framkvæmdar voru krossprófanir á gamla og nýja gullstaðlinum sem og með báðum gullstöðlunum skeyttum saman í einn. Einnig voru mörkunartilraunir framkvæmdar þar sem einni textategund fyrir sig var haldið utan við þjálfunarsafnið og markarinn svo látinn marka viðkomandi textategund. Að endingu var Stagger þjálfaður á mismunandi gullstöðlum (þeim gamla, nýja og báðum saman) og látinn marka fjögur ólík textasöfn sem ekki tilheyrðu neinum gullstaðlanna.
  Niðurstöður leiddu í ljós að þótt krossprófun á gamla gullstaðlinum skilaði mestri nákvæmni þá náði Stagger mestri nákvæmni við mörkun texta sem ekki voru hluti af gullstöðlunum þegar hann var þjálfaður á samskeytta gullstaðlinum. Enda er samanburður á krossprófunum milli ólíkra gullstaðla ekki marktækur þar sem samsetning þess texta sem er markaður hefur alveg jafn mikið um niðurstöðurnar að segja og samsetning þess texta sem notaður er við þjálfun. Einsleitni gamla gullstaðalsins gerir mörkun hans því auðveldari en um leið veldur hún því að markari sem þjálfaður er á honum ræður illa við ólíkar textategundir. Mörkun mismunandi textategunda leiddi í ljós að töluverður munur er á mörkunarnákvæmni á milli tegunda og lækkar heildarnákvæmnin þegar textategundum er markvisst haldið utan við þjálfunarsafnið við krossprófun. Það er því skref fram á við að hafa nú undir höndum stærri og fjölbreyttari gullstaðal sem gerir mörkurum kleift að ráða betur við mörkun mismunandi textategunda.

Samþykkt: 
 • 23.1.2018
URI: 
 • http://hdl.handle.net/1946/29474


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
Starkaður Barkarson-2.pdf1.25 MBOpinnHeildartextiPDFSkoða/Opna
Yfirlýsing.pdf465.88 kBLokaðurYfirlýsing um meðferðPDF