Please use this identifier to cite or link to this item: https://hdl.handle.net/1946/28884
This thesis discusses the development of Samba, a software solution designed to identify known verbal expressions in PoS-tagged and lemmatized text. Samba uses a database of verbal expressions which is being developed by Kristín Bjarnadóttir at the Árni Magnússon Institute for Icelandic Studies and which the author contributed to at its inception in the summer of 2015. Samba and the verbal expression database are based on the principle that the entire predicate-argument structure along with any other constituents that form a unit with a verb be included in the analysis of that verb and the unified treatment of simple verbs and more complex verbal expressions. The evaluation of Samba has given positive results, with a usable baseline functionality that was improved significantly during the development process.
Ritgerð þessi fjallar um þróun forritsins Samba, sem hannað hefur verið til að bera kennsl á þekkt sagnarsambönd í mörkuðum og lemmuðum textum. Samba notast við gagnagrunn með sagnarsamböndum sem er í vinnslu hjá Kristínu Bjarnadóttur við Stofnun Árna Magnússonar í íslenskum fræðum og sem höfundur átti þátt í að þróa sem sumarstarfsmaður 2015. Samba og sagnarsambandagrunnurinn byggja á þeirri aðferð að tekið sé tillit til allra rökliða og annarra setningarliða sem sögn myndar einingu með við greiningu hennar og að eins sé farið með greiningu einfaldra sagna og flóknari sagnarsambanda. Samba gaf góða raun, með nothæfri grunnvirkni sem unnt var að bæta enn frekar í þróunarferlinu.
Filename | Size | Visibility | Description | Format | |
---|---|---|---|---|---|
yfirlýsing.JPG | 1.76 MB | Locked | Yfirlýsing | JPG | |
Kristján%20Rúnarsson%20-%20Meistararitgerð%20-%20endanleg%20gerð.pdf | 1.43 MB | Open | Complete Text | View/Open |