ÍslenskaenEnglish

Aðilar að Skemmunni

Leit eftir:


LokaverkefniHáskólinn í Reykjavík>Tölvunarfræðideild>Lokaverkefni, BSc m/rannsóknaráherslu>

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/9883

Titlar
  • en

    Tagging and parsing a large corpus

  • Mörkun og þáttun stórrar málheildar

Leiðbeinandi
Útgáfa
Maí 2010
Útdrættir
  • en

    This report is a product of a research where we tried to use existing language processing tools on a larger collection of Icelandic sentences than they had faced before. We hit many barriers on the way due to software errors, limitations in the software and due to the corpus we worked with. Unfortunately we had to resort to sidestep some of the problems with hacks but it resulted in a large collection of tagged and parsed sentences. We also managed to produce information regarding the frequency of words which could enhance the precision of current language processing tools.

  • Þessi skýrsla er afurð rannsóknar þar sem reynt er að beita núverandi máltæknitólum á stærra safn af íslenskum setningum en áður hefur verið farið út í. Við rákumst á ýmsar hindranir á leiðinni vegna hugbúnaðarvillna, takmarkana í hugbúnaðnum og vegna safnsins sem við unnum með. Því miður þurftum við að sneiða hjá vandamálunum með ýmsum krókaleiðum en það leiddi til þess að nú er tilbúið stórt safn af mörkuðum og þáttum setningum. Einnig söfnuðum við upplýsingum um tíðni orða sem gætu bætt nákvæmni máltæknitóla.

Athugasemdir

Tölvunarfræði

Birting
30.8.2011


Skrár
NafnRaðanlegtStærðRaðanlegtAðgangurRaðanlegtLýsingRaðanlegtSkráartegund
Research report - ... .pdf225KBOpinn Heildartexti PDF Skoða/Opna

Athugsemd: Ég, sem höfundur skýrslunnar, leyfi ótakmarkaða afritun þessarar skýrslu eins langt og lög leyfa.