is Íslenska en English

Lokaverkefni (Meistara)

Háskóli Íslands > Hugvísindasvið > Meistaraprófsritgerðir - Hugvísindasvið >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: https://hdl.handle.net/1946/21059

Titill: 
  • Titill er á ensku Isolated Word Recognition for Icelandic: A Machine Learning Investigation into Word Modelling
Námsstig: 
  • Meistara
Höfundur: 
Útdráttur: 
  • Þróun tækni gegnir sífellt mikilvægara hlutverki í lífi okkar allra og mikil aukning er á því að nota þessa tækni til þess að hafa samskipti við aðra. Miklar breytingar hafa orðið á því hvernig við notum tækni, en áður fyrr var handvirkur innsláttur algengari hjá notendum, en nú er mikið meira um að tækni sé stjórnað með töluðu máli. Þetta getur valdið vandræðum hjá málhöfum smærri tungumála, en þeir gætu átt í erfiðleikum með að þróa sams konar tækni í takt við þjóðir á heimsmælikvarða. Mikilvægt er að eiga kost á að nota sitt eigið tungumál við notkun nýrra tækja í stað þess að neyðast til að nota alþjóðlegt samskiptamál. Þessi ritgerð hefur það að markmiði að kanna hvort hægt sé að búa til einstaklingsbundið stakorðagreiningarkerfi sem er þjálfað á örfáum þjálfunardæmum. Athyglisvert er að benda á að mörg þeirra dæma eru beygingarmyndir tiltekins flettiorðs og eru þar af leiðandi af mjög svipaðri gerð. Gert er ráð fyrir því að einhvers konar talstjórnuð reiknivél muni nýta svona kerfi. Mismunandi aðferðir í vélanámi eru kannaðar í því skyni til að ákvarða hversu mikla nákvæmni þessar aðferðir bjóða upp á þegar orðaforðinn samanstendur af orðum sem eru mjög svipuð að gerð. Sýnt verður fram á að einfaldar framkvæmdir tiltölulega flókinna vélanámsreiknirita, eða hulinna Markov-líkana og gervitauganeta, geti spáð fyrir réttri flokkun nýrra orða upp að meira en 92% nákvæmni. Þessar niðurstöður sýna að frekari rannsókn hefur að geyma mjög áhugaverða framtíðarmöguleika og gæti hugsanlega verið undirstaðan að mörgum raddstýrðum notendaviðmótum sem eru nú þegar til staðar í mörgum tækjum og að notkun þess mun eflaust fjölga mjög mikið í framtíðinni.

  • Útdráttur er á ensku

    As technological advancements play an ever-increasingly important role in the daily lives of people and how they interact with the world via technology, the means by which interactions are taking place are gradually moving from a more manual system to a more vocal one. This poses a specific problem for languages with relatively few speakers, like Icelandic, who need to keep up with advancements elsewhere in the
    world so that speakers have the choice to be able to use their native language in new technologies and are not forced to adopt a lingua franca in place of their native language. This paper aims to explore how a speaker-dependent isolated word recognition system might be implemented with only limited training data, with specific consideration to the problem of phonetically similar vocabulary items that arise from
    Icelandic’s case system. A theoretical goal of a speech-driven calculator is adopted and various machine learning techniques are investigated to determine what kind of accuracy can be expected when modelling a non-trivial amount of phonetically-similar words. It will be shown that simple implementations of relatively advanced machine learning algorithms, namely Hidden Markov Models and Artificial Neural Networks, can easily correctly predict previously-unseen word recordings at a level higher than 92% accuracy. These results show that further research has a lot of potential to expand the scope of such an isolated word recognition system and could provide the basis for a technology that could be used in a diverse range of automated voice interfaces
    which are available in many technologies in the modern world already and whose predominance in society will only become more prevalent in the future.

Samþykkt: 
  • 5.5.2015
URI: 
  • http://hdl.handle.net/1946/21059


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
Isolated Word Recognition for Icelandic.pdf1,76 MBOpinnHeildartextiPDFSkoða/Opna