is Íslenska en English

Lokaverkefni (Meistara)

Háskólinn í Reykjavík > Tæknisvið / School of Technology > MSc Tölvunarfræðideild / Department of Computer Science >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: https://hdl.handle.net/1946/43308

Titill: 
  • Titill er á ensku Imbalanced learning in AML
  • Vélrænt gagnanám á ójöfnum gögnum úr AML kerfi
Námsstig: 
  • Meistara
Leiðbeinandi: 
Útdráttur: 
  • Útdráttur er á ensku

    AML (Anti Money Laundering) systems monitor the financial behavior of individuals, companies, and organizations to detect illegal activities. The use of machine-learning techniques has proved useful in such systems, but specialised approaches are required for handling highly unbalanced datasets; that is, the ratio of the number of illegal samples to overall samples is low. In this research project, we analyse data from an AML system of an Icelandic financial institution intending to make the system more effective. First and foremost, the emphasis will be on reducing the number of false alarms, the cases where the system flags something legitimate as suspicious activity, however, without affecting the system's ability to detect illegal activities. A secondary goal is to better characterise the transaction patterns that constitute suspicious activities. We used classification methods to build models for predicting suspicious activities, and the result was then further analysed, e.g., using principal component analysis. The main result is that project's primary goal of reducing the number of false alarms was successfully met, and those classification methods that use under-sampling work best. However, the secondary objective of better characterising what constitutes suspicious activities was only partially fulfilled.

  • AML (Anti Money Laundering) kerfi fylgjast með fjárhagslegri hegðun einstaklinga, fyrirtækja og stofnana með það markmið að greina ólöglega starfsemi. Notkun á vélrænu gagnanámi hefur reynst vel til að betrumbæta slík kerfi, en þó þarf að taka sérstaklega tillit til þess að gögnin sem á að flokka eru einsleit, þ.e. hlutfall raunverulegra ólögmætra færsla er mjög lágt miðað við heildarfjölda færslna. Í þessu rannsóknarverkefni greinum við gögn úr AML kerfi íslenskrar fjálmálastofuar með það að markmiði að gera kerfið skilvirkara. Annarsvegar, og fyrst og fremst, er lögð áhersla á að fækka þeim tilvikum þar sem kerfið flaggar grunsamlega hegðuð, sem í raun á sér eðlilegar skýringar, án þess þó að fórna hæfni þess til að greina eiginlegan peningaþvott. Hinsvegar, er leitast við fá aukið innsæi inn í hverskonar mynstur einkenna peningaþvott. Í verkefninu er notast við líkön sem nýta sér vélrænar flokkunaraðferðir, þar sem sérstaklega er tekið tillit til einsleitni gagna, og niðurstaðan svo frekar greind með m.a. meiginhlutagreininu. Helstu niðurstöðurnar eru að aðalmarkmið verkefnisins náðist, og að líkön sem notast við vansýnatöku (e. undersampling) virkuðu best í þeim tilgangi. Við náðum einnig, að hluta, að auka innsýn okkar inn í hvaða mynstur einkenna peningaþvott, þó svo að við hefðum viljað ná frekar árangri þar.

Samþykkt: 
  • 19.1.2023
URI: 
  • http://hdl.handle.net/1946/43308


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
MSc_thesis.pdf4.61 MBLokaður til...06.01.2028HeildartextiPDF
yngvi_2023-01-09_10-43-21.pdf245.3 kBOpinnFylgiskjölPDFSkoða/Opna
astahr_2023-01-12_10-44-27.pdf435.32 kBOpinnBeiðni um lokunPDFSkoða/Opna

Athugsemd: Ritgerð er læst í fimm ár, frá 01/23 - 01/28. Undirritun fyrir beiðni á læsingu fylgir hér með sem sér skjal með nafni: "astahr_2023-01-12_10-44-27.pdf". Skjalið "yngvi_2023-01-09_10-43-21.pdf" inniheldur undirskriftir sem staðfestir samþykki nefndar á vörn og ritgerð.