is Íslenska en English

Lokaverkefni (Meistara)

Háskóli Íslands > Verkfræði- og náttúruvísindasvið > Meistaraprófsritgerðir - Verkfræði- og náttúruvísindasvið >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/44632

Titill: 
  • Rekjanleikavarnir fyrir töflur sem birtar eru fyrir leitandi greiningar
Námsstig: 
  • Meistara
Útdráttur: 
  • Markmið þessa verkefnis var að kanna möguleikann á að birta gögn Hagstofu Íslands um launatekjur á Íslandi eftir bakgrunnsbreytum á borð við starfsgrein, menntun, kyn og aldur. Gögnin yrðu birt í gagnvirku viðmóti þar sem almenningur hefði mikið svigrúm til að búa til samantektartöflur og myndrit að eigin vali. Um leið þyrfti að gera ráðstafanir til rekjanleikavarna (e. statistical diclosure control) þannig að birtingin yrði ekki of upplýsandi um launatekjur einstaklinga. Þá var það liður í verkefninu að taka saman almennt yfirlit yfir aðferðir og álitaefni í rekjanleikavörnum. Afurð verkefnisins er hugbúnaður til þess að útbúa lýsandi töflur fyrir dreifingu einnar samfelldrar útkomubreytu eftir frumbreytum sem geta verið tölulegar breytur, einfaldar flokkabreytur eða flokkabreytur í stigveldiskerfi (e. hierarchy) á borð við ÍSTARF95/ISCO-88 og ÍSMENT2011/ISCED 2011. Hugbúnaðurinn býr til töflur yfir meðaltöl útkomubreytunnar eftir frumbreytum þar sem tölulegum frumbreytum er skipt í misvíð talnabil og mismunandi stig stigveldisskiptra flokkunarkefa eru notuð. Hugbúnaðurinn býr til allar töflur upp í fjölda vídda sem notandi tilgreinir. Þessar töflur eru síðan prófaðar á móti viðmiðum um lágmarksfjölda athugana á bak við hvert meðaltal og lágmarksbreytileika á milli athugana sem notandi tilgreinir. Hugbúnaðurinn skilar lista yfir þær töflur sem standast viðmiðin ásamt lista yfir „bestu“ töflurnar, það er þær töflur með hverri samsetningu af frumbreytum sem innihalda fínskiptustu útgáfuna af hverri frumbreytu.

  • Útdráttur er á ensku

    The aim of this project was to explore the possibility of publishing data describing the distribution of wages and salaries in Iceland by various background variables such as occupation, education, gender and age from Statistics Iceland databases. The data would be published in an interactive data explorer where the public would be able to make various summary tables and plots of their own choosing. At the same time the level of statistical disclosure would have to be controlled so that the data publication would not be excessively informative about the wages or salaries of individual persons. Producing a summary of methods and controversies in statistical disclosure control was also a part of the project. The project resulted in software for producing summary tables describing the distribution of one continuous outcome variable by one or more predictors that can be continuous/numerical or categorical. Categorical variables may be organized in a hierarchical structure, such as ÍSTARF95/ISCO-88 or ÍSMENT2011/ISCED 2011. The software produces tables of means of the outcome variable by the predictors where continuous/numerical variables are divided into bins of various widths and different levels of hierarchically structured categorical variables are used up to a user specified number of dimensions. These tables are tested against user specified privacy criteria, i.e. minimum number of observations behind each mean and minimum variability of the outcome. The software returns a list of tables that meet the criteria along with a list of the "best" tables, i.e. the tables with the finest grained version of each predictor for each combination of predictors.

Samþykkt: 
  • 1.6.2023
URI: 
  • http://hdl.handle.net/1946/44632


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
MAS_HH4.pdf372.11 kBLokaður til...20.06.2028HeildartextiPDF
Adobe Scan 31 May 2023.pdf136.68 kBLokaðurYfirlýsingPDF