Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: https://hdl.handle.net/1946/50796
Zebrafish have gained increasing popularity as a model organism for their genetic similarity to humans, high-throughput, and compatibility with gene editing tools such as CRISPR. This thesis focuses on the challenge of classifying ADHD-like behavioral phenotypes in zebrafish, a task that traditionally relies on manual observations and basic statistical analysis. This approach can be subjective, inefficient, and unable to capture subtle and complex behavioral patterns.
To solve this issue, this thesis employees an automated machine learning classification framework using behavioral data collected with high-resolution video-tracking. The dataset includes both manually engineered features and raw time-series data from zebrafish with homozygous deficiency in the adgrl3.1 gene, which is an ortholog of the human ADGRL3 gene linked to cause ADHD. In the thesis multiple supervised learning models were implemented and evaluated, this included Decision Tree, Random Forest, Extrerme Gradient Boost (XGBoost), and a deep learning 1D Convolutional Neural Network (CNN).
The results showed that the CNN achieved the highest classification performance across all metrics when trained directly on the raw time-series data. The ensemble models (Random Forest and XGBoost) also performed well when trained on the engineered features. Statistical and feature importance analysis showed that behavioral features such as average velocity, movement bursts, and ambulatory time were elevated for the mutant group, a strong indicator of ADHD-like behavior.
This study highlights the potential of using machine learning as an effective and scalable tool for behavioral phenotyping in biomedical research and offers an automatic and objective method, which could help greatly in phenotype research and drug discovery tasks.
Sebrafiskar hafa öðlast sífellt meiri vinsældir sem líkanlífvera í lífvísindum, meðal annars vegna erfðafræðilegra líkinda þeirra við menn, mikillar afkastagetu og samhæfni við erfðabreytingartól eins og CRISPR. Þessi ritgerð tæklar áskorun á flokkun ADHD tengdra atferliseinkenna í sebrafiskum, verkefni sem hefur almennt verið byggt á handvirkum athugunum og einfaldri tölfræðilegri greiningu.
Slíkar aðferðir eru oft huglægar, tímafrekar og ná illa að fanga fínleg og flókin atferlismynstur. Til að leysa þetta vandamál, var þróað sjálfvirkt flokkunarkerfi byggt á vélrænu námi, sem vinnur með atferlisgögn fengin úr háupplausnar myndbandsrakningu. Gagnasettið innihélt bæði sérhannaða eiginleika (e. Features) og hrá tímaröðugögn frá sebrafiskum sem hafa stökkbreytingu á adgrl3.1 geninu, sem er samsvarandi geninu ADGRL3 í mönnum en það hefur verið tengt við ADHD.
Í rannsókninni voru prófuð og metin mörg mismunandi líkön í yfirflokki í stýrðu námi (e. supervised learning), þar á meðal ákvörðunartré (Decision Tree), Random Forest, Extreme Gradient Boosting (XGBoost) og djúptaugakerfi sem kallast Convolutional Neural Network (CNN). Niðurstöður sýndu að CNN líkanið náði bestu
flokkunarnákvæmni á öllum mælikvörðum þegar það var þjálfað beint á hráum tímaröðugögnum. Samsettu líkönin (Random Forest og XGBoost) skiluðu einnig góðri frammistöðu þegar þau voru þjálfuð á sérhönnuðum atferliseinkennum (e.behavioral features). Tölfræðileg greining og mikilvægi einkenna frá líkönum sýndu að hegðunarmynstur á borð við meðalhraða, hreyfiskor og virkan hreyfitíma voru
marktækt hærri hjá stökkbreyttum fiski, sem er ADHD-lík hegðun. Þessi rannsókn sýnir að vélrænt nám hefur mikla möguleika sem árangursríkt og mælanlegt tól við flokkun atferliseinkenna í líf- og læknavísindum og býður upp á sjálfvirka og hlutlæga aðferð sem gæti gagnast verulega í rannsóknum á svipgerðum og við
þróun nýrra lyfja.
Skráarnafn | Stærð | Aðgangur | Lýsing | Skráartegund | |
---|---|---|---|---|---|
MScThesisBaldurOlsen2025.pdf | 5,49 MB | Opinn | Heildartexti | Skoða/Opna |