Laskennallinen mallintaminen visuaalisen huomion analyysiin

Väitöstilaisuuden tiedot

Väitöstilaisuuden päivämäärä ja aika

Väitöstilaisuuden paikka

Etäyhteys: https://oulu.zoom.us/j/69133800918?pwd=MEVuVWo2TXVPMjNvRm9mYmNQejlRZz09

Väitöksen aihe

Laskennallinen mallintaminen visuaalisen huomion analyysiin

Väittelijä

Diplomi-insinööri Yingyue Xu

Tiedekunta ja yksikkö

Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Konenäön ja signaalianalyysin tutkimuskeskus (CMVS)

Oppiaine

Tietotekniikka

Vastaväittäjä

Filosofian tohtori (sähkötekniikka) Moncef Gabbouj, Tampereen yliopisto

Kustos

Filosofian tohtori (tietokonetekniikka) Guoying Zhao, Oulun yliopisto

Lisää tapahtuma kalenteriin

Laskennallinen mallintaminen visuaalisen huomion analyysiin

Kuvat sisältävät tyypillisesti valtavan määrän informaatiota, jota ei pystytä prosessoimaan lyhyessä ajassa ihmisen näköjärjestelmän rajoitetun prosessointi kapasiteetin takia. Termi "visuaalinen huomio" on biologian ja psykologian motivoima mekanismi, joka toimii valiten oleellisen informaation ja suodattaen ylimääräisen informaation. Mallinnettaessa huomiomekanismia konenäön käyttöön on olennaista, että laskennallinen malli visuaaliselle huomiolle ehdottaa tärkeät alueet kuvista, jotka ihmisen näköjärjestelmä on nähnyt.

Tämä väitöskirja on perusteellinen yhteenveto tärkeimmistä osa-alueista liittyen visuaalisen huomion analyysin laskennalliseen mallintamiseen, koostuen useasta julkaisusta. Ensimmäiseksi esittelemme datan esikäsittelyn laskennallista mallia varten ottaen mukaan silmänliikedatan, silmänjäljitysdatan keräämisen ja silmänjäljitystietokantojen hyödyntämisen visuaalisen huomion laskennallisen mallien evaluoinnissa. Toiseksi laskennalliset mallit tai tärkeysmallit visuaaliseen huomioon esitellään perinteisistä ohjaamattomista menetelmistä syviin tärkeysmalleihin. Kolmanneksi havainnollistamme tärkeysintegraation, joka yhdistää useita tärkeysehdotuksia useista eri tärkeysmalliehdokkaista, jolla saavutamme paremman tarkkuuden.

Kontribuutiomme ovat seuraavat kolme asiaa. Ensimmäiseksi keräämme silmänjäljitystietokannan visuaalisen huomion analyysiin. Toiseksi ehdotamme kolmea tärkeysmallia visuaalisen huomion perusteelliseen tarkasteluun. Tämä sisältää ohjaamattoman mallin, joka käyttää kaksisuuntaista etenemismallia, konvoluutioneuroverkkopohjaisen mallin, joka yhdistää syvän ehdollisen satunnaiskentän monitasotärkeystarkistukseen ja konvoluutioneuroverkkopohjaisen mallin ehdollisella sarjasatunnaiskentällä usean mallin yhteisopetukseen. Kolmanneksi ehdotamme tärkeysintegraatiomenetelmää ja suoritamme kattavia testejä ja analyysejä aiheesta. Lopuks, tiivistämme kontribuution, työstämme ja ehdotamme mahdollisia sovelluksia tärkeysmalleista ja laajennamme tärkeysaiheeseen liittyviä sovelluksia tehostamaan tärkeysmenetelmiä eri konenäön aiheisiin.
Viimeksi päivitetty: 23.1.2024