Syväoppimiseen perustuva automaattinen kuvatekstitys lääketieteelliselle kuvantamiselle
Väitöstilaisuuden tiedot
Väitöstilaisuuden päivämäärä ja aika
Väitöstilaisuuden paikka
Arina sali, Linnanmaan pääkampus, Oulun yliopisto
Väitöksen aihe
Syväoppimiseen perustuva automaattinen kuvatekstitys lääketieteelliselle kuvantamiselle
Väittelijä
Filosofian tohtori Djamila Romaissa Beddiar
Tiedekunta ja yksikkö
Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Konenäön ja signaalianalyysin tutkimuskeskus CMVS
Oppiaine
Lääketieteellinen kuva tekstitys
Vastaväittäjä
Professori Pong C. Yuen, Hongkongin baptistiyliopisto
Kustos
Apulaisprofessori Mourad Oussalah, Konenäön ja signaalianalyysin tutkimuskeskus CMVS, Oulun Yliopisto
Syväoppimiseen perustuva automaattinen kuvatekstitys lääketieteelliselle kuvantamiselle
Kuvan sisällön tekstuaalinen kuvaus on nouseva tekoälyn ala, joka yhdistää tietokonetieteen ja luonnollisen kielen käsittelyn (NLP). Kuvatekstitys (IC) tarkoittaa tehtävää, jossa kuvien visuaalista sisältöä analysoidaan ja kuvataan automaattisesti luonnollisen kielen avulla. Kuvatekstityksellä on monenlaisia sovelluksia, kuten kuvahaku, visuaalinen kysymyksiin vastaaminen, lääketieteellinen diagnoosi . . . jne.
Lääketieteellinen kuvatekstitys (MIC) puolestaan kuvaa lääketieteellisten kuvien sisältöä keskittyen kliinisesti merkittäviin löydöksiin, toisin kuin tyypillisissä IC-järjestelmissä, joissa painotetaan esineitä ja niiden välisiä suhteita. MIC tukee tietokoneavusteisia diagnoosijärjestelmiä, päätöksentekoprosesseja ja sairauksien hoitoa, mikä vapauttaa työvoimaa ja auttaa ammattilaisia päivittäisessä työssään. MIC yhdistää monimutkaisen lääketieteellisen tiedon luonnollisen kielen ilmaisuun. MIC on kuitenkin vaativa ja aikaa vievä tehtävä, joka vaatii lääketieteellisten asiantuntijoiden osallistumista tuotettujen kuvatekstien arviointiin ja vahvistamiseen.
Lääketieteelliset kuvat tarjoavat mahdollisuuden tutkia ihmiskehoa ilman leikkausta ja paljastavat mahdollisia sairauksia, joita asiantuntijat voivat arvioida. Tämä tekee MIC-prosessista vaikeampaa kuin tavallinen IC, sillä lääketieteelliset kuvat ovat heterogeenisiä, monimutkaisia ja hyvin spesifejä, ja niitä tulee kuvata käyttäen erityistä lääketieteellistä terminologiaa. Tässä haastavassa kentässä on tehty edistysaskeleita kohti automaattista MIC ä kouluttamalla koneita hyödyntämään kuvien koodaamaa merkityksellistä tietoa lääketieteen erityisnäkökohdat huomioiden.
Tämä väitöskirja pyrkii kehittämään selitettäviä syväoppimismenetelmiä lääketieteellisten kuvien analysointiin, ymmärtämiseen ja kuvaamiseen visuaalisten havaintojen pohjalta. Väitöskirja keskittyy erityisesti syväoppimiseen perustuviin kuvatekstitys-malleihin, joissa hyödynnetään erilaisia huomioihin perustuvia kooderi-dekooderi-arkkitehtuureja ja hakuperusteisia menetelmiä. Toiseksi tarkastellaan lääketieteellisen datan saatavuuden parantamista kuvatekstitysprosessin suorituskyvyn tehostamiseksi.
Kolmanneksi kehitetään selitettävä moduuli, joka antaa näyttöön perustuvaa tukea ja auttaa rikastuttamaan diagnoosiraportteja. Lopuksi arvioidaan ja optimoidaan suori-tuskykyä sekä pyritään löytämään sopiva selitettävyysviitekehys ottaen huomioon kuvatekstityksen eri vaiheiden vinoumat.
Lääketieteellinen kuvatekstitys (MIC) puolestaan kuvaa lääketieteellisten kuvien sisältöä keskittyen kliinisesti merkittäviin löydöksiin, toisin kuin tyypillisissä IC-järjestelmissä, joissa painotetaan esineitä ja niiden välisiä suhteita. MIC tukee tietokoneavusteisia diagnoosijärjestelmiä, päätöksentekoprosesseja ja sairauksien hoitoa, mikä vapauttaa työvoimaa ja auttaa ammattilaisia päivittäisessä työssään. MIC yhdistää monimutkaisen lääketieteellisen tiedon luonnollisen kielen ilmaisuun. MIC on kuitenkin vaativa ja aikaa vievä tehtävä, joka vaatii lääketieteellisten asiantuntijoiden osallistumista tuotettujen kuvatekstien arviointiin ja vahvistamiseen.
Lääketieteelliset kuvat tarjoavat mahdollisuuden tutkia ihmiskehoa ilman leikkausta ja paljastavat mahdollisia sairauksia, joita asiantuntijat voivat arvioida. Tämä tekee MIC-prosessista vaikeampaa kuin tavallinen IC, sillä lääketieteelliset kuvat ovat heterogeenisiä, monimutkaisia ja hyvin spesifejä, ja niitä tulee kuvata käyttäen erityistä lääketieteellistä terminologiaa. Tässä haastavassa kentässä on tehty edistysaskeleita kohti automaattista MIC ä kouluttamalla koneita hyödyntämään kuvien koodaamaa merkityksellistä tietoa lääketieteen erityisnäkökohdat huomioiden.
Tämä väitöskirja pyrkii kehittämään selitettäviä syväoppimismenetelmiä lääketieteellisten kuvien analysointiin, ymmärtämiseen ja kuvaamiseen visuaalisten havaintojen pohjalta. Väitöskirja keskittyy erityisesti syväoppimiseen perustuviin kuvatekstitys-malleihin, joissa hyödynnetään erilaisia huomioihin perustuvia kooderi-dekooderi-arkkitehtuureja ja hakuperusteisia menetelmiä. Toiseksi tarkastellaan lääketieteellisen datan saatavuuden parantamista kuvatekstitysprosessin suorituskyvyn tehostamiseksi.
Kolmanneksi kehitetään selitettävä moduuli, joka antaa näyttöön perustuvaa tukea ja auttaa rikastuttamaan diagnoosiraportteja. Lopuksi arvioidaan ja optimoidaan suori-tuskykyä sekä pyritään löytämään sopiva selitettävyysviitekehys ottaen huomioon kuvatekstityksen eri vaiheiden vinoumat.
Viimeksi päivitetty: 20.8.2024