Syvä oppiminen virtualisoitujen radioliityntäverkkojen orkestrointiin
Väitöstilaisuuden tiedot
Väitöstilaisuuden päivämäärä ja aika
Väitöstilaisuuden paikka
IT116
Väitöksen aihe
Syvä oppiminen virtualisoitujen radioliityntäverkkojen orkestrointiin
Väittelijä
Diplomi-insinööri Fahri Wisnu Murti
Tiedekunta ja yksikkö
Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Centre for Wireless Communications
Oppiaine
Tietoliikennetekniikka
Vastaväittäjä
Dosentti Tao Chen, Teknologian tutkimuskeskus VTT
Kustos
Professori Matti Latva-aho, Oulun yliopisto
Syvä oppiminen virtualisoitujen radioliityntäverkkojen orkestrointiin
Tämän opinnäytetyön päätavoitteena on kehittää uusia oppimiseen perustuvia virtualisoituja radioliityntäverkkoja (vRAN ). vRAN:issa tukiaseman toiminnot voivat olla täysin konfiguroitavissa, eriteltyjä, ja toteutetaan kustannustehokkaasti geneerisillä ohjelmistopohjaisilla toteutusalustoilla. Tämä paradigman muutos tuo mukanaan joustavuutta RAN-toimintoihin ja mahdollisesti vähentää käyttökustannuksia. Haasteena kumminkin on erilaisten konfigurointivaihtoehtojen laajuus ja järjestelmien monimutkaisuus. Tässä työssä tutkitaankin näiden yhteensovittamista vahvistavaa syväoppimismenetelmää (Reinforcement Learning) hyödyntäen.
Aluksi tutkitaan toiminnallisuuksien pilkkomista eri tavoin, joissa tukiasemafunktiot voivat olla keskitetyissä yksiköissä (Centralized Unit - CU) tai hajautetuissa yksiköissä (Distribute Unit - DU) minimoimaan kokonaiskustannukset. Tämä ongelma on kombinatorinen ja todistettavasti NP-kova tarkoittaen erittäin monimutkaista toteutusta. Ketjusääntöön perustuvaa stokastista RL-menetelmää, joka hyödyntää sekvenssistä sekvenssiin -mallia, ehdotetaan heuristisena ratkaisuna tämän ongelman ratkaisemiseksi. Tulokset osoittavat, että se voi oppia tekemään hajautettuja päätöksiä lähellä optimiratkaisua.
Seuraavaksi ehdotetaan vRANin yhteiskonfigurointia tukiasemien toiminnallisissa jaoissa, CU:iden ja DU:iden sijaintien, sekä niiden resurssien ja datavirtojen reitityksen suhteen. Tavoitteena on minimoida pitkän aikavälin kokonaiskustannusfunktio mukautumalla liikenteen vaatimuksiin ja resurssien saatavuuteen. Tällä ongelmalla on moniulotteinen diskreetti määrä ratkaisuja, mikä johtaa kombinatoriseen ratkaisujen määrään. Tätä pyritään ratkaisemaan vaihtoehtoisten päätösten dekompositiolla jota seuraavat neuroverkkohaarat jotka hyödyntävät dueling double deep Q-algoritmia. Tulosten valossa valittu menetelmä oppii menestyksekkäästi optimaalisen verkontoimintojen hajautuksen ja tarjoaa huomattavia parannuksia suhteessa tunnettuihin ratkaisuihin.
Lopuksi ehdotetaan vRAN:n ja verkon reunalaskentapalevelimen (MEC) orkestrointia kontrolloimaan toiminnalista vRAN -jakoa, resursseja, vRAN /MEC sijoittelua ja datavirtojen reititystä. Tavoitteena on minimoida verkon pitkän aikavälin kustannusfunktio ja maksimoida MEC:n suorituskykykriteerit samalla mukauttaen vRAN /MEC-vaatimuksia ja resurssien saatavuutta. Bayesilaista syväoppimisen viitekehystä on ehdotettu ratkaisemaan tämä ongelma. Numeeriset tulokset osoittavat, että se on laskennallisesti tehokas ja parantaa oppiskykyä suhteessa ei-Bayesilaiseen versioon.
Aluksi tutkitaan toiminnallisuuksien pilkkomista eri tavoin, joissa tukiasemafunktiot voivat olla keskitetyissä yksiköissä (Centralized Unit - CU) tai hajautetuissa yksiköissä (Distribute Unit - DU) minimoimaan kokonaiskustannukset. Tämä ongelma on kombinatorinen ja todistettavasti NP-kova tarkoittaen erittäin monimutkaista toteutusta. Ketjusääntöön perustuvaa stokastista RL-menetelmää, joka hyödyntää sekvenssistä sekvenssiin -mallia, ehdotetaan heuristisena ratkaisuna tämän ongelman ratkaisemiseksi. Tulokset osoittavat, että se voi oppia tekemään hajautettuja päätöksiä lähellä optimiratkaisua.
Seuraavaksi ehdotetaan vRANin yhteiskonfigurointia tukiasemien toiminnallisissa jaoissa, CU:iden ja DU:iden sijaintien, sekä niiden resurssien ja datavirtojen reitityksen suhteen. Tavoitteena on minimoida pitkän aikavälin kokonaiskustannusfunktio mukautumalla liikenteen vaatimuksiin ja resurssien saatavuuteen. Tällä ongelmalla on moniulotteinen diskreetti määrä ratkaisuja, mikä johtaa kombinatoriseen ratkaisujen määrään. Tätä pyritään ratkaisemaan vaihtoehtoisten päätösten dekompositiolla jota seuraavat neuroverkkohaarat jotka hyödyntävät dueling double deep Q-algoritmia. Tulosten valossa valittu menetelmä oppii menestyksekkäästi optimaalisen verkontoimintojen hajautuksen ja tarjoaa huomattavia parannuksia suhteessa tunnettuihin ratkaisuihin.
Lopuksi ehdotetaan vRAN:n ja verkon reunalaskentapalevelimen (MEC) orkestrointia kontrolloimaan toiminnalista vRAN -jakoa, resursseja, vRAN /MEC sijoittelua ja datavirtojen reititystä. Tavoitteena on minimoida verkon pitkän aikavälin kustannusfunktio ja maksimoida MEC:n suorituskykykriteerit samalla mukauttaen vRAN /MEC-vaatimuksia ja resurssien saatavuutta. Bayesilaista syväoppimisen viitekehystä on ehdotettu ratkaisemaan tämä ongelma. Numeeriset tulokset osoittavat, että se on laskennallisesti tehokas ja parantaa oppiskykyä suhteessa ei-Bayesilaiseen versioon.
Viimeksi päivitetty: 8.10.2024