Sodelovanje med človekom in strojem

Vadim Tschernezki, Moin Nabi in Tassilo Klein (ML Research Berlin)

Vstopili smo v novo dobo, kjer doživljamo stalno in močno izboljšanje računalniške moči, shranjevanja in razpoložljivosti velikih podatkov. Poglobljeno učenje se je izkazalo kot idealna tehnika za izkoriščanje teh trendov, ki se je uveljavilo kot dejanski standard pri nadzorovanem učenju. Vendar tovrstno učenje zahteva, da se podatki označijo, kar na splošno povzroči znatne stroške pri zbiranju podatkov. Zato se pojavljajo alternativne paradigme, ki omogočajo povečanje potenciala ogromnih količin informacij na nov in značilen način. V tem spletnem dnevniku predstavljamo koncept, ki združuje moči ljudi in strojev na način sodelovanja. Preden se lotimo več podrobnosti, začnimo z zgodbo, ki prikazuje prednosti tega pristopa.

Leta 1997 je Garry Kasparov v šahovskem dvoboju v skladu s predpisi o turnirju premagal superračunalnik (Deep Blue). To je bil značilen dogodek, kjer je vladajoči svetovni prvak v šahu premagal stroj. Medtem ko se je Kasparov še okreval od te izkušnje, je navdih črpal tudi iz Deep Blue. Vprašal se je: "Kaj pa, če bi se lahko igral proti računalniku - z drugim računalnikom ob moji strani - združil naše prednosti, človeško intuicijo in izračun stroja, človeško strategijo, strojno taktiko, človeško izkušnjo, spomin naprave?"

Kasparov je zamisel o sodelovanju med človekom in strojem v šahu uspešno realiziral leta 2005 na računalniškem spletnem šahovskem turnirju, kjer so se velemojsterji združili z superračunalniki. Rezultat je bil precej nepričakovan: zmagovalca sta bila par ljubiteljskih ameriških šahistov, ki so upravljali tri navadne računalnike hkrati. V tem primeru je igralčeva spretnost vodenja računalnikov igrala zelo pomembno vlogo. To poraja vprašanje, ali je takšno sodelovanje mogoče uporabiti tudi pri drugih nalogah. Naslednji odstavki bodo osvetlili nastajajoče pristope v tem kontekstu.

Pristopi in trendi

Stroji kot sodelavci, ne le orodja

Pri primerjavi ljudi in strojev je očitno, da imata obe strani zelo edinstvene lastnosti in prednosti. Ljudje so odlični pri sprejemanju intuitivnih in kreativnih odločitev na podlagi svojega znanja. Računalniki dobro obdelujejo velike količine podatkov, da ustvarijo zgoščene pomembne informacije za pridobivanje novega znanja in boljše odločitve. Izkoriščanje sinergije teh značilnih prednosti se zdi naravni naslednji korak.

V raziskavah so bile takšne kombinacije v preteklih letih poglobljeno raziskane in postopoma doživljajo vse večji zagon. Eden pristop sta predlagala Mintz in sod. uporaba neoznačenih podatkov za izboljšanje modelov pridobivanja relacij z daljinskim nadzorom. Zlasti uporabljajo bazo podatkov, ki jih hrani človek, da oblikujejo hevristično funkcijo označevanja in jo vključijo v postopek usposabljanja klasifikatorja. Klasifikator lahko nato izvleče natančne vzorce za razmeroma veliko število odnosov. Ker raziskovalci oblikujejo funkcijo označevanja, ki približa vedenje človeškega annotatorja, ta nadzor naredi "oddaljen".

Druga tehnika, ki sta jo razvila Wang in sod. na področju računalniškega vida izboljšuje zaznavanje predmetov iz neoznačenih slik s samokontroliranim vzorčenjem. Pomemben del te metode temelji na samodejnem odkrivanju in psevdo označevanju predlogov zanesljivih regij za izboljšanje detektorja predmetov. To dosežemo z lepljenjem teh predlogov v različne označene slike, da bi celovito ocenili njihove vrednosti doslednosti v različnih kontekstih slike. Čeprav so te slike psevdo označene, učinkovito prispevajo k izboljšanju natančnosti odkrivanja in robustnosti pred hrupnimi vzorci. Na koncu oba opisana pristopa samodejno pripišeta neoznačene podatke in tako zmanjšate količino človeškega nadzora v procesu usposabljanja.

Vključevanje človeškega vodenja v aktivno učenje

V primerjavi s prejšnjim konceptom, kjer se nabor podatkov razširi s strojno označenimi podatki, lahko tudi omogočimo učencu, da izbere težke vzorce in od trenerja za človeka zahteva, da jih opiše, od tod tudi ime aktivno učenje. Metoda se izkaže za zelo učinkovito, zlasti v razmerah z omejeno razpoložljivostjo proračuna za usposabljanje vzorcev - strokovnjaki se lahko osredotočijo na zahtevne primere, medtem ko stroj prevzame večino vzorcev, ki jih je običajno enostavno rešiti.

Če želite razložiti intuicijo aktivnega učenja, razmislite o preprosti nalogi označevanja slik psov glede na pasme. Začnemo z osnovnim naborom podatkov, ki vsebuje označene slike psov. Ta nabor podatkov lahko predstavlja izziv za usposabljanje na več načinov: V glavnem lahko vsebuje slike psov, ki so obrnjeni proti kameri, s čimer postane izšolan model invarianten na pse, prikazane s strani. Vsebuje lahko tudi neuravnoteženo količino vzorcev za vsako pasmo. Lahko pa vsebuje podobne pasme, kot sta belgijski Malinois in nemški ovčar. V takšnih primerih bi tako ljudje kot stroji potrebovali več primerov vsake pasme, da bi se naučili pravilno razvrstiti pse. Aktivno učenje pomaga pri reševanju tovrstnih težav.

Predstavljajte si, da bi lahko dosegli 80-odstotno natančnost z modelom, usposobljenim na določenem osnovnem naboru podatkov. Dobili smo proračun za označevanje do 100 novih slik od 1000 neoznačenih in si prizadevamo pametno uporabiti ta proračun, saj je strokovna podpora za označevanje draga. Zato namesto, da naključno izberemo 100 vzorcev, raje pustimo, da naš strojni učenec izbere najtežje vzorce ali tiste, ki najbolje zajamejo osnovno distribucijo podatkov in zmanjšajo odvečnost. Model pustimo, da strokovnjakom za označevanje predlaga teh 100 vzorcev, za katere bi etiketam dodelil nizko zaupanje ali veliko negotovosti. Tako se lahko natančnost našega učitelja po treningu poveča na 95%, namesto na 90% v nastavitvi, kjer so bili uporabljeni naključno označeni vzorci. Lahko pa tudi preprosto zmanjšamo količino označenih podatkov in tako treniramo model z enako 90-odstotno natančnostjo, vendar z manj stroški.

Adversarial Training: Združenje najboljšega od obeh

Za združevanje aktivnega učenja in postopnega izboljševanja samodejnega označevanja potrebujemo strojno učenje, ki ga sestavljata dva modela. Prvič, diskriminatorni model za merjenje negotovosti glede natančnosti napovedovanja za dane vzorce (aktivno učenje) in drugič, generativni model za napovedovanje psevdostne resnice za vzorce (samodejno označevanje). Da bi povečali učinkovitost usposabljanja učencev, si prizadevamo za skupno optimizacijo obeh modelov s pomočjo nadomestnega usposabljanja. Na ta način je mogoče diskriminatorni model uporabiti tudi za dodeljevanje negotovosti napovedim generativnega modela in posledično povečati natančnost napovedi. Vrhunski model, ki je pridobil močan ugled v raziskovalni skupnosti in izpolnjuje navedene zahteve, se imenuje GN (Generative Adversarial Network).

Sodelovalno učenje med človekom in strojem z GAN

Glede na okvir, prikazan na zgornji sliki, najprej uporabimo generator (G) za napovedovanje psevdostne resnice za podatke brez opombe. Ker diskriminator (D) lahko dodeli ne samo negotovosti resnični resnični resnici, temveč tudi tisto, ki jo napoveduje G, lahko neoznačene vzorce razvrstimo po težavnosti ali negotovosti D. Določimo vzorce, katerih distribucija ni v celoti zajela model še tako težaven in naj D predlaga, da jih človeški zagovornik. Druge enostavne vzorce z nizko negotovostjo za izdelavo samodejno opomljenih podatkov z G. S človeškimi smernicami dobimo močnejši D, ki je prilagojen zahtevam naloge, ki jih določi učitelj (aktivno učenje). Izboljšana D bo G spodbudila k napovedovanju bolj kakovostne psevdostne resnice (samodejna opomba). Zaradi tega iterativnega izboljšanja GAN predstavljajo naraven okvir za združevanje ljudi in strojev v en skupno optimiziran postopek usposabljanja.

Medtem ko je znanstvena fantastika polna strojev in robotov, ki ogrožajo človeštvo in s tem ustvarijo ozračje suma, koncept človekovega sodelovalnega učenja z nadomestnim usposabljanjem kaže, kako stroji lahko smiselno dopolnjujejo naše delo in življenje na pozitiven način. Opisani pristop dejansko lahko preoblikuje številne vloge, na primer v zdravstvenem sektorju. Zlasti naša ekipa trenutno razvija pristop segmentacije 3D slik srčno-žilne magnetne resonance (MR), kar je pomemben pogoj za oblikovanje bolnikov specifičnih srčnih modelov in s tem za zdravljenje zapletenih srčnih bolezni. Naš cilj je ustvariti model, ki se uči iz lastno ustvarjenih segmentacij in strokovnjakom za ročno segmentacijo aktivno predlaga zahtevne slike MR. To bi lahko znatno zmanjšalo stroške in čas, porabljen za ta zapleten postopek, tako da lahko radiologi več časa namenijo oskrbi pacientov. Čeprav ta poseben primer lepo kaže pozitiven vpliv koncepta na družbo, je na področju zdravstva veliko uporabnih področij, ki bodo koristila rezultatom raziskav na tem področju.

Celoten raziskovalni članek za MIDL 2019 najdete tukaj: Semantična segmentacija, ki jo vodi negotovost, s sodelovalnim učenjem človek-stroj