CHAT JA KONE-OPPIMINEN


Chat on nykyään oleellinen osa asiakaspalvelua useimmille organisaatiolle. Se on tehokas ja nopea kommunikointikanava verrattuna esimerkiksi puhelimeen tai sähköpostiin. Tehokkuuden taustalla on yleensä automatisointi, jossa merkittävä osa keskusteluista voidaan automatisoida chatbottien avulla. Toinen tekijä on rinnakkainen kommunikointi, eli asiakaspalvelija tai asiantuntija voi samaan aikaan käydä useita erillisiä chat-keskusteluita asiakkaiden kanssa.


Teknisesti chat-palvelut erottuvat toisistaan automaation tason mukaan. Korkean automaatioasteen chat-palvelu muistuttaa tyypillisesti perinteistä verkkosivujen "usein kysytyt kysymykset" (eng. FAQ) -osiota, josta löytyy vastaus useimmin toistuviin kysymyksiin. Tällöin chatbot voidaan opettaa tunnistamaan mitä asiakas kysyy ja palauttamaan etukäteen määritellyn vastauksen. Eli voidaan kehittää dialogimalli. Se, miten hyvin botti tunnistaa kysymyksen, on kyky, jonka paremmuudesta eri chat-alustojen kehittäjät kilpailevat. Chat-alustojen markkinat käyvätkin parhaillaan kuumina ja alalla toimii globaalisti paljon yrityksiä. Dialogimallin "älykkyyden" ohella kilpailua käydään myös siitä, millainen tuki botilla on harvinaisemmille kielille kuten suomelle.

Toisessa ääripäässä ovat matalan automaatioasteen chat-palvelut. Tällaisia ovat monesti esimerkiksi pankkien, vakuutusyhtiöiden ja terveyspalveluja tarjoavien yritysten chatit, joissa keskustelu ei yleensä noudata ennakoitua tai toistuvaa kaavaa tai aihepiiriä. Toisaalta esimerkiksi terveyteen liittyviä keskusteluita ei voi jättää kokonaan bottien varaan, koska päätöksen tekijänä on oltava alan asiantuntija kuten lääkäri. Tällaisten niin sanottujen asiantuntija-chattien automatisointiin ei ole toistaiseksi tarjolla mitään tuotantoon soveltuvaa valmista ohjelmistoa tai alustaa. Akateeminen tutkimus aiheesta on kuitenkin aktiivista. Ongelman tekee haastavaksi se, että chatbotin pitäisi kyetä simuloimaan asiantuntijaa, mikä vaatii hyvin kehittynyttä tekoälyä. Täyden automaation sijaan mahdollinen chatbot voisi kuitenkin helpottaa asiantuntijan työtä esimerkiksi ehdottamalla sopivia vastauksia.

Oletetaan nyt, että organisaatiolle on kertynyt runsaasti asiakkaiden ja asiantuntijoiden välisiä chat-keskusteluita, kenties jo useiden vuosien ajalta. Yksittäisiä keskusteluita on kymmeniä – tai jopa satojatuhansia. Miten tätä tekstimassaa eli dataa voisi lähteä analysoimaan? Tämä on tilanne eräässä meneillään olevassa tutkimuksessamme BIG-hankkeessa. Dataa voidaan analysoida ainakin kahdella tavalla. Ensinnäkin keskusteluista voi yrittää tunnistaa useimmin toistuvia aihepiirejä tai teemoja soveltaen ohjaamatonta (unsupervised) koneoppimista. Tämä onnistuu aihemallinnuksen (topic modeling) avulla, jolla keskusteluita voi ryhmitellä automaattisesti. Tällä ryhmittelyllä sekä sisällön aihetuntemuksella voidaan ehkä löytää tyypillisimpiä kysymyksiä ja vastauksia, joiden avulla voidaan lähteä kehittämään dialogimallia tai parantaa jo olemassa olevaa mallia.


Toinen tapa on soveltaa ohjattua (supervised) koneoppimista ja rakentaa malli, joka jäljittelee asiantuntijan tuottamia vastauksia annettuun kysymykseen. Tämä tapahtuu joko luomalla mallin pohjalta uusia, vastaavanlaisia vastauksia (generoiva malli) tai poimimalla parhaiten sopivia vastauksia tietokannassa olevien valmiiden vastausten joukosta (hakeva malli). Molempia mallityyppejä on kehitetty akateemisen tutkimuksen puolella - vaihtelevalla menestyksellä. Yhteistä kaikille malleille on lähinnä se, että ne pohjautuvat syviin, yleensä rekursiivisiin neuroverkkoihin. Mallien opettaminen vaatii paljon dataa ja laskentakapasiteettia, erityisesti generoivien mallien tapauksessa. Hakuun perustuvat mallit ovat käytännöllisempiä, koska ne vaativat vähemmän opetusdataa ja mallien opettaminen sekä validointi on helpompaa. Lisäksi vastaukset ovat aina asiantuntijan tuottamia. Toisaalta generatiivisen mallin etuna on (ainakin teoriassa) kyky tuottaa räätälöityjä vastauksia myös ennalta odottamattomiin kysymyksiin. Tulevina vuosina on odotettavissa suuria harppauksia näiden mallien tutkimuksessa ja tuotantoon valmiit ratkaisut eivät liene enää monen vuoden päässä.


Tässä pintaraapaisu chattien toimintaan ja niiden hyödyntämiseen osana asiakasrajapintaa. Chat on tärkeässä osassa myös Haaga-Heliassa tehtävässä tutkimuksessa tulevina vuosina. Olemme kiinnostuneita chattien teknologiasta liittyen luonnollisen kielen käsittelyyn ja koneoppimiseen, sekä chattien käytännön sovelluksista opetuksessa, asiakaspalvelussa ja myynnissä.

Kirjoittaja: Janne Kauttonen, Haaga-Helia