Mašininio mokymosi algoritmai: konkurentas ar pagalbininkas sociologui?

Ainė Ramonaitė
Vilniaus universiteto
Tarptautinių santykių ir politikos mokslų institutas
El. paštas: aine.ramonaite@tspmi.vu.lt

Rūta Žiliukaitė
Vilniaus universiteto Filosofijos fakulteto
Sociologijos ir socialinio darbo institutas
El. paštas: ruta.ziliukaite@fsf.vu.lt

Konferencijoje keliamas klausimas, kaip sociologo darbas pasikeis didžiųjų duomenų ir dirbtinio intelekto epochoje. Šiame pranešime pateikiama optimistinė perspektyva – parodoma, kaip mašininio mokymosi algoritmai gali tapti ne konkurentu, o pagalbininku sociologui.
Pranešime pristatomas bandymas panaudoti mašininiu mokymusi grįstą klasifikatorių automatiniam apklausos atvirų klausimų kodavimui. Analizei pasitelkiami 2012 ir 2019 m. porinkiminių Lietuvos gyventojų apklausų duomenys – atviri atsakymai į klausimą apie svarbiausias šalies problemas. Pranešime analizuojama, kaip, kompiuterį apmokius pagal žmogaus sukoduotas kategorijas, mašininio mokymosi algoritmui (konkrečiai, Naive Bayes klasifikatoriui) sekėsi įgyvendinti kodavimo užduotį su lietuviškais tekstais. Tiriama, kokį kompiuterio – žmogaus kodavimo patikimumą galima pasiekti, kiek jis priklauso nuo kodavimo kategorijų skaičiaus ir vidinės žodyno darnos, tekstų pirminio apdorojimo, apmokymui panaudotų atsakymų skaičiaus ir kt. Analizės rezultatai suteikia pagrindo itin optimistiškai vertinti kompiuterizuotos tekstų analizės ir mašininio mokymosi galimybes atlikti tokias užduotis kaip automatinis kodavimas, ne tik gerokai palengvinant sociologų darbą, bet ir suteikiant papildomų vertingų įžvalgų iš duomenų.