Tein vertailun Tampereen hampurilaisvalikoimasta. Tämän kirjoituksen aiheena onkin analyysi burgeridatasta.

Annettujen pisteiden jakauma

Huipputason tieteellistä julkaisua hipovassa analyysissa on tärkeää tutkia lähtödatan laatu. Tutkimaamme siis arvioiden jakaumaa.

Annetuista pisteistä piirretyn histogrammin perusteella keskinkertaisia pisteitä on eniten. Huippupisteet ja murska-arviot ovat harvassa tuomariston absoluuttisen makuaistin ansiosta.

Annetut pisteet ovat likimain normaalisti jakautuneet.
Annetut pisteet ovat likimain normaalisti jakautuneet.

Voidaan siis todeta, että arvijoitsija oli tehtäviensä tasalla.

Hinnan ja pisteiden korrelaatio

Korrelaatiota mitataan 0 ja 1 välillä. Hampurilaisaterian hinnan ja annettujen pisteiden kulkiessa täydellisesti käsi kädessä, korrelaatio olisi 1.

Hampurilaisaterian pisteiden ja hinnan väliseksi korrelaatioksi saatiin 0.34. Maulla ja hinnalla on siis selvä yhteys, mutta halvallakin voi saada hyvää.

Hinnan ja pisteiden välillä voidaan nähdä löydä yhteys.
Hinnan ja pisteiden välillä voidaan nähdä löydä yhteys.

Aterian hinnasta voidaan yrittää poistaa lisukkeiden hinnan vaikutus. Siis ranskalaisten, juoman ja dipin. Näin voidaan arvioida vain hampurilaisen osuuden ja pisteiden yhteyttä.

Tällöin korrelaatio nousee lukuun 0.40. Voidaan pitää terveenä, että hinnan ja laadun välillä on yhteys. Toisaalta olisi sangen tylsää ja yllätyksetöntä, jos korrelaatio lähestyisi ykköstä.

Hinnoittelumalli hampurilaisaterialle

Koulutin hampurilaisaterian hintaa arvioivan koneoppimismallin, kun tiedetään sisältääkö annos ranskalaiset, juoman ja dipin.

Alla olevassa taulukossa on merkitty x:llä, jos ateria sisälsi kyseisen lisukkeen. Viimeisessä sarakkeessa on mallin antama hintaennuste.

HampurilainenRanskalaisetDippiJuomaHintaennuste
x---12.6 €
xx--16.7 €
xxx-18.9 €
xx-x14.5 €
xxxx12.5 €

Kumma kyllä, ranskalaiset, juoman ja dipin sisältävät ateriat ovat sekä todellisuudessa että ennusteen mukaan halvin yhdistelmä. Eli enemmän ruokaa vähemmällä rahalla.

Tämä selittyy sillä, että kalliimmat ravintolat myyvät lisukkeet lisäpalveluna. Pikkukioskista taas voi saada koko setin edullisesti.

Ravintolat voisivat käyttää ennustemallia oman hampurilaisateriansa hinnoitteluun.

Mallin antamassa hinta-arviossa on keskimäärin 2,3 euron virhe.