Ensimmäisissä kappaleissa määritellään tiedonlouhinta, käydään yleistietoa datatyypeistä, datan käsittelyyn liittyvistä teknologioista. Suurin osa materiaalista käsittelee hyvin syvällisesti erilaisia tiedonlouhinta-algoritmeja assosiaatioista, luokittelusta, klusteroinnista ja poikkavuuksien havaitsemisesta.

Kirja oli todellista hardcore kamaa, eli vasta-alkajalle suosittelen korkeintaan muutamaa ensimmäistä kappaletta. Mielummin kannattaa tehdä aihe tutuksi vaikka lukemalla käytännön sovellukset jokaisen kappaleen alusta tai jokin napakka blogiteksti ja sitten harjoittelemalla esimerkiksi R-kielellä hyvän verkkokurssin tai kirjan opastuksella.

Kun tiedonlouhinta on tullut tutuksi käytännön kautta, voi kirjan kahlata syventääkseen käytännön kautta tullutta tietoa. Kirja ei vastannut osaamistasoani, joten paljon jäi lukematta. Siksi suosittelen arvioimaan, miten kirja toimii omalla kohdallasi.

Kirjan ovat kirjoittaneet J. Han, M. Kamber & J. Pei.