Gyakori minták és asszociációs szabályok az adatbányászatban
Az adatbányászatban az asszociációs szabályok feltárása az egyik legfontosabb feladat. Nagyon sok esetben azonban a gyakori mintákból igen nagy számú érvényes asszociációs szabályt lehet előállítani, erősen megnehezítve ezáltal a szabályok felhasználását egy valódi alkalmazásban. Ezen probléma megoldására megszülettek a szabályok különböző tömörített reprezentációi. Egy szabály-reprezentáció lehetőleg legyen veszteségmentes, helyes, ill. informatív. A szabályok előállításához több esetben is szükség van a gyakori zárt mintákra, ill. a gyakori generátorokra. A gyakori mintáknak számos tömörített reprezentációja létezik, melyek közül a zárt minták, ill. a generátorok a legismertebbek. A gyakori zárt mintákat, ill. a gyakori generátorokat felhasználva lehetőségünk nyílik az asszociációs szabályoknak egy olyan tömörített halmazát definiálni, mely veszteségmentes, helyes, ill. informatív is egyben. Ezt a szabályhalmazt minimális nem-redundáns szabályoknak nevezzük.
Kutatásaimban olyan algoritmusok fejlesztésén dolgozom, melyek segítségével minél hatékonyabban tudjuk kinyerni a zárt mintákat, a generátorokat, ill. a minimális nem-redundáns asszociációs szabályokat. Az algoritmusaink egy Coron nevű, Java-ban fejlesztett rendszerben vannak összefogva. A Coron egy többféle kutatási területen alkalmazható, platformfüggetlen, többcélú adatbányászati eszköztár, amely nem csupán számos adatbányászati algoritmust tartalmaz, de többféle kiegészítő szolgáltatást is nyújt, mint pl. az adatok előkészítése, tisztítása, ill. az eredmények megjelenítése, értelmezése.