Az adatokon alapuló döntéshozatal az egyik, ha nem a legforróbb tudományterület napjainkban. Az adatokból az információkinyerés, illetve az adatokon alapuló gépi tanítás azonban nem triviális folyamatok, azok mélyebb szakértői tevékenységet igényelnek. Ezzel a területtel foglalkozik az Eötvös Loránd Tudományegyetem Informatikai Kar (ELTE IK) Adattudomány Alkalmazásai Kutatócsoportja (AAK). A kompetencia magába foglalja az adatok előfeldolgozását, transzformációját és adattudományi módszerekkel történő elemzéseket, a mesterséges intelligenciával és gépi tanulással támogatott ipari alkalmazások kialakítását. Célunk új tudományos eredmények elérése és ezek alkalmazása a gyakorlatban.
Minden munkatársunk oktatási és kutatási feladatokat lát el az ELTE IK alkalmazásában a következő területeken:
Kutatás
Fejlesztés
Szenzorok és adatok: Általában egy cég már rendelkezik valamilyen adatgyűjtő megoldással. Amennyiben ez mégis hiányozna, úgy szenzorokat kell telepíteni.
Adatok előfeldolgozása: Ügyelnünk kell arra, hogy ne adjunk egy elemző módszernek hibás vagy rossz adatokat, mert akkor hamis eredményeket kaphatunk.
Adatok elemzése: Az adatok elemzése során egy-egy cég által definiált problémára adunk választ statisztika, az adatbányászat és a mesterséges intelligencia segítségével.
Implementáció és integrálás: A kapott eredményeket be kell építeni a vállalatirányítási folyamatokba.
Oktatás: Szakterületeinket érintő témákban tartunk tanfolyamokat, illetve vállalunk szakértői tevékenységet.
Ideális esetben ügyfelünk rendelkezik összegyűjtött adatokkal, amennyiben nem, úgy szenzorok telepítésével kell kezdenünk az adatgyűjtést. Az AAK szolgáltatásai ezen a területen: az adatok tárolása, adatbázis struktúra megtervezése és implementálása, valamint az adatok a forrástól a tárolási helyig (adatbázis, szerverek) történő eljuttatása szerepel kompetenciáink között. Előfordulhat, hogy a nagymennyiségű adatok miatt a későbbi elemzések adatelérését meg kell gyorsítani, ezért adat aggregációkat és különböző transzformációkat alkalmazunk. Az adatbázisstruktúrát úgy alakítjuk ki, hogy a későbbiekben változtatás nélkül képesek legyünk új adatok befogadására.
Az adatok előfeldolgozása rendkívül szerteágazó terület. Amennyiben hibás vagy rossz adatokat küldünk be egy elemző módszernek, úgy értelemszerűen hamis eredményeket fogunk kapni. Az AAK kompetencia megoldásai: hibás adatok szűrése, hiányzó adatok kezelése és/vagy pótlása, adatok szakadásának detektálására (pl.: meghibásodik egy szenzor és nem küld adatot, ekkor a javításig ezen adatok elvesznek), alapstatisztikai adatok elkészítése, különböző adattranszformációs lépések végrehajtása az adott elemző módszer függvényében, jellemzők kiválasztása (feature selection), főkomponensek kiválasztása az adott elemző módszer függvényébe, dimenziócsökkentés és mátrixfaktorizáció.
Az adatok elemzése során egy-egy cég által definiált problémára adunk választ, viszont különböző problémákra különböző elemző módszerek adnak választ. Ezért a megfelelő módszer kiválasztása és implementálása szakmai kompetenciát igényel. Az előfeldolgozás eredményeképpen kialakult bemeneti adatok alapján olyan modellek kialakítását tudjuk elvégezni, amelyek képesek a vállalati döntéshozatal automatikus támogatására. Az alábbi informatikai alterületek módszereit tudjuk alkalmazni:
Statisztika: Az adatok átlagának, szórásának, illetve egyéb alapinformációk kinyerése a fő cél, de természetesen vannak elemzéshez jobban köthető alterületi is: statisztikai módszerek, statisztikai próbák, eloszlások ellenőrzése, elemzési módszerek alkalmazásai-nak ellenőrzése stb. Mivel az elemzési folyamat sohasem egy kőbe vésett dolog, ezért gyakran szükséges statisztikai elemzéseket végezni a további elemzési lépések definiálása érdekében.
Gépi tanulás: A terület erősen interdiszciplináris terület ezért sokszor nehézkes megtalálni a megfelelő modellt az adott feladatra. Olyan kérdésekre keressük a válaszokat, mint például, hogy milyen adatelemek tartoznak egy csoportba (klaszterezés illetve osztályozás) vagy milyen szabályszerűségek nyerhetőek ki az adathalmazból (asszociációs szabályok). Gyakran szükséges ezek együttes, egymás utáni alkalmazása is, erre mutatunk példát a fejezethez tartozó ábrával.
Mesterséges intelligencia: Az MI már szinte az élet minden területén jelen van. A cél mindig a megfelelő pontosság elérése, azaz, hogy a neurális hálózat megfelelő módon tanulja meg az adatok közötti kapcsolatot és pontos jólást adjon a jövőre nézve. Ezen a területen igaz leginkább, hogy nem egyértelmű a modell kialakítása: különböző számú paraméterek vagy a különböző algoritmusok használata más és más eredményt adhat, amelyek közül a legjobbat kell kiválasztani.
Dr. habil. Farkas Gábor
Kutatási területek:
Analitikus és számítógépes számelmélet
Valószínűségszámítás
Adattudomány, mátrixfaktorizáció
Dr. Szekeres Béla János
Kutatási területek:
Neurális hálózatok
Funkcionál-differenciál egyenletek
Gépi tanulás
Dr. Pödör Zoltán
Kutatási területek:
Statisztikai alapú adatelemzés
Adatbányászat, Idősorok elemzése
Szenzoradatok kezelése, feldolgozása
Dr. Gludovátz Attila PhD.
Kutatási területek:
Statisztikai alapú adatelemzés
Adatbányászat, Idősorok elemzése
Szenzoradatok kezelése, feldolgozása
Dr. Bencsik Gergely
Kutatási területek:
Statisztikai tesztek
Mesterséges intelligencia
Döntéstámogatásó rendszerek
Szőlősi József
Kutatási területek:
Adattudomány
Szenzoradatok kezelése, feldolgozása
Kiberfizikai rendszerek
Magyar Péter
Kutatási területek:
Adattudomány, mátrixfaktorizáció
High Performance Computation (HPC)
Mesterséges intelligencia
Papatyi Dániel
Kutatási területek:
Adattudomány, mátrixfaktorizáció
High Performance Computation (HPC)
Mesterséges intelligencia
Adattudomány Alkalmazásai Kutatócsoport
Eötvös Loránd Tudományegyetem Informatikai Kar
Szombathely, Károlyi Gáspár tér 4, 9700
E-mail: contact@adat2k.eu
Keressen minket bizalommal.