Professional Documents
Culture Documents
Diplomaterv 2010
Nyilatkozat
Alulrott Murti kos, a Budapesti Mszaki s Gazdasgtudomnyi Egyetem hallgatja kijelentem, hogy ezt a diplomatervet meg nem engedett segtsg nlkl, sajt magam ksztettem, s a diplomatervben csak a megadott forrsokat hasznltam fel. Minden olyan rszt, melyet sz szerint, vagy azonos rtelemben, de tfogalmazva ms forrsbl tvettem, egyrtelmen, a forrs megadsval megjelltem. Budapest, 2010. mjus 14. Murti kos
Kivonat
Diplomatervem trgya a vllalati kommunikci elemzse. A cl egy olyan zleti intelligencia (BI) rendszer tervezse s megvalstsa, amely a vllalati (pl. e-mailes) kommunikci elemzst tmogatva teszi lehetv a szervezet struktrjtl eltr csoportok feltrkpezst, gymenetek nyomon kvetst s az egyes szereplk terheltsgnek mrst. A bevezet rszben nemzetkzi szakirodalom alapjn ismertetem az zleti intelligencia fogalmt, fogalmnak kialakulst s a szakterlet jelentsgt. Bemutatom a napjainkban alkalmazott zleti intelligencia rendszereket, majd a fejezet vgn arra a megllaptsra jutok, hogy jelenleg nem rhet el olyan BI megolds, ami hatkonyan tmogatja a vllalati ignyeknek megfelel kommunikcielemzst. Dolgozatom stratgiai s elemz szakaszban bemutatom a vllalati kommunikcis krnyezet elemzsnek tmakrt s lehetsgeit, melyekre alapozva kidolgozom az elemzs koncepcijt. Elemzsi mdokat s azokhoz vizualizcis lehetsgeket definilok, valamint egy fogalmi modellt is fellltok a kommunikci-elemzsre. Rviden ismertetem a vllalatokon bell tipikusan elfordul kommunikcis csatornkat, majd rszletesen ismertetem az e-mail-elemzs lehetsgeit, az abbl kinyerhet informcikat. Kifejtem a feldolgozs feladatait s problmit, tovbb bemutatok s rtkelek egy e-mail elemz rendszert, a Deep Email Miner alkalmazst. A rendszerterv bemutatsa sorn rszletesen ismertetem a megvalstand funkcikat, a tervezi dntsek httert, s bemutatom a rendszer architektrjt s komponenseit is. A korbban definilt fogalmi modell alapjn felptem a rendszer logikai adatmodelljt, majd az elemzs-orientlt adatbzisok szoksos tervezsi szempontjait figyelembe vve tervezem meg az elemzrendszer adatbzisnak csillag-smjt. Diplomatervem 6. fejezetben az elemzrendszer megvalstst s megvalstsi krnyezett ismertetem. Bemutatom a rendszer klnbz funkciit ellt modulok implementcijt, s ismertetem azokat az eszkzket s komponensknyvtrakat, amelyeket felhasznltam. Dolgozatom az elkszlt rendszer rtkelsvel zrom, melynek sorn rszletesen kitrek az egyes modulok: az zenetek gyjtst, elemzst s brzolst megvalst komponensek rtkels re. A tesztek mellett kpernykpekkel illusztrlom az eredmnyt, hiszen a vizualizci fontos rsze az elemzrendszernek. Szndkaim szerint az elkszlt kommunikci elemz rendszer jvbeli tovbbfejlesztsvel s az email mellett tovbbi kommunikcis-csatornkra elksztett zenetgyjt komponenseivel a vllalatok szmra hasznos s teljeskr elemz rendszerr vlik.
Abstract
The subject of my thesis is the analysis of corporate communication. The purpose of this paper is to design and implement a Business Intelligence (BI) system which supports the discovery of those communication groups who are different from the organization structure, the tracing of specific cases and the load measurement of each communication participant. In the introduction I present the concept and significance of Business Intelligence and those corporate demands which have led to the evolution of BI, and I also enumerate some BI solutions, which are being applied in our days. At the end of this chapter I declare that there is no available BI solution which could support corporate communication analysis in its entirety. The strategic and analysis section of my paper demonstrates the general corporate communication environment and its possibilities from the aspect of analysis, and I set up the concepts and principles of the communication analysis based on those. I define some analytical method and visualization possibilities and I also design the semantic model of the communication analysis. Henceforward I briefly summarize the typical corporate communication channels and then I specify the details and possibilities of e-mail analysis and those information which can be extracted from it. I describe the required tasks and problems of the e-mail processing, then I introduce and evaluate an email analyzer application called Deep Email Miner. In the chapter of System Design, I specify the system architecture, the components and functions to be implemented and I also describe the decisions I made during the planning period. Based on the previously defined semantic model, I created the logical data model of the system and I also designed the star-schema of my systems database considering the design principles of analytical-databases. Section 6 describes the development and implementation of my system, including the implemented functions, developed modules and those tools, environments and component libraries which have been used for the implementation. The final part of my thesis evaluates and summarizes the engineering and development results of my Communication Analyzer Systems. During the evaluation I specify the details of message collection, analysis and visualization components, illustrating with measurements and screenshots as the visualization components being important parts of the system. My intention is that the Communication Analyzer System - with further improvements and more communication channel collection modules beyond e-mail - be a useful, efficient and complete solution for corporate communication analysis.
Tartalomjegyzk
1. 2. Bevezet ............................................................................................................................. 1 Az zleti intelligencia ........................................................................................................ 2 2.1. Vllalati informcis rendszerek fejldse .................................................................. 2 2.2. Az zleti intelligencia fogalma .................................................................................... 5 2.3. Trendek s megoldsok napjainkban ........................................................................... 8 Stratgiai fzis ................................................................................................................. 12 3.1. Krnyezet felmrse .................................................................................................. 12
3.1.1. 3.1.2. Vllalati krnyezet s kommunikci kapcsolata ......................................................... 12 Tipikus vllalati kommunikcis csatornk .................................................................. 13
3.
3.2. 3.3.
3.4. 4.
4.2. 4.3.
4.4.
4.5.
4.6. 4.7.
4.6.1.
5.
5.2.
5.3.
5.4.
6.
Rendszer fejlesztse ........................................................................................................ 46 6.1. Krnyezet ismertets ................................................................................................. 46 6.2. Implementci ........................................................................................................... 46
6.2.1. 6.2.2. 6.2.3. 6.2.4. E-mail betlt alrendszer ............................................................................................... 46 Kzs rendszerknyvtrak s osztlyok caCoreLibrary............................................. 47 Elemzs kiszolgl - caServiceHost .............................................................................. 48 Kliens alkalmazs caClient projekt ............................................................................ 49
7.
7.2.
8.
sszefoglals .................................................................................................................... 58
A fggelk Elemzs s Tervezs ......................................................................................... 59 A1. MIME ftpusok ............................................................................................................ 59 A2. Logikai adatmodell attribtumai s kulcsai ................................................................... 60 A3. caEmailBufferParser projekt implementcija .............................................................. 61 A4. Kzs rendszerknyvr ................................................................................................. 62 A5. Elemzsi eredmnyosztlyok ......................................................................................... 63 B fggelk A rendszer hasznlata ...................................................................................... 64 C fggelk Kpernykpek ................................................................................................ 66
brajegyzk
1. bra Vllalati szerepkrk s tmogatrendszereik a 90-es vekben s napjainkban..................... 8 2. bra Kapcsolati hl koncepcionlis brja ................................................................................... 16 3. bra Tma Rsztvev trkp koncepcionlis brja ..................................................................... 17 4. bra Feldertett folyamattrkp koncepcionlis brja ................................................................... 17 5. bra Interneten keresztl trtn e-mail kzbests koncepcionlis brja ..................................... 20 6. bra Kommunikci ltalnos modellje .......................................................................................... 25 7. bra Kommunikci-elemzs fogalmi modelljnek sematikus brja ........................................... 25 8. bra Vllalati kommunikcit elemz rendszer funkcionlis hierarchija ..................................... 28 9. bra Kommunikcit elemz rendszer architektrja s funkcionlis felosztsa........................... 36 10. bra Logikai adatmodell Entits Relcis Diagramja ................................................................ 42 11. bra Tervezett Csillag-sma Entits- Relci Diagramja ............................................................. 43 12. bra Az elemz adatbzis csillag-smja ..................................................................................... 44 13. bra A rendszer ltalnos elemzfellete ..................................................................................... 53 14. bra Kapcsolati hl vizualizcis modulja ................................................................................. 54 15. bra Tma-rsztvev elemzs vizualizcis modulja ................................................................... 55 16. bra Folyamat felderts vizualizcis modulja ........................................................................... 56 A1. bra Az e-mail pufferel modul (caEmailBufferParser) UML osztlydiagramja ....................... 61 A2. bra - Kzs rendszerknyvtr fontosabb osztlyai s enumercii .............................................. 62 A3. bra Elemzsi eredmnyosztlyok............................................................................................... 63 C1. bra Kapcsolati hl elemzs eredmnye szemly nzet, irnyts nlkli md ...................... 66 C2. bra Kapcsolati hl elemzs eredmnye csoport nzet, irnytott md .................................. 66 C3. bra A rendszer ltal regisztrlt ismeretlen rsztvevk listja ..................................................... 67 C4. bra Rsztvev cserl eszkz kpernykpe ............................................................................. 67 C5. bra Murti kos rsztvev rekordja s cmei ........................................................................... 68 C6. bra Murti Csald nev csoport tagjai s csoportjai ................................................................ 68
Tblzatjegyzk
1. tblzat 'Murti kos' kifejezs kdolsai egy e-mail fejlc mez rtkeknt ..................... 22 2. tblzat Gyakori e-mail fejlc mezk s jelentsk ....................................................................... 22 3. tblzat E-mailek tartalmi elemeit ler mezk s jelentsk ........................................................ 23 4. tblzat E-mail betlt alrendszer ltal hasznlt puffer tbla ......................................................... 37 5. tblzat Fejlesztshez s tesztelshez hasznlt hardver- s szoftverkonfigurci .......................... 46 6. tblzat Kzs rendszerknyvtr moduljai s szerepk ................................................................. 47 7. tblzat Kzs rendszerknyvtr fontosabb osztlyai s szerepk ................................................ 47 8. tblzat Kiszolgl oldali rendszeradminisztrcis eljrsok ........................................................ 48 9. tblzat Kommunikci-elemzst megvalst eljrsok s eredmnytpusaik ............................. 49 10. tblzat Kliens funkcikat megvalst rlapok s lersuk ........................................................ 49 11. tblzat brzolst megvalst vezrlk osztlyai s lersaik .................................................. 50 12. tblzat E-mail betlt alrendszer modulok tesztjnek mrsi eredmnyei ................................. 52 13. tblzat GLEE brzolsi teljestmnye klnbz csompont s l konfigurcik esetben .... 56 14. tblzat Egy kommunikcis elemzsi zenet alatt tvihet rsztvevk szma .......................... 57 A1. tblzat MIME ftpusok s magyarzataik nhny gyakori pldval ........................................ 59 A2. tblzat Logikai adatmodell egyedei, kulcsai s attribtumai ..................................................... 60
1. Bevezet
A kommunikci sidk ta az emberi tevkenysg mindennapos rsze. Segtsgvel kpesek vagyunk kifejezni gondolatainkat, rzseinket s szndkainkat, ezltal az egyttmkds, hatskifejts s visszacsatols alapvet eszkze. Cljaink elrsben kulcs szerepe van annak, hogy milyen mdon, mennyire sikeresen vagyunk kpesek kommuniklni vagy ppen elhallgatni cselekedeteink hatst s szndkainkat, hiszen tetteink nmagukban nem elegendek szemlyisgnk kls megtlsben. Nagy ltalnossgban ugyanez elmondhat a vllalatok esetben is, a klnbsg csupn annyi, hogy egy szervezetben a vezetk ltal kijellt clok elrse nem csak egy, hanem jval tbb ember egyttes munkjtl, fellpstl s kommunikcijtl fgg, amelyek sszehangolsa s kvetse nehz feladat. Napjainkban szmtalan eszkz s technolgia ll a szervezetek rendelkezsre, amelyek hatkonyan tmogatjk a munkavgzst, a munkafolyamatok automatizlst, az erforrsok felhasznlst s segtsget nyjtanak az adatok, informcik s a tuds ellltsban, kinyersben vagy terjesztsben, elsegtve a dntsi helyzetek megfelel, jl informlt elksztst, a szereplk egyttmkdst, kommunikcijt s a mobilitst. Az zleti intelligencia megoldsok szleskr terjedsvel a vllalatok egyre szlesebb s rszletesebb betekintst kaphatnak bels s kls krnyezetk rszleteirl, viszonyairl s mkdsrl, azonban jelenleg mg nincs olyan szles krben elrhet ltalnos megolds, amely az emberi kommunikcis folyamatok feltrkpezsre s elemzsre szolglna. Diplomamunkm clja a fenti problmakr megvizsglsval egy olyan modell s rendszer megtervezse s elksztse, amely kpes a vllalati kommunikci hatkony lersra s tovbbi elemzs cljbl trtn felhasznlsra modern mrnki megoldsok felhasznlsval. A feladat bonyolultsgt s lehetsgeimet figyelembe vve a szmtalan kommunikcis csatorna kzl a bemeneti oldal implementlst az e-mailek gyjtsre s feldolgozsra szktettem, melynek egyedi problmakrt rszletesen bemutatom, m a jvbeli fejlesztseket szem eltt tartva a modell s a rendszer is fel lett ksztve ms csatornkrl rkez zenetek lersra s elemzsre. Ugyanakkor diplomamunkmnak nem clja a kommunikci tartalmi rszeinek szemantikus rtelmezse, hiszen e problmakr nmagban is hatalmas, amelyre klnll tudomnyg pl. A tartalmi kivonatolst ezrt csak a tervezsnl vettem figyelembe a ksbbi megvalsts cljbl.
2. Az zleti intelligencia
Az zleti intelligencia megoldsok nagyban segtik a vllalatok mkdsnek hatkonysgnvelst s javtjk a tervezhetsgt, amit a versenyelny megszerzsnek egyik f eszkzeknt jellemeznek. Valamennyi IT piackutat felmrse alapjn az informatikai-vezetk vek ta az egyik els szm prioritsknt nevezik meg az zleti intelligencia megoldsok alkalmazst s fejlesztst. Ahhoz, hogy tisztban lehessnk e fogalom jelentsvel, meg kell rtennk azokat az ignyeket s krlmnyeket, amelyek a klnbz vllalati informcis rendszerek kialakulshoz s vgl az zleti intelligencia megjelenshez vezettek.
klnbztethetnk meg, mint pldul a pnzgyi-szmviteli, kereskedelmi, humnerforrs, stb.. Ugyanakkor a szervezeti struktra vertiklis felbonts alapjn pedig ltalnosan 4 szintre oszthat, melyben a legals, operatv szinten a szervezet alapvet feladatainak, tranzakciinak s munkafolyamatainak elltsa trtnik. A kvetkez szinten a funkcionlis vezetk vgzik feladataikat, akik a terletknek megfelelen az operatv tevkenysg koordinlsval s ellenrzsvel foglalkoznak. A dnts-elksztst vgz vezetk, a hierarchia kvetkez lpcsfokt kpviselik, akik a vllalat stratgiai cljainak megfelelen egy magasabb szinten ellenrzik s hangoljk ssze annak tevkenysgt s ezeknek megfelelen hatroznak meg kzptv clokat s adnak javaslatokat a felsvezets szmra a hossz tv clok kijellsre. A vllalat fggleges felosztsnak cscsn a stratgiai azaz felsvezeti szint tallhat, ahol a hossz tv stratgiai s tulajdonosi clok kijellse trtnik. A fentieket figyelembe vve rthet, hogy a szervezetek minden egyes szintjn s terltn szksg van a pontos s megfelel informcikra, melyek ellltsa, trolsa, tiszttsa, rendszerezse, sszegzse s elemzse hatkony eszkzk tmogatsa nlkl lehetetlen feladat. A modern rtelemben vett zleti intelligencia rendszerek fejldse az 1960-as vek msodik felig vezethet vissza. Ebben az idben a fejlett adatfeldolgoz technikknak ksznheten a szervezetek mr rendelkeztek olyan egymstl elszigetelt rendszerekkel, amelyek lehetv tettk a vllalat gyfl-
menedzsmentjt1, tranzakciinak2, folyamatainak3, adminisztratv feladatainak automatizlt elltst4 s hatkonyabb erforrs kezelst5 is. sszefoglal nven az ilyen megoldsokat Vgrehajtst Tmogat Rendszereknek, azaz Operation Support System (OSS) megoldsoknak hvjunk, melyek fejlettebb utdai vgzik napjainkban is a vllalatok operatv tevkenysgnek dnt rszt. Br az Integrlt Vllalatirnytsi Rendszerek technolgiai s koncepcionlis tren is jelents fejldsen mentek keresztl, csak korltozott mrtkben kpesek a vllalat egszt rint krdsek megvlaszolsra, s a felsbb szinteken trtn vezeti munka tmogatsra. Az OSS-ek elssorban arra lettek optimalizlva, hogy mkdsk sorn nagy mennyisg adatot rgztsenek, kezeljenek s dolgozzanak fel a vllalat folytonos s megbzhat mkdst biztostva, gy sem adatszerkezetkben, sem pedig erforrsaikban nem kpesek megfelelen tmogatni a vezeti ignyeknek megfelel idszakos vagy ad-hoc elemzsek vgrehajtst vagy azok tbb szempontbl trtn prezentlst. A fenti problmk figyelembevtelvel szlettek meg az els az gynevezett vezeti informcis rendszerek (Management Information System, MIS), melyek modern rtelemben az els jelentskszt eszkzknek tekinthetk. Kezdetben ezek a szoftverek gyakorlatilag egyszer, interakci nlkli jelentsgenerl szoftverek voltak, melyek rszben az OSS-ek, rszben pedig sajt adatbzisukra tmaszkodva ksztettek elre definilt ignyek alapjn riportokat a magasabb szinten lv vezetk szmra. Legnagyobb htrnyuk az volt, hogy lekrdezsek s jelentsek sszelltshoz olyan elemz s tervez szakemberek segtsgre volt szksg, akik az zleti ignyeket s krdseket kpesek voltak az adatok szintjre lefordtani. Az IBM a vezeti informcis rendszerek fnykorban kezdett egy olyan interaktv rendszer fejlesztsbe, amely knnyen rthet s kezelhet felletet adott htkznapi felhasznlk kezbe, az adatok geolgiai szempontbl trtn analizlsra s megjelentsre. A szoftver a Geodata Analysis and Display System (GADS) nevet viselte, amit geolgiai adatokat elemz s megjelent rendszerknt fordthatunk magyarra. A hetvenes vek msodik felre a termket mr tbb rendrsg, tzoltsg, nkormnyzat s kzlekedsi trsasg is alkalmazta klnbz terleti, vezeti vagy tvonal-tervezsi feladatok megoldshoz. Az eltr brzolsi s elemzsi szempontok mellett ugyancsak ebben az idben kezdett egyre nvekv s tudatosabb figyelem irnyulni a fels zleti dntsek informatikai tmogatsra. A szervezet-kutats nll tudomnygg fejldsnek s az zleti tevkenysg rendszer alap felfogsnak ksznheten kialakultak a klnbz dntstmogat rendszerek (Decision Support System, DSS). A DSS nagy
CRM Customer Relationship Management, azaz gyflkezelsi rendszer TPS Transaction Processing System, azaz Tranzakci-feldolgoz rendszerek 3 PCS Process Control System, WF - Workflow System, azaz folyamatirnyt s munkafolyamat rendszerek 4 OAS Office Automation System, azaz irodaautomatizlsi rendszerek. 5 ERP Enterprise Resource Planning, azaz vllalatirnytsi rendszer
1 2
elnye abban jelentkezett, hogy fejlettebb, felhasznlbart felleteivel a vgfelhasznlk kezbe adta a rendszerben lv informcikkal kapcsolatos jelentsek sszelltsnak s brzolsnak lehetsgt, ugyanakkor egyszerre tmogatta a fizikai adatokon s az arra pl logikai modellen megfogalmazott lekrdezsek kezelst is. A dntstmogat s vezeti informcis rendszerek rtelmezse az vek-vtizedek alatt tbbszr is trtkeldtt, ugyanakkor fejldsk trvnyszernek tnik az eltr s folyamatosan vltoz vllalati ignyek mellett. A gyrtk ezeket az eltr ignyeket MIS s DSS megoldsaik kr szervezd klnbz funkcicsomagokkal prbltk megoldani. Ezek a kzpvezeti szinteken ltalnossgban megfelelek voltak, de a felsvezetk teljes vllalatra vonatkoz informcis ignyeit, mr nem tudtk teljes mrtkben kielgteni. E fontos igny ptlsra alakultak ki az Executive Information System (EIS)6 megoldsok, melyek szemlyre szabottan nyjtottak a felsvezetk szmra magas szint s aggreglt pnzgyi valamint statisztikai informcikat a vllalat egszre vonatkozan. A mainframe7 rendszerek letnsvel, a gyors tbbprocesszoros szerverek s szemlyi szmtgpek elretrsvel a vllalatok informatikai rendszerei is talakultak. A szerver s kliens oldali megvalstsok informatikban jl megfigyelhet ciklikussga a kzponti kiszolglk, adatbzisok s vgfelhasznlk szerepeit s lehetsgeit is tformlta. A terminlokat felvltottk a munkallomsokon fut kliensek, melyek segtsgvel az egyes felhasznlk testre szabhattk elemzsi krnyezetket, trolhattk lekrdezseiket s egyedi nzeteket definilhattak a szerver ltal felknlt lehetsgeken kvl. Az egynileg testreszabott s szerepkrk szerinti elemzs tmogatsa fokozatosan beplt a kiszolgl oldali logikba, a felhasznlk jobb menedzselhetsge vgett. A logikai rtegek felett az egyes szerepkrknek megfelelen kialakult az zleti modell rtege is, amely a logikai modellt fordtja le az egyes szerepkrket ellt felhasznlk ltal hasznlt zleti fogalmi kifejezsekre. Az informcis rendszerek fejldse megkvetelte az adatbzis-kezel rendszerek (Database Management System, DBMS) fejldst is, hiszen teljestmnyk kulcsfontossg a hatkony mkdshez. A kezdeti szigetszer rendszerek adatbzisaikkal a teljes vllalatot tfog krdsek megvlaszolsra sem technikailag, sem pedig adattartalmukban nem voltak kpesek vagy elegendek. A DSS rendszerekkel egytt, azok elemzseit kiszolglva megjelentek olyan kzponti adatbzisok adattrhzak -, melyek a szervezet klnll tranzakcis adatbzisaibl vettk adataikat. Ezzel a megkzeltssel egyrszt megoldottk a tranzakcis rendszerek elemzsek miatt bekvetkez felesleges terhelsnek problmjt, msrszt sajt, kimondottan elemzsekre kialaktott adatbzis smk hasznlatval a lekrdezsek komplexitst is cskkentettk. Az vek folyamn mind az analitikus adattrolsi s modellezsi mdszereket, mind pedig az ezek kiszolglst tmogat adatbzisszerverek
6 7
A szakirodalom nhny helyen Executive Support System (ESS) nven is hivatkoznak e rendszerekre Nagy teljestmny kzponti szmtgp, melyek erforrsait s szmtsi kapacitst a terminlon rkapcsoldott felhasznlk idosztsos elven hasznltk
kpessgeit is folyamatosan tkletestettk, melyek vgl elvezettek az Online Analytical Processing (OLAP) technolgia kialakulshoz. Az OLAP adatbzismotorokat s az ezekre pl vgfelhasznli eszkzket kimondottan gy terveztk, hogy az sszetett elemzsi feladatokat minl egyszerbb legyen megadni s velk hatkonyan lehessen vgrehajtani, mikzben segt a felhasznlnak vgigfrkszni akr magasabb szint sszegzett vagy alacsonyabb szint rszletezett adatokrl is legyen sz. Az OLAP technolgia jellemzen tmogatja az adatok tbb pldul id vagy tr - dimenzi menti elemzst, hierarchikus s idsoros lekrdezst, valamint a mi van akkor, ha tpus krdsek felvetst s elemzst is. Az OLAP adattrhzak olyan adatbzisok, melyeket kimondottan elemzsi cllal hoztak ltre egy adott tma kr felptve. Jellemzjk, hogy az adattrhzba kerl adatok nem vltoznak, trtneti jellegek s forrsaik tranzakcis rendszerek. Az adattrhzak s a forrs-adatbzisok eltr smja miatt szksg van olyan szoftverekre, melyek a forrsadatokat kinyersk utn azokat struktrjukban, tpusukban, mrtkegysgeikben s felbontsukban konzisztensen talaktjk s betlti a kzponti elemz adatbzisba. Az e clt szolgl eszkzk elnevezse a kivonatols (extract), talakts (transform), s betlts (load) funkciikbl add angol szavak rvidtse, vagyis az ETL lett. A 90-es vek msodik felben az OLAP adattrhzakra pl DSS rendszerek olyan kiterjedt szolgltatsokkal s elemzsi potencillal rendelkeztek, melyek jval tlmutattak a klasszikus rtelemben vett informatikai dntstmogatson. A DSS, mint elnevezs akarva-akaratlanul is, de szktette s behatrolta e rendszerek felhasznlst s fleg eladhatsgnak lehetsgeit, ezltal a piac mintegy kikvetelte egy rgi-j rtelmezs s elnevezs, a Business Intelligence (BI) hasznlatt.
Az zleti intelligencia fogalmnak szleskr elterjedsre ahogy azt a vllalati informcis rendszerek fejldsnl is lthattuk -, a 90-es vek vgig vrni kellett, azt kveten azonban az informcis technolgik egyik legkeresettebb s legjvedelmezbb gazatv vlt. Az elmlt vtizedben szmos knyv, cikk, rtekezs s beszmol jelent meg a tmval kapcsolatban. Albbiakban az ezek ltal nyjtott defincikat felsorolva prblok meg ltalnos kpet kialaktani a Business Intelligence 21. szzadi fogalmrl. A Drexel University s New Jersey Institute of Technology egyetem professzorai Business Intelligence Techniques cm knyvkben az zleti intelligencit az albbiakban definiltk. Olyan adatelemz, jelentskszt s lekrdez eszkzk, amelyek kpesek segteni az zleti felhasznlknak abban, hogy tvergdjenek az adatok tengern, rtkes informcikat ellltva. [9] A vllalati informcis rendszerekkel tbb, mint 20 ve foglalkoz Laudon hzaspr az zleti intelligencit gyakorlatilag a dntstmogat rendszerekkel tekinti azonosnak, mg Daniel J. Power A Brief History of Decision Support System (magyarul A dntstmogat rendszerek rvid trtnete) cm munkjban gyakorlatilag ugyanerre a kvetkeztetsre jut. Az IBM weboldaln hasonl filozfit fogalmaz meg, mivel vlemnyk szerint az zleti intelligencia megoldsok olyan szoftverek, amelyek sszektik az embereket az informcival, hogy dntseiket a lehet legegyszerbb mdon hozhassk meg. Rod Newing a BI megoldsok szleskr elterjedsrl rt Higher intelligence cm cikkben az albbiakban hatrozta meg fogalmunkat. Az zleti intelligencia egy koncepci, amely krlbell hsz vvel ezeltt indult nll tjra az eredetileg vezetknek kszlt dntstmogat rendszerektl. A szervezetek azta rjttek, hogy dntshozknak a vllalat minden szintjn s terletn szksgk van napraksz, relevns s pontos informcikra, legyen sz akr rtkestsrl, termelsrl, kiskereskedelemrl, logisztikrl vagy ms szervezeti-egysgrl. [10] A HP Business Intelligence blogjban Vicky Farell a BI t egy jgenercis rugalmas jelentskszt s elemz eszkzknt emlti, ami az vek sorn nll letre kelt. Vlemnye szerint a Business Intelligence rendszerek az OLAP technolgik segtsgvel - webes portlokon keresztl az informatikai kpzettsg nlkli felhasznlk kezbe adja a lekrdezsek sszelltst, vizualizlst s megosztst, tbbnyire historikus adatokon. [11] A Microsoft Magyarorszg az zleti intelligencival kapcsolatban az albbiakat rja weboldaln: Vllalati szervezete az zleti intelligencit hvhatja segtsgl a versenyelnyt s nyeresgessget biztost dntshozatal tmogatshoz. Az zleti intelligencia rvn integrlhatja, trolhatja, elemezheti, s jelentsek ksztshez hasznlhatja fel az adatokat, ami teljesebb betekintst, s vgs soron jobb zleti teljestmnyt biztost. A tma slyt s aktualitst az is mutatja, hogy a vilg egyik neves IT elemz s tancsad vllalata, a Gartner Inc. egy a sajt CIO felmrse alapjn a 2009-es vre a Top-10 IT stratgiai technolgik 6
egyikeknt a Business Intelligence t nevezte meg. Elemzseik alapjn az zleti intelligencia alkalmazsa kzvetlenl pozitv hatssal lehet a vllalatok zleti teljestmnyre s drmaian javthatja a kitztt clok elrst az zletmenet minden szintjn - a vllalat stratgiai dntseitl az operatv feladatok szintjig. [12] Egy msik neves IT piacelemz vllalat, az IDC egy 2009-es Business Intelligence megoldsokat vizsgl tanulmnyban a BI fogalmt mr pontosabban s kzzel foghatbban definilta [13]. Vesset s McDonough a tanulmny szerzi - az zleti intelligencia piacot kt rszre osztottk: ltalnos cl(QRA8) illetve specilis elemz9 rendszerekre. Az ltalnos cl QRA szoftverek kategrija magban foglalja a kifejezetten ad-hoc adathozzfrshez tervezett lekrdez, multi-dimenzionlis elemz, valamint jelentskszt eszkzket s vezrlpultokat is. Jellemzjk, hogy mind az IT, mind pedig az zleti felhasznlk knnyen tudjk alkalmazni e megoldsokat. Ugyanakkor ide sorolhatk a szerver oldali OLAP technolgik s modellez eszkzk, valamint az elre konfigurlt szoftvercsomagok is, melyek tipikus funkcionlis terletek zleti modelljeit s transzformcis eszkzeit tartalmazzk. A specilis elemzrendszerek alatt olyan adatbnyszati s statisztikai eszkzket rtnk, amelyek mintk, hasonlsgok, kapcsolatok s rejtett informcik feltrkpezsvel foglalkoznak, vagy komplexebb feldolgozst ignyelnek egy hagyomnyos QRA tevkenysgnl. E kategriba sorolhatk pldul neurlis hlk modelljt alkalmaz elemzrendszerek, vagy az olyan statisztikai szoftverek is, amelyek olyan specilis alkalmazsi terletekre fokuszlnak, mint az ipari ksrletek, klinikai tesztelsek, kutatsi- vagy valsidej statisztikai-adatok elemzse. A fentieket sszefoglalva teht elmondhatjuk, hogy az zleti intelligencia fogalmn egy olyan koncepcit rtnk, ami biztostja a klnbz stratgiai szerepkrket ellt szemlyek munkjhoz, dntseihez szksges relevns s kell rszletezettsg informcikat a rendelkezsre ll adatok elemzse alapjn, a vllalat jobb teljestmnynek rdekben. zleti intelligencia megoldsokon pedig olyan eszkzket s technolgikat rtk, amelyek a vllalati adatvagyon felhalmozstl kezdve a felhasznlk rugalmas informlsig bezran e koncepci megvalsulst tmogatjk. Ide tartoznak tbbek kztt az operatv s ms kls forrsokbl szrmaz adatok gyjtst, transzformlst s betltst tmogat ETL eszkzk, az elemzsek vgrehajtst tmogat adatbzis s adattrhz megoldsok, a modellezst s optimalizlst segt adatmenedzsment szoftverek s az
QRA - A szakirodalom gy hivatkozik a hagyomnyos lekrdez, jelentskszt s elemz azaz Query, Report and Analysis megoldsokra 9 A szerzpros az ltalam hasznlt specilis elemz rendszerekre az angol Advanced Analytics fogalommal hivatkozik
8
sszefggsek feltrsra, elrejelzsek ksztsre szolgl matematikai vagy statisztikai mdszereket alkalmaz adatbnyszati eljrsok is. Ide sorolhatk azok a vkony s vastag-kliens megoldsok is, melyek az zleti s informatikai felhasznlk ignyeinek egyarnt megfelel lekrdez, jelentskszt s elemz felleteket valstanak meg, valamint az eredmnyek brzolst, finomtst s terjesztst tmogat eszkzk is.
20. szzad
21. szzad
OSS
OSS
OSS
1. bra Vllalati szerepkrk s tmogatrendszereik a 90-es vekben s napjainkban Az jabb dinamikus webes technolgik megjelensvel a vllalati szinten drga s nehezen menedzselhet kliens oldali alkalmazsokat felvltottk a szinte brhonnan elrhet interaktv vkony kliens megoldsok, melyek testreszabhat webes portlokon keresztl szolgljk az egyes szerepkrknek megfelel felhasznli ignyeket. A modern BI megoldsokban az ad-hoc elemzsek mellett tovbbra is igny mutatkozik a statikus kvetelmnyekkel rendelkez, napraksz s szemlyes riportok generlsra. Az zleti intelligencia rendszerek tbbsge ppen ezrt rendelkezik olyan prezentcis modullal, amely a felhasznl ltal krt friss adatokon generlt riportokat bizonyos esemnyekhez vagy idpontokhoz ktve automatikusan eljuttatja a cmzettekhez, gyakorlatilag tetszleges formtumban, legyen az egy egyszer PDF jelents, Microsoft Excel tblzat, XML llomny, interaktv Flash vagy egy weboldal. Megfigyelhet tendencia, hogy az zleti intelligencia megoldsok ltal prezentlt informcik jl hasznosthatak a vllalat szinte sszes szintjn. A hierarchia felsbb vezeti s dntshozi - szintjei
mellett a BI megoldsok alkalmazsa kezd egyre inkbb teret nyerni a mindennapi operatv feladatok elltsban rsztvev szinteken is. [10] A jelenlegi trendek alapjn mondhatjuk, hogy a jvben nagy fejlds vrhat a BI rendszerek koopercis lehetsgeinek fejlesztsben, ahol a prezentlt informcikat a rsztvevk kzsen, egyttmkdve rtelmezhetik s szabadon transzformlhatjk sajt megszokott irodai szoftvereiken a kzponti kiszolgl terhelse nlkl. Az IDC korbban emltett tanulmnya az zleti intelligencia eszkzk els szm beszlltjnak az SAP AG szoftverrist nevezte meg 2008-as piaci rszesedse alapjn. A sorban t kvet gyrtk a SAS, IBM, Oracle s Microsoft, melyek egytt a BI vilgpiac majdnem 60 %-t uraljk, ezrt rdemes e vllatok elkpzelseit s megoldsait is figyelembe venni az zleti intelligencia tmjnak vizsglatakor. Itt rdemes megemlteni, hogy a fenti gyrtk ltal szlltott szolgltatsok tbb mint 80%-ban a Vesset s McDonough ltal definilt ltalnos cl vgfelhasznli BI eszkzket takarja. A vilg vezet integrlt vllalatirnytsi rendszereinek beszlltja, az SAP AG egyben az zleti intelligencia piac legnagyobb rszesedssel rendelkez szereplje, amely az SAP NetWeaver BW megoldsval teljes kr szoftveres BI szolgltatst nyjt gyfelei rszre. A szoftvercsomag tbbek kztt sajt fejleszts OLAP technolgira pl adattrhz megoldst, a heterogn rendszerek integrlst segt ETL eszkzeit, valamint a vllalati infrastruktrhoz igazod SAP Enterprise Portal webes keretrendszert tartalmazza. A felhasznlk nkiszolgl webes felleteken vagy a kimondottan erre kifejlesztett lekrdez, elemz s jelentskszt eszkzk segtsgvel vgezhetik ad-hoc elemzseiket vagy kszthetik el jelentseiket, vezrlpultjaikat s brikat, melyeket a kollaborcis s publikcis platformokon keresztli terjeszthetnek. A vllalat piaci rszesedst biztostva 2007-ben felvsrolta az zleti elemz szoftverekre szakosodott, Crystal Reports jelentskszt szoftverrl hres BusinessObjects et. A SAS Institute Inc. Enterprise Business Intelligence s Business Visualization megoldsaiban sajt OLAP alap adattrhzval, integrcis s elemz eszkzeivel knlja zleti intelligencia szoftvereit. A vgfelhasznlk szerepkrknek megfelelen egy testre szabhat nkiszolgl portlon vagy vastag kliensen keresztl vgezhetnek historikus vagy prediktv elemzseket, adat- s szvegbnyszatot vagy kszthetnek statisztikkat, elrejelzseket a jobb s gyorsabb dntsek elsegtshez. Az IBM adattrhz s tartalommenedzsment megoldsa az Information Management csomag rszeknt elrhet, sajt fejleszts Infosphere Warehouse s Smart Analytics System adattrhz s elemz szoftverekre pl, amelyek tartalmi elemzseket, adat- s szvegbnyszatot, valamint integrcis feladatok elltst is tmogatjk. Ugyanakkor a Cognos 2007-es akvizcija sorn szerzett Cognos Business Intelligence megoldsa OLAP kpes vagy relcis adatforrsra pl valdi zleti intelligencia 9
szoftvercsomag, amelyben a felhasznlk nkiszolgl webes felleten futtathatnak lekrdezseket, adhoc elemzseket, illetve kszthetnek jelentseket s vezrlpultokat is. Az informcik megosztst a rendszer az IBM Cognos Go! szolgltatsain keresztl tmogatja, legyen sz e-mailkldsrl, Microsoft Office integrcirl, vagy mobil eszkzn val megjelentsrl. Az Oracle Inc. az albbiakban foglalja ssze zleti intelligencia megoldst: Az Oracle Business Intelligence (BI) az alaptechnolgik s alkalmazsok legtfogbb portfolijt knl megolds, amely az sszefggsek felismersn alapul, tgondolt vllalatirnytst szolglja piacvezet BI alkalmazsokkal, zleti adatelemz platformmal s adattrhzakkal. [14] A vllalat OLAP opcit is alkalmaz sajt Oracle Database adatbzis-kezel megoldsa mellett Oracle Warehouse Builder nvre keresztelt adattrhz tervez, modellez s ETL eszkzvel igyekszik kielgteni a felhasznlk ignyeit. Az Oracle Business Intelligence Suite szoftvercsomag kivlan egyttmkdik heterogn OLAP vagy relcis-adatbzisokkal s egyb adatforrsokkal. A felhasznlk a nagyvllalati infrastruktrba jl illeszthet nkiszolgl portlon keresztl vgezhetik elre definilt s ad-hoc elemzseiket, vagy kszthetnek vezrlpultokat s jelentseket. Az informcikat a BI Publisher s Delivery komponensek segtsgvel, tetszleges formtumban s mdon oszthatjk meg munkatrsaikkal vagy partnereikkel, akr mobileszkzkn keresztl is. Az Oracle olyan analitikai alkalmazsokat is rtkest, amelyek lefedik a specifikus zleti folyamatok s ipargak szles spektrumt, tovbb lehetsget biztostanak geolgiai adatok brzolsra is. A cg vek ta ersti pozcijt a BI megoldsok piacn, amelyet a Siebel 2005-s, a Hyperion 2007-es felvsrlsval alapozott meg. A Sun Microsystems 2009-es akvizcijval a szoftveres megoldsok mellett mr teljes kr hardver-szolgltatsokat is nyjt. A Microsoft az utbbi vekben rengeteget tett Business Intelligence szolgltatsainak fejlesztse rdekben, melyet a BI technolgira specializldott ProClarity 2006-os felvsrlsval alapozott meg. A Microsoft Business Intelligence megoldsban az adattrhzak menedzselst, elemzst s kls rendszerek integrcijt a gyrilag beptetett OLAP technolgival s jelents-generl mechanizmusval felvrtezett10 j genercis SQL Server adatbzismotor s ETL eszkzk biztostjk. A SharePoint Server nkiszolgl webes felletein a felhasznlk szerepkreiknek megfelelen szabhatjk testre oldalaikat s nzeteiket, megoszthatnak informcikat, kszthetnek vezrlpultokat s akr ms felhasznlkkal egyttmkdve krdezhetik le, elemezhetik s brzolhatjk az eredmnyeket a Microsoft Excel kpessgeit felhasznlva. A Microsoft a geolgiai informcik megjelentsre sajt webes trkpszeti megoldst, a Bing Maps et alkalmazza.
10
Az emltett funkcikat a Microsoft SQL Server Analysis Services s SQL Server Reporting Services szolgltatsok ltjk el
10
A ltez megoldsok mellett azonban a felhasznlk egyre tbbszr tallnak j lehetsgeket az zleti intelligencia rendszerek felhasznlsra az ipari termels monitorozstl kezdve, a krhzi felplsi mutatkon keresztl, az gyek rszleteiben kutat gyvdekig. [15] Napjainkban a vllalati levelezs, zenetklds s telefonls a cgen belli s kvli kommunikci egyik legfontosabb tnyezje, gy a jvben megjelenhet az igny a tnyleges kommunikcis folyamatok feltrkpezsre s azok zleti szempontbl trtn felhasznlsra is. Diplomatervem aktualitst az jelenti, hogy jelenleg nyilvnosan nem ismert olyan ltalnosan hasznlhat zleti intelligencia megolds, amely kpes lenne a kommunikcis csatornk figyelsvel, zenetek gyjtsvel s a kommunikci elemzsvel a vllalatok szmra zleti szempontbl hasznlhat informcikat ellltani.
11
3. Stratgiai fzis
E fejezet clja a vllalati kommunikci-elemzs problmakrnek feltrsa, a vllalati kommunikcis krnyezet sajtossgainak s lehetsgeinek felmrse a felmerl elemzsi ignyek figyelembevtelvel.
12
A vllalatoknak legalbb annyira kell figyelnik a kommunikcira s az ezzel sszefgg mkdskre, folyamataikra, mint amekkora hangslyt fektetnek a pnzgyi tervezsre vagy a piac felmrsre, mivel a kommunikci-elemzs a modern szervezetfejleszts hangslyos tnyezjv vlt.
Telefon
A legtbb nagyobb vllalat mr rendelkezik valamilyen sajt vezetkes vagy VOIP telefonkzponttal egyrszt bels kommunikcijnak egyszerstse, msrszt pedig hvskltsgeinek c skkentse s kzbentartsa rdekben. Az ilyen szervezeteknl elterjedt megolds, hogy az alkalmazottak sajt vonallal vagy mellkkel rendelkeznek, melyek kezelsrl a kzponti cmtr gondoskodik. A cmtrak lehetsget biztostanak mobil-munkallomsok esetn a telefonvonalak dinamikus kiosztshoz, ugyanakkor a hvsok szerepli ezltal knnyen azonosthatak lesznek brhol is vgzik ppen munkjukat. Egy telefonbeszlgets egy vagy tbb szemly kztt folytatdhat, ahol a szereplk akr menet kzben is becsatlakozhatnak vagy kilphetnek, melyek tnyt a telefonkzpontok rgzthetik. Mr manapsg is szmtalan olyan zleti terlet ltezik pldul gyflszolglatok -, ahol a hvsok tnyn kvl magt a beszlgets tartalmt is rgztik a ksbbi visszahallgathatsg cljbl. A beszlgetsek tartalmi feldolgozshoz a modern hang s beszd-felismersi eljrsokkal lehetsg nylik azok szveges cmkzsre is a tovbbi elemzst segtend. A lehetsgek felsorolsakor termszetesen nem szabad megfeledkezni a mobiltelefon megoldsokrl sem. A vllalatok szemszgbl a relatve olcs s gyakorlatilag infrastrukturlis kltsgek nlkl fenntarthat hangtviteli s adat-szolgltatsok vonz alternatvt jelentenek a sajt telefonkzpontok zemeltetsvel szemben. Ugyanakkor a mobiltelefon 13 hlzatokon keresztl bonyoltott
telefonbeszlgetsek az elfizet vllalatok szmra ltalban nem rhetk el, mivel e megoldsokban hasznlt technolgik s eszkzk kls szolgltatk kezben vannak, melyek tevkenysge l lami engedlyhez kttt.
E-mail
A vllalatok msik, leginkbb npszer kommunikcis megoldsa az elektronikus levelezs. Mivel a vllalatok szinte kivtel nlkl rendelkeznek sajt levelezszerverekkel , a kldtt s fogadott e-mailek figyelse egyszer feladat. A szereplk azonostsa a fenntartott cmtrak segtsgvel ugyancsak egyszer feladat a bels cmek s csoporttagsgok ismeretben, a domain-en kvli e-mail cmek azonostsra pedig a vllalatok ltal karbantartott CRM adatbzisok hasznlhatk. Az elektronikus levelezs sajtossga - a hagyomnyos levelezstl eltren -, hogy a felad ltal kldtt zenet minden egyes cmzettnl nll entitsknt jelenik meg, a terjedsi viszonyoktl fggen akr egymstl eltr idpontokban. Elfordulhat pldul olyan eset, hogy egy betelt postafik esetn az egyik szerepl csak napokkal ksbb kapja meg zenett, ami az elemzs sorn figyelembevett vlaszidk tekintetben nagy jelentsget hordozhat. Ugyanakkor az egyes fogad felek ugyanazt az zenetet eltr kzbestsi mdokkal, kzvetlenl, msolatknt vagy titkos msolatknt is megkaphatjk, melyek az rtelmezs szempontjbl ms-ms jelentssel brhat. Tartalom szempontjbl az e-mail az egyik legvltozatosabb kommunikcis forma, hiszen az ltala hordozott zenet tartalmazhat sima vagy HTML szveget, begyazott tartalmat, de csatolmnyknt tetszleges fjlokat is kpes trolni, melyet a strukturlatlan s sszetett tartalom dekdolsakor figyelembe kell venni a ksbbi elemzs szempontjbl.
Azonnali zenetklds
Az azonnali zenetklds, - angolul Instant Messaging (IM) - napjaink egyik legelterjedtebb szveges ugyanakkor vals-idej kommunikcis megoldsa. ltalban meglv e-mail vagy VOIP alkalmazsokhoz szoktk trstani s jellemzjk, hogy a felhasznlk jelenlti llapotukat kzztve lben cseveghetnek rvid szveges zeneteken keresztl, de bizonyos megoldsok akr a fjlok kldst is lehetv teszik. Az e-mailekhez hasonlan, az azonnali zenetek naplzsa s elemzse ugyancsak knnyen megvalsthat vllalati kereteken bell, amennyiben a vllalat mr rendelkezik valamilyen sajt azonnali zenetkld szolgltatssal.
Fax
A fax a papr alap vllalati mkds egyik legregebb s legegyszerbb kzbestsi formja, mely a dokumentumok tovbbtst telefonos hlzaton teszi lehetv. A faxok megfelel gyjtse ugyanakkor csak akkor lehetsges, ha a vllalati fax vagy telefonhlzat az e-mailekhez hasonlan kzponti rendszeren keresztl kerlnek tovbbtsra. A felad s cmzett szemlyek azonostsa a telefonszmok
14
vagy mellkek kzponti cmtrbl trtn kiolvassval, vagy a faxszerverek azonostsi mechanizmusainak hasznlatval lehetsges. A faxok tartalmi elemzs szempontjbl bizonyos mrtkben az e-mailekre hasonltanak, hiszen a fax szerverek megjelensvel a kzvetlen klds eltt elfogott faxok szinte tetszleges formtum dokumentumok, fjlok lehetnek melyek tartalmi elemzse a csatolmnyokhoz hasonlan megoldhat -, azonban a telefonhlzaton keresztli tovbbts utn a fogadott faxok mr kpi informciknt llnak csak rendelkezsre, melyek rtelmezse OCR11 technolgik bevonst ignylik.
11
OCR Optical Character Recognition, azaz optikai karakterfelismer technolgia, ami lehetv teszi kpeken lv karakterek felismerst s szvegg alaktst.
15
3.3.1. Kapcsolati hl
A kommunikciban rsztvev szereplk kapcsolatnak legkzenfekvbb brzolsra kapcsolati-hlt alkalmazok, amely egyarnt tartalmazhat kls s bels szemlyeket s csoportokat is. A 2. brn lthat egy ltalam elkpzelt tipikus kapcsolati hl. A kommunikci egyes szereplit a grf csompontjai prezentljk. Kt csompont kztt akkor tallhat l, ha kzttk trtnt kommunikci. Az lek irnytottsga a kommunikci irnyt jelli, mg annak slyozsa azt mutatja meg, hogy a kt szerepl hnyszor kommuniklt egymssal.
145 Szemly 1 200 Szemly 2 143
170 40
Szemly 5
75
Szemly 6
2. bra Kapcsolati hl koncepcionlis brja Az lek a slyok ltal trtn vastagtsval grafikusan knnyen kiemelhetk s leolvashatk az egymssal gyakran kommunikl szereplk, melyek halmazt a tovbbiakban klikknek nevezzk.
128
Csoport 1 23
Tma 1
Tema 2
239 Szemly 3 157 Szemly 4
Tema 3
13
3. bra Tma Rsztvev trkp koncepcionlis brja A tma-rsztvev trkp olyan grf, amelyek ktfle csompontot tartalmazhat: tmt vagy rsztvevt prezentl csompontot. l csak tma s rsztvev kztt futhat s azt a jelentst hordozza, hogy az adott szemly az adott tmval kapcsolatban llt egy msik szemllyel folytatott kommunikcija sorn. Amennyiben az l a szemlytl a tma fel mutat, az azt jelenti, hogy a kommunikcit a szemly kezdemnyezte ahhoz a tmhoz kapcsoldan. A tmbl a szemly fele mutat l azt a jelentst hordozza, hogy a kommunikci sorn az adott tmban a kommunikci rsztvevje a fogad fl szerept tlttte be. Az lek slyozsa s vastagtsa a kapcsolati hlkhoz hasonlan a kommunikci gyakorisgt jelli.
3.3.3. Folyamattrkp
A szervezetek megosztott munkavgzse sorn gyakran merlhet fel igny a prbeszdek fellrl trtn vizsglatra, amelybl megllapthat, hogy egy adott gymenet kommunikcis folyamata ppen hol tart, vagy mely rsztvevknl akadt el. A kommunikci sorn az egyes zenetek kln pldnyokban s akr eltr idpontokban jelennek meg cmzetteknl. Ugyanakkor a kommunikcis tevkenysg sorn a rsztvevk vlaszaikkal s tovbbtott zeneteikkel jabb s jabb pldnyokat hoznak ltre, melyek egymsra hivatkoznak. A 4. bra egy ilyen, a rsztvevknl kln-kln pldnyknt megjelen zeneteket s kapcsolataikat brzolja az id-tengely mentn.
Szemly 1 Szemly 2 Szemly 3 Szemly 1 Szemly 2 Szemly 3 id tengely Szemly 4 Szemly 4 Szemly 2 Szemly 4 Szemly 3
17
18
4. Elemzsi fzis
E fejezet clja az elz stratgiai rszben ismertetett clok, fogalmak s funkcik pontostsa s azok kisebb funkcionlis sszetevkre bontsa, valamint az elemzs fogalmi modelljnek fellltsa.
12
A dokumentum RFC 733 Standard for the format of ARPA Network Text Messages cmen jelent meg
19
amit Multipurpose Internet Mail Extensions (MIME) nvvel emlegetnek, amit magyar nyelvre Tbbfunkcis Internet zenet-kiterjesztsknt fordthatunk. A MIME szabvnyok [17] segtsgvel a levelez alkalmazsok ktflekppen is kdolhatjk a nem ASCII tartalmakat. Az egyik megolds a tbbnyire sima szvegek tvitelre alkalmazott quoted printable formtum, mg a msik, binris tartalmak pldul csatolmnyok 7-bites lershoz ltalban a base64 tartalomkdolt szoktk hasznlni. A quoted printable alaptlete, hogy brmely 8-bites jel lerhat kdjnak hexadecimlis szmknt trtn brzolsval. E kdolsnl a szveg ASCII karaktereit tartalmaz rszeit nmagval, mg az ASCII kdtbln kvl es karaktereket egy = jel utn sajt hexadecimlis kdjukkal rjuk le. Az nbrzols all termszetesen kivtelt kpez maga az = jel, illetve a sor vgi nyomtatsban nem megjelen (whitespace) karakterek, melyeket szintn hexadecimlis kdjukkal kell lerni. A Base64 kdols elve a fentiekkel szemben a bitek binris-tcsoportostsn alapul. A kdoland 8bites jelek binris kdjt egyms mell rva 24 bites csoportokra osztjuk, ezutn a csoportokbl sorban vesznk 6-bitenknt binris szmokat, melyek rtkt ASCII karakterekk alaktjuk. Ezzel a megoldssal egy 8 bites tartalom 3 szimblumt 4 darab ASCII karakterrel rhatjuk le. Az utbbi vekben ugyanakkor tbb kiegszts is kszlt a fenti dokumentumokhoz, gy a 2001-ben elkszlt s 2005-ben javasolt szabvnny ellpett, RFC 822 t felvlt RFC 2822, s a MIME RFC szabvnytervek tovbbi tartalmi s biztonsgi mdostsai is megjelentek. Az IETF az zenet-formtum szabvnyostsn tl az e-mailek hlzaton trtn kzbestsi protokolljn a Simple Mail Transfer Protocol (SMTP) szabvnyostsn is dolgozik.
Andrea
MUA
To: bence@beta.hu From: andrea@alpha.hu Message..
4.
b v To
bt
S s-
P MT
A MT
mx.beta.hu mail.beta.hu
PO P
1. Szerkesztse
A MT
3, 5. IM Let AP lt , v s ag ye gy b
5. bra Interneten keresztl trtn e-mail kzbests koncepcionlis brja Az e-mailek kzbestse SMTP n keresztl az 5. bra alapjn, az albbi mdon trtnik. Els lpsben a felad megszerkeszti zenett, amit levelez kliense13 a megfelel Internet zenet-formtumra
13
A vgfelhasznlk ltal elrhet klnbz e-mail kliensekre vagy webmail megoldsokra a szakirodalom ltalban Mail User Agent (MUA) kifejezssel hivatkozik
ld K 2.
smtp.alpha.hu
s TP SM
S DN
Internet
nameserver.beta.hu
MUA
Bence
20
alaktva tovbbt egy e-mailkld szolgltatst nyjt szervernek. Amennyiben az e-mail domain-en kvli cmre tovbbtand, a levelez szerver a cltartomny levelezszervernek14 nvfeloldsa utn SMTP n tovbbtja azt. A helyi levelezszerverekrl a cmzettek levelez klienskkel klnbz protokollokon keresztl tlthetik le zeneteiket.
14
A szakirodalom azokra a szerverekre, amelyek rszt vesznek az e-mailek Interneten trtn tovbbtsban Mail Transfer Agent (MTA) kifejezssel hivatkozik.
21
szveget tartalmazza. A kdols mdja quoted printable esetben egy Q bet, Base64 esetben pedig egy B bet lehet. Ezek alapjn a nevemet egy e-mail cm mez rtkeknt az 1. tblzatban bemutatott mdokon lehet ASCII karakterekknt brzolni az alapjn, a hasznlt kdlap s kdol fggvnyben. 1. tblzat 'Murti kos' kifejezs kdolsai egy e-mail fejlc mez rtkeknt
Kdlap iso-8859-2 utf-8 iso-8859-2 utf-8 Kdols mdja quoted printable quoted printable base64 base64 Mez ASCII rtke =?iso-8859-2?Q?'Mur=E1ti =C1kos'?= =?utf-8?Q?'Mur=C3=A1ti =C3=81kos'?= =?iso-8859-2?B?J011cuF0aSDBa29zJw==?= =?utf-8?B?J011csOhdGkgw4Frb3Mn?=
Az e-mailek fejlceiben leggyakrabban hasznlt s az elemzrendszer szempontjbl fontos mezket, rvid lersukkal a 2. tblzatban foglaltam ssze. 2. tblzat Gyakori e-mail fejlc mezk s jelentsk
Meznv To From Sender Cc Bcc Reply-To Delivered-To Date Subject Message-ID In-reply-to References Received Jelentse A cmzett(ek) cm listjt tartalmaz mez Az e-mail zenet szerzjnek cme Az zenet tnyleges feladjt jell mez, amennyiben az zenet szerzje ms, mint a felad pldul egy megbzott. Cm(ek)re rkez zenet msolat Cm(ek)re rkez titkos msolatot Cm, amelyre a vlaszt vrja a felad Az a cm, melyre az eredeti zenetet tirnytva lett a kzbests sorn (pl levelezsi lista egy konkrt tagja) Levl elkldsnek dtuma Levl trgya Levl szerver oldali egyediazonostja, mely a tbbszrs kzbestsek elkerls Arra a MessageId ra hivatkozik melyre az adott zenet vlaszknt lett szerkesztve. Arra a MessageId-ra hivatkozikMelyik M_ID-ra hivatkozva A levl tovbbtsban rsztvev szerverek ltalban feljegyzik az e-mailek fejlcben, hogy mely msik szervertl, mikor s milyen mdon kaptk az zenetet tovbbtsra. E mezk segtsgve visszakvethetk az e -mailek tja az Interneten.
22
Az e-mailekben szerepl tartalmak megfelel kezelshez s megjelentshez az gynevezett MIME tpusok15 nyjtanak segtsget a dekdolst kveten. A MIME tpusok hasonl szerepet ltnak el, mint az egyes opercis rendszerekben hasznlatos fjlkiterjesztsek, vagyis az llomny tartalmt hivatottak jelezni. Mivel az informatikban ismert szmtalan fjlformtum csaknem mindegyikhez tartozhat sajt MIME tpus, ezrt annak kidolgozi a tpusok lerit hierarchikusan hatroztk meg. A hierarchia legfels szintjn a tartalmak tpusaik alapjn 8 fcsoportba16 soroltk, melyek mindegyike tovbbi altpusokra bonthat. Az egyes ftpusokat rvid magyarzattal s nhny fontosabb pldval az A fggelk A1 tblzatban ismertetem. Az e-mailek feldolgozsa sorn a tartalmak kibontshoz fel kell ksztennk rendszernket a legklnflbb zenet-struktrk s MIME tpusok feldolgozsra.
Az ltalam hasznlt MIME tpus kifejezsre az angol nyelv szakirodalom MIME-Type vagy MIME Media Type nven hivatkozik 16 A 9. MIME tpus az example nevet viseli, amely csupn bemutat s tesztelsi clokat szolgl, l krnyezetben nem fordul el.
15
23
Cmek, elrhetsgek
A klnbz kommunikcis csatornkon az egyes rsztvevk elrshez ismerni kell azok cmeit, telefonszmait, ami alapjn az zenet kzbesthet szmukra, melyek rviden elrhetsgeknek neveznk. Egy elrhetsg termszetesen a kommunikcis csatornhoz szorosan ktdik, ugyanakkor egy rsztvevnek tbb elrse is lehet, akr egy kommunikcis csatornn is.
Nyilvnval, hogy az emberi kommunikci gpi elemzst, csak gy valsthatjuk meg, ha a kld s fogad kztt kpesek vagyunk az zenetet hordoz jelkszletet elfogni s rtelmezni. Ebben az esetben az elemzst vgz gp is egy fogad flknt jelenik meg modellnkben.
Csatorna kdol dekdol
ad
vev
6. bra Kommunikci ltalnos modellje Az emberi kommunikci csupn gpekkel trtn minsgi elemzse azonban lehetetlen feladat. Soha nem lehetnk kpesek olyan eszkz ptsre, mely csupn a kommunikcis csatornn keresztl minden esetben kpes rekonstrulni a fogad fl ltal rtelmezett zenetet. Ez annak ksznhet, hogy az emberi kommunikci egy dinamikus, llapottal rendelkez tevkenysg, melynek helyes rtelmezse lehetetlen az elzmnyek s kontextus ismerete nlkl. Az rtelmezsi folyamat kzben gyakran tallunk olyan hivatkozsokat, utalsokat, amelyek a kontextus vagy elzmnyek ismeretben korbban mr rtelmezsre kerltek azonban zenetnkben explicite nem szerepelnek. Az ilyen elemeket a szakirodalom tacit, azaz nma elemeknek nevezi, melyek rtelmezshez bonyolult tartalomkezelsi, szvegbnyszati, nyelvfeldolgozsi s szemantikai mdszerekre van szksg. Belthat, hogy ez a kommunikcis modell nem alkalmas a fenti elemzsekhez, ugyanis nem nyilatkozik a kommunikci elzmnyeirl, kontextusrl, de magrl az zenet tartalmrl sem, ami a kommunikcis folyamat rtelmezsnek fontos rsze. Ennek eredmnyeknt kialaktottam egy hierarchikus fogalmi modellt (7. bra), amely megklnbzteti a kommunikcis folyamat s a tartalomkezels egyes szintjeit, de ezeket egytt alkalmazza az elemzsi clok elrshez.
Folyam: logikailag sszekapcsolhat tmk Szl: egymsra hivatkoz zenetek lnyege zenet: konkrt zenetek tartalma Kzbests: zenet kitl kinek s hogyan jutott el
25
zenetek szintje
Az zenetek olyan nll entitsok, melyek a kommunikci tnyleges tartalmt hordozzk. Ezek a kommunikcis csatornn keresztl tovbbthat zenetek lehetsgeihez mrten gyakorlatilag tetszleges tpusak lehetnek, legyen sz akr beszdrl, akr rott szvegrl, kprl vagy viderl. Ezek a tartalmak, ahogy azt mr korbban ismertettem a kommunikci elzmnyeire s kontextusra explicit s implicit mdon ptve rtelmezhetk a rsztvevk ltal. Nyilvnval, hogy egy tbbszerepls kommunikcis folyamatban a kzbestsek sorn egy adott zenet kerl tovbbtsra minden egyes rsztvevhz, ezrt egy zenet szorosan kapcsoldik annak kzbestseihez is. Az elemzs minsge attl fgg, hogy az egyes zenetek teljes tartalmt miknt tudjuk kivonatolni, azaz milyen mdon vagyunk kpesek a teljes tartalom rtelmezse utn annak lnyegi rszeit az elzmnyek s kontextus ismeretben bizonyos kulcsszavakkal kiemelni s ltalnos tmjt meghatrozni. Az zenetek ez ltal teljes tartalmukkal kivonatolt kulcsszavaikkal, tmjukkal, illetve annak kzbestseivel jellemezhetk.
Szlak szintje
Szlnak nevezzk az zeneteknek olyan fa struktrjt, melyben a gykeret leszmtva minden zenet a fban az t megelz - eggyel alacsonyabb szinten lv szl - zenetre hivatkozva jttek ltre a 26
kommunikci sorn, teht az ezek kztti sszefggs az elzmnyre hivatkozs miatt egyrtelmen kimutathat. Egy zenet, ha nem ktdik direkt egyetlen levlhez sem, nmagban is alkothat egy szlat. A szlak szintje ezek ismeretben a kommunikcis folyamat elzmnyeit explicite ler kapcsolatok szintje. Ez jellemezhet a szlat alkot zenetek fjval, amely gy kzvetve magban foglalja a szl sszestett kulcsszavait s tmit, valamint a kzbestsek szintjn keresztl annak szereplit egyarnt.
Folyamok szintje
A kommunikcis folyamat legfels szintjn a folyamatok llnak: folyamokon azon szlak sszessgt rtk, amelyek tmjukban valamilyen logikai szinten azonosak, ezltal tallhat kzttk valamilyen szorosabb tmabeli sszefggsi kapcsolat. E kts azonban nem olyan egyrtelm, mint a szlaknl megismert explicit hivatkozs, ezrt ezek feltrkpezshez mr komolyabb kontextus rtelmezsi s szvegbnyszati eljrsok szksgesek. A folyamok szintjnek jellemzi gyakorlatilag nem klnbznek a szlaknl ismertetettektl, hiszen itt is egymssal kapcsolatban ll zenetekrl van sz, azonban a folyamok esetben ez a kapcsolat implicit s logikai termszet.
Kivonatok szintje
A kivonatok szintjn az zenetek teljes tartalmt annak tpustl fggen jellemzen valamilyen mdszerrel szvegesen prezentljuk, amelybl szvegbnyszati mdszerekkel kulcsszavakat hozhatunk ltre, melyek a teljes tartalom lnyegi rszeit rjk le. A kivontok elksztse ktflekppen trtnhet a rendszer intelligencijtl fggen: Nem informlt kivonatols sorn a kulcsszavakat csak teljes tartalom vizsglata alapjn hatrozzuk meg a klnbz kifejezsek elfordulsa vagy szvegsrsge alapjn. Informlt kivonatols sorn azonban a tartalmak elemzsekor, mr eleve egy adott kontextushoz s elzmnyhez tartoz kulcsszavakat prblunk szlelni, - pldul a kommunikci szl ismeretben, ezltal a kivonat nem csak a teljes tartalom, hanem a kommunikcis folyamatban betlttt szerepe s kapcsolata alapjn is jellemezhetv vlik.
27
Tmk szintje
A tmk kezelse elemzsi modellnk legabsztraktabb tartalomkezelsi szintje, melyben a tartalmak lersa a kivonatolt kulcsszavak alapjn, mr csak azok tmjnak megjellsre szortkozik, ezltal lehetv vlik azok logikai csoportostsa. Az elemzs sorn alkalmazott kivonatolsi szablyok, vagy fejlettebb tartalomkezels esetben ontolgia17 legalbb kezdeti felptse szksges a helyes mkdshez, mely alapveten emberi intelligencit s beavatkozst ignyl feladat.
Gyjts
Feldolgozs
Elemzs
Hozzfrs
Tmk kezelse
Lekrdezsek sszelltsa
Tartalom kibontsa Tovbbi rszletek kinyerse Komm. adatstruktra felptse Trol funkci meghvsa
Elrhetsgek nyilvntartsa
Felvtel, mdosts, trls
Folyamat felderts
Kivonat trolsa
17
Az ontolgia szmtstechnikai rtelemben a valsg egy terletrl vagy annak egy sajtos nzpontjrl alkotott viszonylag kimert s szabatos fogalmi sma, melynek szerepe az sszetartoz fogalmak kapcsolatainak, viszonyainak s szablyainak szemantikai szempontbl trtn lersa.
28
4.4.2. Feldolgozs
Itt trtnik a megfigyels sorn gyjttt kommunikcis adatok feldolgozsa, melynek sorn az albbi feladatkrket kell elltni: Rsztvevk azonostsa a kommunikcibl kinyert elrhetsgek alapjn Tartami rszek kinyerse a klnbz tartalomdekdolk segtsgvel. Elkszl az zenet kommunikcis modellbeli megfelelje. Kommunikci szempontjbl egyb fontos adatok kinyerse, mint pldul a csatornn trtn kzbests mdja s a kommunikci idpontja, stb.. Kommunikcis modellnek megfelel adatstruktra felptse Kommunikcis adatstruktra tadsa elemzs cljbl trtn trolsa
4.4.3. Trols
Ez a funkcionlis egysg valstja meg a kommunikcis elemzsek szempontjbl fontos sszes adat trolst s szolgltatst, ami az albbi feladatkrket rinti: Kommunikcis adatstruktra trolsa, ami tartalmazza a kommunikci szereplit, tartalmt, idejt s a csatornn trtn kzbests mdjt is Trolja a rsztvevk, vagyis a szemlyek s csoportok adatait, tagsgi informciit s elrhetsgi adatait a cmzsek feloldshoz. Tmk kezelse, melynek sorn a rendszer zemeltetje karbantarthatja a kommunikci logikai kategorizlsban rsztvev kivonatolsi szablyokat
4.4.4. Elemzs
A stratgiai szakaszban ismertetett hrom elemzsi mdot megvalst funkci, mely az elemzseket a trol funkci ltal szolgltatott kommunikcis adatokon vgzi. Kapcsolati hl elemzs, melynek feladata a kommunikci sorn egymssal kapcsolatban ll rsztvevk felkutatsa Tma-rsztvev elemzs, melyben a kommunikci sorn felmerlt tmk s a kommunikl rsztvevk kapcsolatnak feltrsa a feladat Folyamat felderts, melynek feladata egy adott gymenethez kapcsold kommunikci feldertse
4.4.5. Hozzfrs
A vgfelhasznlk szmra elrhet felletek, melyek a rendszerhez trtn hozzfrst biztostjk. A lekrdezs, brzols s az adminisztrci alapfunkciit ltja el, melyeken keresztl az albbi funkcikat lehet elrni.
29
Lekrdezsek sszelltshoz szksges felletek elksztse a klnbz elemzsek futtatshoz Kapcsolati hl elemzs sszelltsa, indtsa s eredmnyeinek brzolsa Tma-rsztvev elemzs sszelltsa, indtsa s eredmnyeinek brzolsa Folyamat felderts sszelltsa, indtsa s folyamattrkp brzolsa Tmakezels adminisztrcis felleteinek megvalstsa a trol funkcionlisegysg rsztvev adatok kezelshez Rsztvev adminisztrci felleteinek megvalstsa a trol funkcionlisegysg
tmakezelshez
30
References s In-Reply-To fejlc meziben szerepl zenetazonostk kinyersvel, melyek egyttal a hivatkozs mdjt is elruljk.
31
32
perzisztens kulcssz-keress hinyban nem alkalmas vllalati kommunikci elemzsre. Azonban kapcsolati-hlk felletn alkalmazott megoldsait rendszerem tervezsekor s fejlesztsekor mindenflekppen figyelembe kvntam venni. sszefoglalsul - tmm aktualitst hangslyozva - elmondhatjuk, hogy jelenleg nem ltezik olyan nyilvnosan elrhet eszkz, amely alkalmas lenne vllalati kommunikci elemzsre.
33
5. Tervezsi fzis
E fejezet clja az elzekben ismertetett funkcik modulokba szervezse s pontos megtervezse, valamint a fogalmi modell egyedeire s kapcsolataira pl logikai adatmodell s elemzsi adatbzis megtervezse.
minden egyes megfigyelt postafikhoz hozz kell frnie, amelynek adminisztrlsa nehezen megoldhat. Ezzel szemben az els megoldsban elg a kimen s berkez levelek kiszolglit figyelni egy-egy bekelssel a teljes csatorna elemzshez. Az e-mailek megfigyelsnek elsegtshez a levelezszerver a rajta thalad leveleket egy mappba fogja gyjteni, melyeket a pufferel modul a feldolgoz s betlt modulnak tovbbt.
35
Elemzs kiszolgl
Kliens alkalmazs
Vgfelhasznli felletek Kapcsolati hl elemzs Szemly-tma trkp Folyamat feltrkpezs Erforrs statisztikk Adminisztrcis felletek Szervezeti adatok Rendszerbelltsok
Elemzsi Adatbzis-szerver
OLAP s Szvegbnyszat tmogatsa Kommunikcis adatok s fizikai elezsi modell
Adatelrsi rteg
Komm. Puffer
Nyers adat
Adatelrsi rteg
HTTP kapcsolat
Gyjts
Feldolgozs
Trols
Elemzs
Hozzfrs
9. bra Kommunikcit elemz rendszer architektrja s funkcionlis felosztsa Az e-mail betlt alrendszer biztostja az e-mailek gyjtst, feldolgozst s beszrst. Az elemzsi adatbzis gondoskodik az elemzsi adatstruktra s az ahhoz kapcsold adatok trolsrl. Az elemzsi kiszolgl ltja el az zleti logika szerept, mely a kliensektl rkez elemzsi s adminisztrcis krseket szolglja ki. A kliens alkalmazs feladata a vgfelhasznlk szmra egyszer s knyelme s fellet nyjtsa az elemzsi s adminisztrcis feladatok elltshoz, valamint az elemzsi eredmnyek brzolshoz. Az egyes modulok s osztlyok rszletes defincijt a dolgozat terjedelmt figyelembe vve nem ismertetem, azonban az elemzs szempontjbl fontosabb alkotk osztlydiagrammjt az A fggelkben rszletezem.
36
Kommunikcis Puffer
Szerepe a feldolgozsra vr levelek trolsa s itt trtnik a levelek tbbszrs feldolgozs elleni vdelme, mivel a pufferelend levelek beolvassa sorn a teljes zenet tartambl egy hash kpzdik, amelynek fenntartott mezt elsdleges, egyedi kulcsaknt hasznlunk (BUFFER_ID). Amennyiben egy zenet mr bent van a puffer tblban, vagyis a hash rtke mr szerepel valamelyik BUFFER_ID mezben, gy az adatbzis az egyedisg srlse miatt jelezni fog s megakadlyozza az ismtelt beszrst. 4. tblzat E-mail betlt alrendszer ltal hasznlt puffer tbla
CAD_RAWDATA
BUFFER_ID DATA STATUS CATEGORY COMM_ID VARCHAR2(400 byte) CLOB NUMBER(1,0) NUMBER(1,0) VARCHAR2(400 byte)
Puffer tbla Az zenet HASH kulcst trol szveges mez egyedisg megktssel A teljes, feldolgozsra vr nyers e-mail Ez a mez jelzi, hogy egy e-mail feldolgozsra vr-e A kommunikcis csatorna azonostjt trol mez A feldolgoz modul ltal visszart e-mail MessageID ellenrzsi clokbl
37
38
Magba foglalja az albbi osztlyok s komponensek egysges kezelst: Rsztvevt megvalst osztlyok, kapcsold enumercik, rsztvevk gyorsttrazsi megoldsa s kapcsolatler osztlyok Kommunikcis modellt megvalst osztlyok s kapcsold enumercik Elemzsekhez hasznlt egysges lekrdezst megvalst osztlyok Elemzsek eredmnyeit prezentl osztlyok Listk - pldul tmk, csatornk, kzbestsi mdok univerzlis trolst, gyorsttrazst megvalst osztlyok s eljrsok Kliens s szerver kztti esemnyvezrelt zenetkezels osztlyai
Adminisztratv szolgltatsok Adminisztrcis modul Rsztvev osztly fl emelt funkcik Rsztvev pldny ltrehozsa, mdostsa, betltse Rsztvev pldnyok listjnak lekrdezse, szrfelttelekkel Tagsgi adatok kezelse - adott rsztvev csoportjainak s csoport esetben tagjainak lekrdezse, mentse Rsztvevk elrhetsgnek lekrdezse, mdostsa Ismeretlennek jellt rsztvev cserje ismert rsztvevre, elrhetsg regisztrlsval
Tma s kivonatolsi szablyok fl emelt szolgltatsok Tmk listjnak lekrdezse Kivonatolsi szably ltrehozsa, mdostsa, lekrdezse, futtatsa Kivonatolsi szablyok listjnak lekrdezse
39
Egyb feladatok s szolgltatsok Web Service interfsz megvalstsa a kliensekkel trtn kommunikcihoz Szerver zeneteinek tovbbtsa a kliensek fel Kapcsolati adatok tovbbtsa a kliens fel Sessionkezels kliensenknt a dediklt adatkapcsolat biztostshoz Adatelrsi rteg megvalstsa Adatelrsi rteg s egyb osztlyok kztti konvertlst segt eljrsok
Elemzsi krsek kldse a kiszolgl megfelel tvoli eljrshoz s kiszolgl vlasznak fogadsa Web Service en keresztl Korbban mr lekrdezett adatok helyi gyorsttrazsa Kapcsolati hl brzolsa o o Kapcsolatok tbbfle nzetben trtn megjelentse: szemly-szemly, csoportszemly, csoport-csoport Kapcsolati lek irnytott s irnytatlan megjelentse Kapcsolatok tbbfle nzetben trtn megjelentse: tma-szemly, tma-csoport Kapcsolati lek irnytott s irnytatlan megjelentse
Folyamattrkp brzolsa
40
Adminisztrcis szolgltatsok Kivonatolsi szablyok lekrdezse s listzsa Kivonatolsi szably megjelentsre, szerkesztsre, mentsre s futtatsra alkalmas fellet megvalstsa Rsztvevk lekrdezse, listzsa Rsztvev megjelentsre, szerkesztsre, mentsre alkalmas fellet o o o o Szemly s csoport adatok szerkesztse Rsztvevhz tartoz elrhetsgek felvtele, szerkesztse, trlse Rsztvev csoporttagsgi adatainak felvtele, szerkesztse, trlse Ismeretlen rsztvevk azonostst szolgl rsztvev cserl eszkz
41
denormalizlom a tblk kapcsolsi kltsgeinek minimalizlshoz, vagyis a teljestmny nvelsnek rdekben. A fentiek rtelmben az elz fejezetben ismertetett fogalmi modell elemeibl s jellemzibl a 10. brn lthat mdon elksztettem a modell Entits-Relcis Diagrammjt (ERD). A sma jobb tlthatsga rdekben a kulcsok s attribtumok listjt az brn nem jelltem, m az A fggelk A2 pontjban ezeket is ismertetem. A logikai adatmodell s a fogalmi modell megfeleltetsnek szemlltetsre az entitsok s kapcsolatok krl tglalapokkal jelltem a megvalstott szintet.
Szlak szintje Szl
1 elzmnye
Vllalati krnyezet
cme
*
rsze
Cm
tmja
1 * *
zenet
1
* 1 kzbestse
felad
Csoport
1 1 1 isa *
kivonat
*
rsze
Kzbests
*
Rsztvev
cmzett
isa
tagsg
*
Kulcssz
Szemly
Csatolmny
Kzbestsek szintje
42
A rsztvevk ftpus egyede, a szemly s csoport ISA kapcsolata miatt sszetett helyzetet eredmnyez, ami a lekrdezsnk teljestmnyt ugyancsak rontja. Az ilyen tpus kapcsolat kikszblshez a szemly s csoport egyedeket megszntettem, m attribtumaikat sszevonva felvettem a rsztvev egyedhez s bevezettem egy j attribtumot az altpus jellsre, mellyel megklnbztethet, hogy szemlyrl vagy csoportrl van-e sz. Az elemzs-gyorsulsnak azonban ra van, mivel a kapcsolatok tszervezsvel bizonyos attribtumok redundns trolsa szksges. Ez ugyan megnveli az adatmanipulls kltsgeit, de elemzrendszernknl ez nem lnyeges szempont, hiszen a kommunikcis adathalmazon menet kzben csak bvtst vgznk.
Tma Csatolmny
*
Kulcssz
*
Szl
1
E-mail cm
*
tmja rsze
* * * * *
rsze
*
kivonat
1 elzmnye * 1
cme felad
1 1 1
zenet
Kzbests
*
Rsztvev
*
kzbestett
cmzett
tagsg
11. bra Tervezett Csillag-sma Entits- Relci Diagramja A 12. brn lthat, hogy a kzbestsek tnytblja a korbbi kapcsolatok felptshez szksges idegen kulcsok, valamint mg kt j id s dtum dimenzi idegen kulcsnak bevtele miatt ugyan kiszlesedett, de az gy kialaktott sma jval egyszerbb vlt az eredeti logikai modellnl, gy a lekrdezsek is egyszerbben vgrehajthatv vltak.
43
CAD_PARTICIPANTADDRESS [Cm] FK1 PARTICIPANT_ID [Rsztvev ID] ADDRESS [Egyedi Komm. Cm] CATEGORY [Komm. Csatorna] PK
CAD_PARTICIPANT [Rsztvev] PARTICIPANT_ID [Rsztvev ID] NAME [Nv] FOREIGN_ID [Trzsszm] TYPE [Szemly vagy Csoport] STATUS [Sttusza] PRIMARY_GROUP [Elsdleges csoport]
CAD_PARTICIPANTRELATION [Tagsg] FK1 FK2 USER_ID [Szemly ID] GROUP_ID [Csoport ID] ACTIVE [Aktv tagsg] MEMBER_FROM [Tagsg kezdete] MEMBER_TILL [Tagsg vge] CAD_TAG [Tma] COMM_ID [zenet ID] TAG_ID [Tma]
CAD_THREAD [Szl] PK THREAD_ID [Szl ID] NAME [Szl megnevezse] PK CAD_DATE [Dtum dimenzi] PK DATE_KEY [Mestersges Kulcs] YEAR [v] MONTH [Hnap] DAY [Nap] QUARTER [Negyedv] WORKDAY [Munkanap-e] FK1 FK2 CAD_SUBCOMM [Kzbests] SUBCOMM_ID [Kzbests ID] CATEGORY [Komm Csatorna] SUBCATEGORY [Kzbests md] RESULT [Sikeres kzbests] FROM_PARTICIPANT [Felad] TO_PARTICIPANT [Cmzett] SENT_TIME [Klds ideje] RECEIVED_TIME [Fogads ideje] JOINT_SEC [Kapcsols mp] DURATION_SEC [Komm. Hossza] COMM_ID [zenet ID] PREV_COMM_ID [Elz zenet ID] PREV_DELAY_SEC [Ksleltets elzhz] PREV_LINKMODE [Vlasz vagy Tovbbts] THREAD_ID [Szl azonostja] DATE_KEY [kzbests dtumkulcsa] TIME_KEY [Kzbests idkulcsa]
CAD_TIME [Id dimenzi] PK TIME_KEY [Mestersges kulcs] HOUR [ra] MINUTE [Perc] SECOND [Msodperc] TIME_OF_DAY [NAPSZAK]
FK3 FK5
CAD_COMM [zenet] PK COMM_ID [zenet azonost] LINKED [Eredeti zenet csatolva] LINK [Csatols URL-je] CONTENT [Teljes szveges tartalom] KEYWORDS [Kulcsszavak halmaza]
CAD_ATTACHMENT [Csatolmny] PK ATTACHMENT_ID [Csatolmny ID] ATTACHMENT [Csatolmny tartalma] COMM_ID [zenet ID] CONTENT_TYPE [Tartalom tpusa]
FK1,I1
12. bra Az elemz adatbzis csillag-smja A dtum s id dimenzik bevezetsvel az elemzrendszer kpes lesz olyan elemzsek vgrehajtsra s sszehasonltsra, melyek napszakokra, munkanapokra, vagy akr negyedves adatokra vonatkoznak. Ugyanakkor a dtumfggvnyek hasznlatnak mellzse miatt a kzbestsek tnye is gyorsabban lekrdezhetv vlt az egyes attribtumok szerint.
Kulcsok
A kzbests, zenet, csatolmny s rsztvev tblk esetben az elsdleges kulcsokat (primary key PK) mestersgesen GUID18 -ok generlsval mestersgesen osztottam ki, mg a dtum dimenzi elsdleges kulcsnak az HHNN dtumformtum, az id dimenzinak pedig az PPMM idformtum rtkeket vlasztottam szmknt brzolva, egyedisget biztost megszortssal. Ennek ksznheten a dtumintervallumokra trtn szrs vissza lett vezetve az egsz szmok kztti relcikra.
18
GUID - Globally Unique Identifier globlis egyedi azonost. Olyan lvletlen azonost, melyben az egyedi kulcsok szma annyira nagy (2128) hogy kt azonos szm generlsnak a valsznsge gyakorlatilag nulla.
44
Idegen kulcsok (foreign key - FK) akkor jelennek meg, ha egy kapcsolatban a tbla a gyermek szerept tlti be, ami jl megfigyelhet smnkban a tnytblk s a csoport-tagsg, illetve rsztvev-cm kapcsolatok definilsakor.
Indexek
Az indexek felvtelekor azt az elvet kvettem, hogy azokra az attribtumokra kell indexet pteni, melyekre a lekrdezsek a leggyakrabban irnyulnak, ezrt nyilvnvalan a kulcsok mellett, a tma, kulcssz, zenet azonost, valamint a dtum s id dimenzik attribtumaira is definiltam indexeket.
szabvnyostott e-mail zenetek ltrehozshoz, levelez kiszolglkrl trtn lekrdezshez, trolshoz s feldolgozshoz. A nyers zenetek feldolgozst megknnyt komponens kpes olyan Java objektumokat pldnyostani, melyek segtsgvel az e-mailek fejlc mezit s tartalomkontnereit knyelmesen s gyorsan ki lehet nyerni.
45
6. Rendszer fejlesztse
6.1. Krnyezet ismertets
Ebben a szakaszban ismertetem a tervezsnl kivlasztott krnyezetekhez s kls komponensek fejlesztshez s tesztelshez hasznlt pontos verzikat, fejleszteszkzket s szmtgp konfigurcit. A Java komponensek fejlesztshez a NetBeans IDE 6.8, mg a .NET keretrendszer alatt fut komponensek implementlshoz a C# nyelvet s a Microsoft Visual Studio 2008 integrlt fejleszti krnyezetet hasznltam. A fejlesztsi s tesztelsi hardverkrnyezetknt sajt notebookomat hasznltam, gy a teljes fejlesztsi konfigurcit az 5. tblzat tartalmazza. 5. tblzat Fejlesztshez s tesztelshez hasznlt hardver- s szoftverkonfigurci Szmtgp Processzor RAM Opercis Rendszer Java krnyezet .NET krnyezet Adatbzisszerver Egyb komponensek HP Compaq nw8240 Intel Pentium M, 2,13 GHz (32bit) 2048 MB Windows 7 Enterprise 32-bit (6.1 build 7600) Java 6 Update 20 Microsoft .NET Framework 3.5.7283 Oracle Database 11g - 11.1.0.7.0 Oracle Developer Tools for Visual Studio 11.1.0.0720 Oracle JDBC Driver 11.1.0.7.0 Sun JavaMail API 1.4 Micosoft Research GLEE 1.0
6.2. Implementci
6.2.1. E-mail betlt alrendszer
E-mail Pufferel modul caEmailBufferer projekt
Ez az egyszer Java SE 6 konzolalkalmazs valstja meg az e-mailek pufferelst vgz modult, amely a szerveren lv leveleket a fjlrendszerbl kiolvasva betlti a puffer tblba Oracle Database 11g JDBC Driver segtsgvel.
46
beszrst a SimpleMail osztlybl szrmaz SimpleMaiDatabaseObject vgzi. Sikeres beszrst kveten a puffer tblban az aktulis rekord sttusza feldolgozott llapotba kerl. A megvalstott modul osztlydiagramjt s tovbbi mkdst az A fggelk A3. pontja tartalmazza.
Az implementls sorn a kollekcik s halmazok hatkonyabb kezelse cljbl a .NET 3.5 keretrendszer beptett generikus lista osztlyt hasznltam. 7. tblzat Kzs rendszerknyvtr fontosabb osztlyai s szerepk
Osztly vagy Enumerci caCommCategory caCommSubcategory caParticipantType caParticipant caParticipantObject caParticipantAddress caSubCommItem caSubCommItemObject caTaggingRule caMessage caGlobalList Szerepe Kommunikci csatornk listja Kommunikcis csatornk kzbestsi mdjait jell lista Rsztvevk tpust jell lista (szemly vagy csoport) Rsztvev egyedet ler osztly Rsztvev egyed kiterjesztett osztlya, gyorsttrazshoz s megjelentshez Rsztvev cmt reprezentl osztly Kzbests egyedt ler osztly Kzbests egyed kiterjesztett osztlya, gyorsttrazshoz s megjelentshez Kivonatolsi szablyt megvalst osztly A rendszer ltal generlt zenet osztly esemnyvezrelt zenetkezelshez A kliens oldali listk - pldul tmk, csatornk, kzbestsi mdok univerzlis trolst, gyorsttrazst s megjelentst ellt osztly
47
Adminisztrcis modul
Az adminisztrcis modul eljrsai a rendszerknyvtrak alapobjektumai szintjn nyjtanak sszetett szemly, csoport s cm-kezelsi, valamint a caTaggingRule osztlyra pl kivonatolsi szolgltatsokat. 8. tblzat Kiszolgl oldali rendszeradminisztrcis eljrsok
Szerep j adatkapcsolat nyitsa Szerver zenetek letltse Rsztvev pldny lekrse Rsztvev pldny mentse Rsztvev lista lekrdezse Rsztvev csoportjainak lekrse Rsztvev csoportjainak mentse Rsztvev tagjainak lekrse Rsztvev tagjainak mentse Rsztvev cmeinek lekrse Rsztvev cmeinek mentse Rsztvev cserje msikra Tmk listjnak lekrdezse Tma trlse Kivonatolsi szably lekrse Kivonatolsi szablyok listja Kivonatolsi szably mentse Kivonatolsi szably futtatsa Web Service eljrs Connect GetMessages LoadParticipant SaveParticipant LoadParticipantList LoadParticipantGroups SaveParticipantGroups LoadParticipantMembers SaveParticipantMembers LoadParticipantAddress SaveParticipantAddress ReplaceParticipant LoadTagList DeleteTag LoadTaggingRule LoadTaggingRuleList SaveTaggingRule RunTaggingRule Eredmny osztlya caMessage List<caMessage> caParticipant caParticipant List<caParticipant> List<caParticipant> List<caParticipant> List<caParticipant> List<caParticipant> List<caParticipantAddress> List<caParticipantAddress> caMessage List<string caMessage caTaggingRule List<caTaggingRule> caTaggingRule caMessage
48
objektumok, amelyek elre elksztett SQL utastsokat foglalnak magukba kulcsszavak s tmk generlshoz.
Elemzs-vgrehajts
Az elemzsek a kiszolgl 9. tblzatban szerepl eljrsain keresztl vgezhetk el. Az elemzsek mindegyike sajt eredmnyosztllyal rendelkezik. Ezek a kisebb svszlessg hlzatokon is csak az eredmny szempontjbl leglnyegesebb informcikat tartalmazzk, a tbbletinformcikat pedig a kliensek gyorsttra biztostja. A hrom elemzsi eredmnyosztly mezit az A fggelk A5. pontja tartalmazza. 9. tblzat Kommunikci-elemzst megvalst eljrsok s eredmnytpusaik
Elemzs
49
FormTaggingRule FormTaggingRuleMgmt
A gyakran hasznlt rlapfunkcik elltshoz - mint pldul a rsztvevk listzsa, kivlasztsa, szrse, valamint az ltalnos keresfellet kialaktsa - sajt vezrlket fejlesztettem, melyek a projekt Controls nvterben tallhatak.
A vezrlk fejlesztsben a Microsoft GLEE ltal biztostott osztlyokat s GUI vezrlket hasznltam. Az elemzsek eredmnyhalmazt .NET generikus listaknt troltam s a grfok felptst, valamint a memriban lv halmazok kezelst LINQ for Objects19 megoldssal valstottam meg.
19
LINQ Language Integrated Query, A Microsoft .NET keretrendszer beptett lekrdez nyelve, amely az SQL hez hasonl szerkezettel kpes objektumhalmazokon s adatobjektumokon klnbz kivlasztsi s adatmanipullsi mveleteket vgrehajtani
50
7. rtkels
Az elemzsi s tervezsi fzisban kitztt clok s feladatok sikeresen megvalstsra kerltek, gy elkszlt a kommunikcit elemz rendszer ngy alrendszere, az e-mail betlt, az elemzsi kiszolgl, az elemzsi adatbzisszerver s a kliens alkalmazs is, a szvegbnyszati funkcik kivtelvel az sszes funkcit lefedve. Az egyes osztlyok, modulok s modulcsoportok mkdst kln-kln s sszekapcsolsuk utn is teszteltem mestersgesen elksztett teszteseteken, mg a rendszer egsznek mkdst sajt levelezsemen hibakeressi mdban s empirikus mdszerekkel is ellenriztem, ami gy a hibk folyamatos javtsa utn helyesnek bizonyult. A tovbbiakban a feladatkirsnak megfelelen az E-mail betlt s az Elemzsi s Hozzfrsi alrendszer funkciin keresztl rtkelem az e-mailek feldolgozst, relci-elemzst s azok kapcsolati-hls megjelentst vgz komponenseket.
51
1 5 10 25 1 5 10 25 1 5 10 25 1 5 10 25 1 5 10 25 1 5 10 20 1 50
1 5 10 25 2 10 20 50 4 15 30 90 5 36 70 192 300 967 2 264 5 076 1 058 5 214 11 614 30 195 3 635 35 372
1 550 1 595 1 715 1 723 2 828 1 695 1 734 1 739 2 047 1 598 1 643 1 719 3 007 1 406 1 609 2 203 2 922 1 688 3 063 5 656 10 407 2 547 7 968 20 203 45 500 3 703 25 484
1 395 1 643 2 283 2 507 3 201 1 895 1 979 2 910 2 910 1 640 1 890 2 406 4 047 1 656 1 891 2 047 2 657 1 781 2 531 3 797 6 625 2 343 5 031 9 281 22 313 4 547 26 111
2 945 3 238 3 998 4 230 6 029 3 590 3 713 4 649 4 957 3 238 3 533 4 125 7 054 3 062 3 500 4 250 5 579 3 469 5 594 9 453 17 032 4 890 12 999 29 484 67 813 8 250 51 595
293 1 053 1 285 3 084 645 768 1 704 2 012 293 588 1 180 4 109 117 555 1 305 2 634 524 2 649 6 508 14 087 1 945 10 054 26 539 64 868 5 305 48 650
1,0 1,0 1,0 1,0 2,0 2,0 2,0 2,0 4,0 3,0 3,0 3,6 5,0 7,2 7,0 7,7 300,0 193,4 226,4 203,0 1 058,0 1 042,8 1 161,4 1 509,8 3 635,0 707,4
293,00 210,60 128,50 123,36 645,00 153,60 170,40 80,48 293,00 117,60 118,00 164,36 117,00 111,00 130,50 105,36 524,00 529,80 650,80 563,48 1 945,00 2 010,80 2 653,90 3 243,40 5 305,00 973,00
293,00 210,60 128,50 123,36 322,50 76,80 85,20 40,24 73,25 39,20 39,33 45,66 23,40 15,42 18,64 13,72 1,75 2,74 2,87 2,78 1,84 1,93 2,29 2,15 1,46 1,38
A fejlesztsi hardver s szoftver konfigurcin vgzett mrsek eredmnyeinek vizsglatval elmondhat, hogy az zenetek 1KB-ra es tlagos beszrsi ideje a komponensek indulsi idejt is figyelembe vve (I oszlop) annl gyorsabb, minl nagyobb az egyszerre beolvasott zenethalmaz mrete (A, B oszlop). Termszetesen a futsi idk javthatk, ha a pufferelsi s feldolgozsi modulok soros feldolgozs helyett prhozamosan vannak futtatva, mivel gy az elz prhuzamos fzisban pufferelt zeneteket a feldolgoz modul az jabb pufferelsi ciklussal prhuzamosan kpes feldolgozni s beszrni az elemzsi adatbzisba. Megllapthat, hogy a rendszer szk keresztmetszete a modulok indtsi s listzsi fzisa, ami az resjrati tesztnl figyelhet meg, hiszen a moduloknak kln-kln is krlbell 1,5 msodperc kellett, mire elindultak s lekrdeztk a betltsre vagy feldolgozsra vr e-mailek res listjt.
rhet el a tervezs sorn kitztt hrom elemzsi md, a kapcsolati hl elemzs, a tma-rsztvev elemzs s a folyamat felderts. Az elemzsek a terveknek megfelelen megoszlik az elemzsi-kiszolgl s kliens kztt. Az elemzsek vgrehajtst kizrlag a kiszolgl ltja el, a lekrdezsek sszelltsa, rszletekkel trtn kiegsztse s brzols pedig a kliens erforrsait hasznlja. A tmk listjnak letltse s gyorsttrazsa a kliens indulsakor trtnik, ami a tovbbiakban gy nem terheli a szerver erforrsait.
Elemzfellet ismertetse
A terveknek megfelelen a megvalstott kliens az sszes elemzshez egysges szrsi felletet (13. bra) biztost, melyen a felhasznlk gyorsan s egyszeren llthatjk be elemzsi szempontjaikat. Itt adhat meg, hogy az elemzs milyen idintervallumban trtnjen, milyen tmkban keressen, konkrt rsztvevk megjellsvel, valamint az is megadhat, hogy minimum hny zentet vegyen figyelembe kt rsztvev kapcsolatnak feltrskor.
53
A vizualizcik oldaln az elemzs eredmnyt brzolja a tervezsi cloknl kitztt mdon (14. bra). Ezen a felleten a felhasznl az brzolst tovbb finomthatja az alapjn, hogy a szereplket szemlyek vagy csoportjaik alapjn kvnja megjelenteni vagy, hogy szmt-e a kommunikci irnya. A kapcsolati lek automatikus vastagtsval a rendszer kiemeli a gyakran kommunikl klikkeket s a vgeredmny akr kpknt is exportlhat.
Adorjn R
14. bra Kapcsolati hl vizualizcis modulja (A 14. bra Murti kos rsztvevvel kapcsolatban ll szemlyeket jelenti, melyen a rendszer feltntette a kapcsolatok irnyt is. A kprl leolvasat a vastagtott leket figyelembe vve, hogy az adott elemzsnl a GOE Irodval gyakran kommuniklt a szerepl.)
54
15. bra Tma-rsztvev elemzs vizualizcis modulja (A 15. bra olyan elemzst brzol, melyben a rsztvevket csoportjaik alapjn jelentettk meg, gy leolvashat, hogy azok milyen tmkban kommuniklnak. A vastagtott leknek ksznheten leolvashat, hogy az Egyetem a leggyakoribb tma a hrom csoport kztt.)
Folyamat felderts
A folyamat felderts sorn az elemzsi szempontok belltsa utn az elemzs eredmnyeinek lekrdezse hasonlan trtnik, a mik kt elemzi modulhoz, azonban az brzols mdja itt eltr. A rendszer az egyes zenetpldnyokat az gymentben elfoglalt helyk alapjn az idtengely mentn fa struktrban brzolja (16. bra). Az brzolsi mdok kztt vlaszthat, hogy az zenetpldnyok vagy azokat birtokl rsztvevk ltal trtnjen a vizualizci. (A 16. brn egy folyamat felderts eredmnye lthat, ahol a piros krk brzoljk az egyes zenetpldnyokat s az bra fels rszn elhelyezked vzszintes tengely mutatja az brzolt zenetpldnyok dtumait. Az zenetpldnyok kztt fut lek az jellik, hogy egy pldny a msiknak a folytatsa a kommunikciban. Ezltal az brrl leolvashat, hogy Murti kos 2005.04.12 n kapott egy zenetet, melyre csak kt napos ksssel vlaszolt. Ugyanakkor az e-mailre mg aznap kapott vlaszt, m a prbeszd ott meg is llt.)
55
16. bra Folyamat felderts vizualizcis modulja Az elemzsekhez tartoz tovbbi kpernykpek s magyarzatok a C fggelkben tallhatk.
56
A teszt eredmnyei alapjn meg lehet jsolni, hogy egy tlag 200 fs vllalat esetben, ha minden alkalmazott tlagban 5 emberrel tartja gyakran a kapcsolatot, akkor a cg teljes kapcsolati hljnak kirajzolsa krlbell 3 msodpercet vesz ignybe a tesztkonfigurcin.
Az A oszlop jelli, hogy milyen elemzs eredmnyrl van sz, a B oszlop az res vlasz mrett tartalmazza, ami nagyjbl megfelel a vlasz XML bortk mretnek. A C oszlop azt jelli, hogy egy tlagos eredmnysornak mekkora a mrete, mg a D oszlop azt mondja meg, hogy egy ilyen eredmnysorban hny rsztvev azonostja vihet t. Az E oszlop ez alapjn azt mondja meg, hogy a teljes 65KB mret zenet esetben maximum hny rsztvev vihet t egyszerre, az XML bortk mrett nem szmolva (~(65000-B)*D/C). Teht az elemzrendszer lekrdezseiben maximum az E oszlop rtkeinek megfelel kapcsolat vihet t, ami a jelenlegi konfigurci technikai korltja az elemzsi zenetkezelsre nzve. Ezzel visszafele kiszmthat, hogy egy olyan lekrdezs esetben melyeknl tlagosan 5 kapcsolat van minden rsztvev kztt, a rendszer csak 238/5, vagyis 47 rsztvevt tud egyszerre megjelenteni, a rsztvev kapcsolat elemzs esetben. A korlt termszetesen nvelhet az alaprtelmezett WCF zenet mretkorlt nvelsvel, de arnyaiban a mrt rtkeknek megfelelen nem fog vltozni.
57
8. sszefoglals
Diplomatervemben a feladatkirsnak megfelelen az zleti intelligencia fogalomkrnek s aktulis megoldsainak ismertetsvel, valamint a vllalati krnyezet s kommunikci lehetsgeinek, problmakrnek elemzsvel relis clokat tztem ki egy vllalati kommunikcit elemz rendszer tervezshez s megvalstshoz. Megalkottam egy ltalnosan hasznlhat fogalmi-modellt s az erre pl elemzsi s brzolsi koncepcikat is vllalati kommunikci elemzshez. Diplomamunkm ugyanakkor a sokfle kommunikcis csatorna figyelembevtelvel nagy s sszetett feladatnak bizonyult, ezrt dolgozatom csak az e-mail gyjts s feldolgozs rszleteinek tervezsre s megvalstsra tr ki. Az elemzsi fzisban ismertetett funkcik alapjn a rendszer tervezsekor a vllalati IT krnyezet sajtossgait s a modern mrnki megoldsokat figyelembe vve felptettem a rendszer architektrjt, megterveztem logikai adatmodelljt s adatbzis smjt, tovbb kidolgoztam az egyes modulok s komponensek rszleteit is. A rendszer implementcija sorn a megtervezett modulokat s komponenseket a szvegbnyszati modulok kivtelvel kifejlesztettem, gy az t f funkcionlis egysget megvalstottam, melynek eredmnyeknt elkszlt a kommunikcit elemz rendszer. A rendszer az ltalnosan hasznlhat kommunikcis modell segtsgvel ms kommunikcis csatornra pl, betlt alrendszerek bekapcsolst is tmogatja, gy a jvben elkszlhet egy a teljes vllalatot lefed kommunikcit elemz rendszer is, ami az e-mailek, azonnali zenetek s faxok mellett kpes lesz akr a telefonbeszlgetsek szvegg alaktsra s elemzsre is. A fejleszts sorn az egyes modulokat, komponenseket s alrendszereket folyamatosan teszteltem, ellenriztem s javtottam, aminek eredmnyeknt a rendszer mkdse vgl helyesnek bizonyult a kitztt funkcionlis clok megvalstsval. Az rtkels sorn a rendelkezsemre ll konfigurcin elvgzett mrsek alapjn ismertettem az email betlt alrendszernek teljestmnyt s annak fokozsnak lehetsgeit, valamint a klienssel vgezhet elemzsek s brzolsok teljestmnyt s technikai korltait, ugyanakkor rmutattam ezek kikszblsnek lehetsgeire is. Szndkaim szerint az elkszlt kommunikci elemz rendszer jvbeli tovbbfejlesztsvel s az e mail mellett tovbbi kommunikcis-csatornkra elksztett zenetgyjt komponenseivel a vllalatok szmra hasznos s teljeskr elemz rendszerr vlik
58
image
audio
video
application
multipart
model message
59
A szemly s csoport egyedeknl itt jegyzend meg, hogy azok a Rsztvev egyed altpusai, ezrt ISA kapcsolattal rklik a rsztvev egyed attribtumait. A csoport egyedeinl azrt nem jelltem attribtumokat, mivel a rsztvev attribtumai pontosan lefedik ezeket.
60
A1. bra Az e-mail pufferel modul (caEmailBufferParser) UML osztlydiagramja A SimpleMail osztly vgzi a getAllContent() fggvny segtsgvel a levl teljes tartalmi rszeinek, vagyis a trgynak, a levl szvegnek s a csatolmnyok szveges reprezentnsainak sszefzst is egy string mezbe. Egy arra megfelel logika a kivonatolsi szablyok alapjn, szvegbnyszati mdszerekkel a teljes tartalombl kiemeli annak kulcsszavait s meghatrozza. A megvalstott rendszerben jelenleg csak a sima szveges tartalmak kinyerse s sszefzse lett kifejlesztve, a PDF, DOC s ms szveges fjlok tartalmnak dekdolsa nincs megoldva.
61
62
A3. bra Elemzsi eredmnyosztlyok A hrom megvalstott eredmnyosztly az eredmnyhalmaz 1-1 sort prezentljk, a teljes halmazt .NET generikus lista trolja. Ezek az osztlyok az elemzs eredmnynek szempontjbl csak a legfontosabb adatokat tartalmazzk a minimlis hlzati adatforgalom rdekben.
63
Adathordoz tartalma
A csatolt adathordoz tartalmazza e dokumentum elektronikus vltozatt, valamint az albbi elemeket
Binaries mappa
E mappa tartalmazza a lefordtott kliens (caClient), szerver (caServer) s az e-mail betlt alrendszer komponenseinek binrisait (caEmailAgents).
Docs mappa
E dolgozathoz kszlt brk, tblzatok s egyb dokumentumok szerkeszthet vltozatai
References mappa
Az elemzrendszer megvalstshoz felhasznlt kls komponensek disztribcii.
Screenshots mappa
A rendszer futsrl kszlt kpernykpeket tartalmaz mappa
Scripts mappa
Ez a mappa tartalmazza az elemz adatbzis smjt, a smt rt s teszt adatokkal feltlt SQL fjlokat, valamint a szerver komponens WCF szolgltatst engedlyez netsh shell scriptet is.
Sources mappa
A megvalstott rendszer Java s .NET forrskdjt tartalmaz mappa.
futtats: java -jar caEmailBufferer.jar parancssori paramterek: - property <PROPERTY FJL> Belltsokat tartalmaz fjl betltse alaprtelmezsben caEmailBufferer.settings verbose Beszdes zemmd bekapcsolsa, fleg log fjlok generlshoz delete_buffered Sikeresen pufferelt zenetek trlse a forrsmappbl
64
futtats: java -jar caEmailBufferParser.jar parancssori paramterek: - property <PROPERTY FJL> Belltsokat tartalmaz fjl betltse alaprtelmezsben caEmailBufferParser.settings verbose Beszdes zemmd bekapcsolsa, fleg log fjlok generlshoz
Elemzs kiszolgl
Az adatbzis sma Oracle adatbzis al trtn teleptse s a WCF service engedlyezse utn az elemzs kiszolgl a caServiceHost.exe konzolalkalmazssal indthat. Indts utn a konzolon megjelenik, hogy a kliensek milyen url-en csatlakozhatnak hozz. A szerver szolgltatsait Web Service-en keresztl ltja el, melynek WSDL je lekrdezhet futs kzben a http://localhost:8511/caService?wsdl url-rl.
Kliens alkalmazs
A kliens alkalmazs futtathat ClickOnce teleptssel vagy telepts nlkl is. Amennyiben a felhasznl azonban az alkalmazs teleptse mellett dnt, gy indtskor a szoftver ellenrzi, hogy van -e frissebb verzija s amennyiben tall, felajnlja az automatikus frisstst. A kliensek a caClient.exe alkalmazssal indthatk, melyek ezutn a megjelen kapcsolatkezelsi felleten csatlakozhatnak az elemzs kiszolglra.
65
C fggelk Kpernykpek
C1. bra Kapcsolati hl elemzs eredmnye szemly nzet, irnyts nlkli md
Adorjn R
A kpernykpen egy kapcsolati hl elemzs eredmnye lthat, melyben a rsztvevket konkrt szemlyekknt brzoltuk, a kapcsolatok irnytst pedig kikapcsoltuk. C2. bra Kapcsolati hl elemzs eredmnye csoport nzet, irnytott md
66
A C2 bra a korbbi elemzssel megegyez eredmnyt mutatja csoport nzetben, irnytott kapcsolati lekkel. A kliens oldalon a gyorsttrazott csoporttagsgok ismeretben a program a szemlyeket tagsgi adataik szerint csoportostotta. C3. bra A rendszer ltal regisztrlt ismeretlen rsztvevk listja
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
A C3 bra szemllteti, hogy ha a rendszer egy e-mailhez nem tallja az adott rsztvevt, gy ismeretlenknt rgzti Registered sttusszal, melyet ksbb az adminisztrtor lecserlhet vagy sszefslhet vals felhasznli rekordokkal, a C4 brn lthat rsztvev cserl eszkz segtsgvel. C4. bra Rsztvev cserl eszkz kpernykpe
67
A C5 bra azt szemllteti, hogy egy rsztvevnek akr tbb cme is lehet a rendszerben, tbbfle csatornhoz is. C6. bra Murti Csald nev csoport tagjai s csoportjai
68
Irodalomjegyzk
1. Ensor, Dave s Stevenson, Ian. - Oracle-tervezs Budapest: Kossuth Kiad, 2000. 2. Laudon, Kenneth C. s Laudon, Jane P. Management Information Systems: Managing the Digital Firm (9th Edition). Prentice Hall, 2005. 3. Power, Daniel J. - A Brief History of Decision Support Systems DSSResource.com. [Online] 2007. mrcius 10. [Hivatkozva: 2010. mrcius 27.] http://dssresources.com/history/dsshistory.html 4. Raffai, Mria - Informcirendszerek fejlesztse s menedzselse Budapest: Novadat Kiad, 2003. 5. Kvri, Attila BI Projekt: Adattrhz s zleti intelligencia zleti intelligencia (Business Intelligence, BI) fogalma [Online] 2007. oktber 27. [Hivatkozva: 2010. mrcius 20.] http://www.biprojekt.hu/Uzleti-intelligencia-Business-Intelligence-BI.htm 6. Kkai, Bln - zleti Intelligencia az Informatikban Dunajvros: Fiskolai Kiad, 2005. 7. Luhn, H.P. - A Business Intelligence System. IBM Journal. 1958. oktber, old.: 314-319. 8. Dresner, Howard - Business Intelligence at age 17. China Martens, Computerworld, 2006. oktber 23. 9. Anandarajan, Murugan, Anandarajan, Asokan s Srinivasan, Cadambi A. Business Intelligence techniques: a perspective from accounting and finance New York: Springer, 2004. 10. Newing, Rod. - Higher Intelligence Racounter on Business Intelligence. 2009. december 1, old.: 6. 11. Farrel, Vicky. HP Business Intelligence Solutions BI Trends and New Generation of Business Intelligence [Online] 2010. 03 19. [Hivatkozva: 2010. 03 29.] http://www.communities.hp.com/online/blogs/business-intelligenceblog/archive/2010/03/19/bi-trends-and-the-new-generation-of-business-intelligence.aspx. 12. Gartner - Gartner Identifies the Top 10 Strategic Technologies for 2009 [Online] 2008. oktber 14. [Hivatkozva: 2010. mrcius 21.] http://www.gartner.com/it/page.jsp?id=777212
69
13. Vesset, Dan s McDonough, Brian - Worldwide Business Intelligence Tools 2008 Vendor Shares IDC paper, 2009. 14. Oracle Magyarorszg - Az Oracle Business Intelligence megoldsai [Online] 2010. [Hivatkozva: 2010. 03 29.] http://www.oracle.com/global/hu/business_intelligence/index.html 15. Couper, Ben - Racounter on Business Intelligence, Introduction 2009. december 1, old.: 1. 16. Bakacsi, Gyula. Szervezeti magatarts s vezets Budapest: KJK-KERSZV Jogi s zleti Kiad, 2003. 17. IETF, Network Working Group - Multipurpose Internet Mail Extensions (MIME) Part I-V. IETF, 1996. RFC 2045-2049. 18. IETF, Network Working Group - Internet Message Format The Internet Society, 2001. RFC-2822. 19. Sun Microsystems, Inc - JavaMail Guide for Service Providers Palo Alto: Sun Microsystems, Inc, 1998. 20. Oracle Inc. - Oracle Data Provider for .NET Developer's Guide 11g Release 1 Oracle Inc, 2009. 21. Bgel, Gyrgy - IQSqs Blog Intelligencia [Online] 2006. szeptember 27. [Hivatkozva: 2010. mrcius 18.] http://www.iqsys.hu/web/guest/blog/-/blogs/28816/maximized 22. Ward, J. - Principles of Information Systems Management New York: Routledge, 1995. 23. Ditter, Harald - The Value of Business Intelligence Bucharest: Ensight Management Consulting, 2009. 24. Laudon, Kenneth C. s Laudon, Jane Price Management Information System: A Contemporary Perspective New York: Macmillan Publishing, 1988. 25. Ackoff, Russel L. s Emery, Fred. On purposeful systems: an interdisciplinary analysis of individual and Social Behavior as a System of Purposeful Events New Jersey: Aldine, 2006. 26. Gajdos, Sndor - Adatbzisok Budapest: Megyetemi Kiad, 2006. 27. Hewlett-Packard. Top 10 Trends in Business Intelligence for 2010 28. Mager, Johannes. Deep Email Miner Application Sydney: University of Technology, Sydney, 2006
70