You are on page 1of 78

Budapesti Mszaki s Gazdasgtudomnyi Egyetem Villamosmrnki s Informatikai Kar Tvkzlsi s Mdiainformatikai Tanszk

Vllalati kommunikcit elemz rendszer tervezse s megvalstsa

Murti kos JNC2FC

Konzulens Kardkovcs Zsolt

Diplomaterv 2010

Nyilatkozat
Alulrott Murti kos, a Budapesti Mszaki s Gazdasgtudomnyi Egyetem hallgatja kijelentem, hogy ezt a diplomatervet meg nem engedett segtsg nlkl, sajt magam ksztettem, s a diplomatervben csak a megadott forrsokat hasznltam fel. Minden olyan rszt, melyet sz szerint, vagy azonos rtelemben, de tfogalmazva ms forrsbl tvettem, egyrtelmen, a forrs megadsval megjelltem. Budapest, 2010. mjus 14. Murti kos

Kivonat
Diplomatervem trgya a vllalati kommunikci elemzse. A cl egy olyan zleti intelligencia (BI) rendszer tervezse s megvalstsa, amely a vllalati (pl. e-mailes) kommunikci elemzst tmogatva teszi lehetv a szervezet struktrjtl eltr csoportok feltrkpezst, gymenetek nyomon kvetst s az egyes szereplk terheltsgnek mrst. A bevezet rszben nemzetkzi szakirodalom alapjn ismertetem az zleti intelligencia fogalmt, fogalmnak kialakulst s a szakterlet jelentsgt. Bemutatom a napjainkban alkalmazott zleti intelligencia rendszereket, majd a fejezet vgn arra a megllaptsra jutok, hogy jelenleg nem rhet el olyan BI megolds, ami hatkonyan tmogatja a vllalati ignyeknek megfelel kommunikcielemzst. Dolgozatom stratgiai s elemz szakaszban bemutatom a vllalati kommunikcis krnyezet elemzsnek tmakrt s lehetsgeit, melyekre alapozva kidolgozom az elemzs koncepcijt. Elemzsi mdokat s azokhoz vizualizcis lehetsgeket definilok, valamint egy fogalmi modellt is fellltok a kommunikci-elemzsre. Rviden ismertetem a vllalatokon bell tipikusan elfordul kommunikcis csatornkat, majd rszletesen ismertetem az e-mail-elemzs lehetsgeit, az abbl kinyerhet informcikat. Kifejtem a feldolgozs feladatait s problmit, tovbb bemutatok s rtkelek egy e-mail elemz rendszert, a Deep Email Miner alkalmazst. A rendszerterv bemutatsa sorn rszletesen ismertetem a megvalstand funkcikat, a tervezi dntsek httert, s bemutatom a rendszer architektrjt s komponenseit is. A korbban definilt fogalmi modell alapjn felptem a rendszer logikai adatmodelljt, majd az elemzs-orientlt adatbzisok szoksos tervezsi szempontjait figyelembe vve tervezem meg az elemzrendszer adatbzisnak csillag-smjt. Diplomatervem 6. fejezetben az elemzrendszer megvalstst s megvalstsi krnyezett ismertetem. Bemutatom a rendszer klnbz funkciit ellt modulok implementcijt, s ismertetem azokat az eszkzket s komponensknyvtrakat, amelyeket felhasznltam. Dolgozatom az elkszlt rendszer rtkelsvel zrom, melynek sorn rszletesen kitrek az egyes modulok: az zenetek gyjtst, elemzst s brzolst megvalst komponensek rtkels re. A tesztek mellett kpernykpekkel illusztrlom az eredmnyt, hiszen a vizualizci fontos rsze az elemzrendszernek. Szndkaim szerint az elkszlt kommunikci elemz rendszer jvbeli tovbbfejlesztsvel s az email mellett tovbbi kommunikcis-csatornkra elksztett zenetgyjt komponenseivel a vllalatok szmra hasznos s teljeskr elemz rendszerr vlik.

Abstract
The subject of my thesis is the analysis of corporate communication. The purpose of this paper is to design and implement a Business Intelligence (BI) system which supports the discovery of those communication groups who are different from the organization structure, the tracing of specific cases and the load measurement of each communication participant. In the introduction I present the concept and significance of Business Intelligence and those corporate demands which have led to the evolution of BI, and I also enumerate some BI solutions, which are being applied in our days. At the end of this chapter I declare that there is no available BI solution which could support corporate communication analysis in its entirety. The strategic and analysis section of my paper demonstrates the general corporate communication environment and its possibilities from the aspect of analysis, and I set up the concepts and principles of the communication analysis based on those. I define some analytical method and visualization possibilities and I also design the semantic model of the communication analysis. Henceforward I briefly summarize the typical corporate communication channels and then I specify the details and possibilities of e-mail analysis and those information which can be extracted from it. I describe the required tasks and problems of the e-mail processing, then I introduce and evaluate an email analyzer application called Deep Email Miner. In the chapter of System Design, I specify the system architecture, the components and functions to be implemented and I also describe the decisions I made during the planning period. Based on the previously defined semantic model, I created the logical data model of the system and I also designed the star-schema of my systems database considering the design principles of analytical-databases. Section 6 describes the development and implementation of my system, including the implemented functions, developed modules and those tools, environments and component libraries which have been used for the implementation. The final part of my thesis evaluates and summarizes the engineering and development results of my Communication Analyzer Systems. During the evaluation I specify the details of message collection, analysis and visualization components, illustrating with measurements and screenshots as the visualization components being important parts of the system. My intention is that the Communication Analyzer System - with further improvements and more communication channel collection modules beyond e-mail - be a useful, efficient and complete solution for corporate communication analysis.

Tartalomjegyzk
1. 2. Bevezet ............................................................................................................................. 1 Az zleti intelligencia ........................................................................................................ 2 2.1. Vllalati informcis rendszerek fejldse .................................................................. 2 2.2. Az zleti intelligencia fogalma .................................................................................... 5 2.3. Trendek s megoldsok napjainkban ........................................................................... 8 Stratgiai fzis ................................................................................................................. 12 3.1. Krnyezet felmrse .................................................................................................. 12
3.1.1. 3.1.2. Vllalati krnyezet s kommunikci kapcsolata ......................................................... 12 Tipikus vllalati kommunikcis csatornk .................................................................. 13

3.

3.2. 3.3.

A vllalati kommunikci-elemzs lehetsgei ........................................................ 15 Az elemzsi ignyek s brzols koncepcija ......................................................... 16


Kapcsolati hl .............................................................................................................. 16 Tma Rsztvev trkp .............................................................................................. 16 Folyamattrkp .............................................................................................................. 17

3.3.1. 3.3.2. 3.3.3.

3.4. 4.

Megvalstand rendszerfunkcik sszefoglalsa ..................................................... 18

Elemzsi fzis ................................................................................................................... 19 4.1. E-mailek az elemzs szemszgbl ........................................................................... 19


4.1.1. 4.1.2. 4.1.3. Trtneti ttekints ........................................................................................................ 19 Szabvnyok s ajnlsok ............................................................................................... 19 zenet-formtum rszletei ............................................................................................ 21

4.2. 4.3.

Termszetes fogalmak sszefoglalsa ....................................................................... 23 Kommunikci-elemzs fogalmi modellje ................................................................ 24


ltalnos kommunikcis modell ................................................................................. 24 Kommunikcis folyamat szintjei ................................................................................. 26 A tartalomkezels szintjei.............................................................................................. 27 Gyjts, megfigyels ..................................................................................................... 28 Feldolgozs .................................................................................................................... 29 Trols ........................................................................................................................... 29 Elemzs ......................................................................................................................... 29 Hozzfrs ..................................................................................................................... 29 Szemlyek azonostsa .................................................................................................. 30 Csoportok azonostsa ................................................................................................... 30 Szlak azonostsa ......................................................................................................... 30 Tbbszrs feldolgozs elkerlse ................................................................................ 31 Idbeli kauzalits biztostsa ......................................................................................... 31 Tartalom kibontsa ........................................................................................................ 31 Tartalmak kivonatolsa ................................................................................................. 31 Vllalati krnyezet elismerete ..................................................................................... 32 Deep Email Miner ......................................................................................................... 32

4.3.1. 4.3.2. 4.3.3.

4.4.

Funkcik meghatrozsa ........................................................................................... 28

4.4.1. 4.4.2. 4.4.3. 4.4.4. 4.4.5.

4.5.

A feldolgozs feladatai s problmi......................................................................... 30

4.5.1. 4.5.2. 4.5.3. 4.5.4. 4.5.5. 4.5.6. 4.5.7. 4.5.8.

4.6. 4.7.

Jelenlegi elemz megoldsok ttekintse .................................................................. 32 Elemzsi fzis sszefoglalsa .................................................................................... 33

4.6.1.

5.

Tervezsi fzis.................................................................................................................. 34 5.1. Tervezi dntsek ...................................................................................................... 34


5.1.1. 5.1.2. 5.1.3. 5.1.4. 5.1.5. Hromrteg gyfl-kiszolgl architektra ................................................................. 34 Web Service alap kliens-szerver kapcsolat .................................................................. 34 E-mailek gyjtse s feldolgozsa ................................................................................. 34 Krnyezet kivlasztsa .................................................................................................. 35 Adatbzisszerver kivlasztsa ....................................................................................... 36 E-mail betlt alrendszer ............................................................................................... 37 Kzs Rendszerknyvtrak s osztlyok ...................................................................... 38 Elemzs kiszolgl ........................................................................................................ 39 Kliens alkalmazs .......................................................................................................... 40 Elemzsi adatbzisszerver ............................................................................................. 41 Logikai adatmodell ........................................................................................................ 41 Fizikai adatmodell ......................................................................................................... 42 Csillag-sma kialaktsa ................................................................................................ 43 Sun JavaMail TM API ..................................................................................................... 45 Microsoft GLEE MS AGL ......................................................................................... 45 Oracle Data Provider ..................................................................................................... 45

5.2.

Alrendszerek s modulok meghatrozsa .................................................................. 36

5.2.1. 5.2.2. 5.2.3. 5.2.4. 5.2.5.

5.3.

Adatbzis tervezse ................................................................................................... 41

5.3.1. 5.3.2. 5.3.3.

5.4.

Kls komponensek .................................................................................................. 45

5.4.1. 5.4.2. 5.4.3.

6.

Rendszer fejlesztse ........................................................................................................ 46 6.1. Krnyezet ismertets ................................................................................................. 46 6.2. Implementci ........................................................................................................... 46
6.2.1. 6.2.2. 6.2.3. 6.2.4. E-mail betlt alrendszer ............................................................................................... 46 Kzs rendszerknyvtrak s osztlyok caCoreLibrary............................................. 47 Elemzs kiszolgl - caServiceHost .............................................................................. 48 Kliens alkalmazs caClient projekt ............................................................................ 49

7.

rtkels........................................................................................................................... 51 7.1. E-mail betlt alrendszer rtkelse .......................................................................... 51


7.1.1. Teljestmny rtkelse ................................................................................................. 51 Elemzsi modulok bemutatsa ...................................................................................... 52 brzols rtkelse ...................................................................................................... 56 Elemzs hlzati rtkelse ........................................................................................... 57

7.2.

Elemzs rtkelse ..................................................................................................... 52

7.2.1. 7.2.2. 7.2.3.

8.

sszefoglals .................................................................................................................... 58

A fggelk Elemzs s Tervezs ......................................................................................... 59 A1. MIME ftpusok ............................................................................................................ 59 A2. Logikai adatmodell attribtumai s kulcsai ................................................................... 60 A3. caEmailBufferParser projekt implementcija .............................................................. 61 A4. Kzs rendszerknyvr ................................................................................................. 62 A5. Elemzsi eredmnyosztlyok ......................................................................................... 63 B fggelk A rendszer hasznlata ...................................................................................... 64 C fggelk Kpernykpek ................................................................................................ 66

brajegyzk
1. bra Vllalati szerepkrk s tmogatrendszereik a 90-es vekben s napjainkban..................... 8 2. bra Kapcsolati hl koncepcionlis brja ................................................................................... 16 3. bra Tma Rsztvev trkp koncepcionlis brja ..................................................................... 17 4. bra Feldertett folyamattrkp koncepcionlis brja ................................................................... 17 5. bra Interneten keresztl trtn e-mail kzbests koncepcionlis brja ..................................... 20 6. bra Kommunikci ltalnos modellje .......................................................................................... 25 7. bra Kommunikci-elemzs fogalmi modelljnek sematikus brja ........................................... 25 8. bra Vllalati kommunikcit elemz rendszer funkcionlis hierarchija ..................................... 28 9. bra Kommunikcit elemz rendszer architektrja s funkcionlis felosztsa........................... 36 10. bra Logikai adatmodell Entits Relcis Diagramja ................................................................ 42 11. bra Tervezett Csillag-sma Entits- Relci Diagramja ............................................................. 43 12. bra Az elemz adatbzis csillag-smja ..................................................................................... 44 13. bra A rendszer ltalnos elemzfellete ..................................................................................... 53 14. bra Kapcsolati hl vizualizcis modulja ................................................................................. 54 15. bra Tma-rsztvev elemzs vizualizcis modulja ................................................................... 55 16. bra Folyamat felderts vizualizcis modulja ........................................................................... 56 A1. bra Az e-mail pufferel modul (caEmailBufferParser) UML osztlydiagramja ....................... 61 A2. bra - Kzs rendszerknyvtr fontosabb osztlyai s enumercii .............................................. 62 A3. bra Elemzsi eredmnyosztlyok............................................................................................... 63 C1. bra Kapcsolati hl elemzs eredmnye szemly nzet, irnyts nlkli md ...................... 66 C2. bra Kapcsolati hl elemzs eredmnye csoport nzet, irnytott md .................................. 66 C3. bra A rendszer ltal regisztrlt ismeretlen rsztvevk listja ..................................................... 67 C4. bra Rsztvev cserl eszkz kpernykpe ............................................................................. 67 C5. bra Murti kos rsztvev rekordja s cmei ........................................................................... 68 C6. bra Murti Csald nev csoport tagjai s csoportjai ................................................................ 68

Tblzatjegyzk
1. tblzat 'Murti kos' kifejezs kdolsai egy e-mail fejlc mez rtkeknt ..................... 22 2. tblzat Gyakori e-mail fejlc mezk s jelentsk ....................................................................... 22 3. tblzat E-mailek tartalmi elemeit ler mezk s jelentsk ........................................................ 23 4. tblzat E-mail betlt alrendszer ltal hasznlt puffer tbla ......................................................... 37 5. tblzat Fejlesztshez s tesztelshez hasznlt hardver- s szoftverkonfigurci .......................... 46 6. tblzat Kzs rendszerknyvtr moduljai s szerepk ................................................................. 47 7. tblzat Kzs rendszerknyvtr fontosabb osztlyai s szerepk ................................................ 47 8. tblzat Kiszolgl oldali rendszeradminisztrcis eljrsok ........................................................ 48 9. tblzat Kommunikci-elemzst megvalst eljrsok s eredmnytpusaik ............................. 49 10. tblzat Kliens funkcikat megvalst rlapok s lersuk ........................................................ 49 11. tblzat brzolst megvalst vezrlk osztlyai s lersaik .................................................. 50 12. tblzat E-mail betlt alrendszer modulok tesztjnek mrsi eredmnyei ................................. 52 13. tblzat GLEE brzolsi teljestmnye klnbz csompont s l konfigurcik esetben .... 56 14. tblzat Egy kommunikcis elemzsi zenet alatt tvihet rsztvevk szma .......................... 57 A1. tblzat MIME ftpusok s magyarzataik nhny gyakori pldval ........................................ 59 A2. tblzat Logikai adatmodell egyedei, kulcsai s attribtumai ..................................................... 60

1. Bevezet
A kommunikci sidk ta az emberi tevkenysg mindennapos rsze. Segtsgvel kpesek vagyunk kifejezni gondolatainkat, rzseinket s szndkainkat, ezltal az egyttmkds, hatskifejts s visszacsatols alapvet eszkze. Cljaink elrsben kulcs szerepe van annak, hogy milyen mdon, mennyire sikeresen vagyunk kpesek kommuniklni vagy ppen elhallgatni cselekedeteink hatst s szndkainkat, hiszen tetteink nmagukban nem elegendek szemlyisgnk kls megtlsben. Nagy ltalnossgban ugyanez elmondhat a vllalatok esetben is, a klnbsg csupn annyi, hogy egy szervezetben a vezetk ltal kijellt clok elrse nem csak egy, hanem jval tbb ember egyttes munkjtl, fellpstl s kommunikcijtl fgg, amelyek sszehangolsa s kvetse nehz feladat. Napjainkban szmtalan eszkz s technolgia ll a szervezetek rendelkezsre, amelyek hatkonyan tmogatjk a munkavgzst, a munkafolyamatok automatizlst, az erforrsok felhasznlst s segtsget nyjtanak az adatok, informcik s a tuds ellltsban, kinyersben vagy terjesztsben, elsegtve a dntsi helyzetek megfelel, jl informlt elksztst, a szereplk egyttmkdst, kommunikcijt s a mobilitst. Az zleti intelligencia megoldsok szleskr terjedsvel a vllalatok egyre szlesebb s rszletesebb betekintst kaphatnak bels s kls krnyezetk rszleteirl, viszonyairl s mkdsrl, azonban jelenleg mg nincs olyan szles krben elrhet ltalnos megolds, amely az emberi kommunikcis folyamatok feltrkpezsre s elemzsre szolglna. Diplomamunkm clja a fenti problmakr megvizsglsval egy olyan modell s rendszer megtervezse s elksztse, amely kpes a vllalati kommunikci hatkony lersra s tovbbi elemzs cljbl trtn felhasznlsra modern mrnki megoldsok felhasznlsval. A feladat bonyolultsgt s lehetsgeimet figyelembe vve a szmtalan kommunikcis csatorna kzl a bemeneti oldal implementlst az e-mailek gyjtsre s feldolgozsra szktettem, melynek egyedi problmakrt rszletesen bemutatom, m a jvbeli fejlesztseket szem eltt tartva a modell s a rendszer is fel lett ksztve ms csatornkrl rkez zenetek lersra s elemzsre. Ugyanakkor diplomamunkmnak nem clja a kommunikci tartalmi rszeinek szemantikus rtelmezse, hiszen e problmakr nmagban is hatalmas, amelyre klnll tudomnyg pl. A tartalmi kivonatolst ezrt csak a tervezsnl vettem figyelembe a ksbbi megvalsts cljbl.

2. Az zleti intelligencia
Az zleti intelligencia megoldsok nagyban segtik a vllalatok mkdsnek hatkonysgnvelst s javtjk a tervezhetsgt, amit a versenyelny megszerzsnek egyik f eszkzeknt jellemeznek. Valamennyi IT piackutat felmrse alapjn az informatikai-vezetk vek ta az egyik els szm prioritsknt nevezik meg az zleti intelligencia megoldsok alkalmazst s fejlesztst. Ahhoz, hogy tisztban lehessnk e fogalom jelentsvel, meg kell rtennk azokat az ignyeket s krlmnyeket, amelyek a klnbz vllalati informcis rendszerek kialakulshoz s vgl az zleti intelligencia megjelenshez vezettek.

2.1. Vllalati informcis rendszerek fejldse


E fejezetben rviden sszefoglalom az zleti intelligencia rendszerek ltrejttben szerepet jtsz Vllalati Informcis Rendszerek fejldsnek fontosabb llomsait Dave Ensor, Ian Stevenson [1], a Laudon hzaspr [2], Daniel J. Power [3], Raffai Mria [4], Kvri Attila [5] s Kkai Bln [6] munki alapjn. Munkamegoszts szempontjbl egy vllalaton bell klnbz funkcionlis terleteket

klnbztethetnk meg, mint pldul a pnzgyi-szmviteli, kereskedelmi, humnerforrs, stb.. Ugyanakkor a szervezeti struktra vertiklis felbonts alapjn pedig ltalnosan 4 szintre oszthat, melyben a legals, operatv szinten a szervezet alapvet feladatainak, tranzakciinak s munkafolyamatainak elltsa trtnik. A kvetkez szinten a funkcionlis vezetk vgzik feladataikat, akik a terletknek megfelelen az operatv tevkenysg koordinlsval s ellenrzsvel foglalkoznak. A dnts-elksztst vgz vezetk, a hierarchia kvetkez lpcsfokt kpviselik, akik a vllalat stratgiai cljainak megfelelen egy magasabb szinten ellenrzik s hangoljk ssze annak tevkenysgt s ezeknek megfelelen hatroznak meg kzptv clokat s adnak javaslatokat a felsvezets szmra a hossz tv clok kijellsre. A vllalat fggleges felosztsnak cscsn a stratgiai azaz felsvezeti szint tallhat, ahol a hossz tv stratgiai s tulajdonosi clok kijellse trtnik. A fentieket figyelembe vve rthet, hogy a szervezetek minden egyes szintjn s terltn szksg van a pontos s megfelel informcikra, melyek ellltsa, trolsa, tiszttsa, rendszerezse, sszegzse s elemzse hatkony eszkzk tmogatsa nlkl lehetetlen feladat. A modern rtelemben vett zleti intelligencia rendszerek fejldse az 1960-as vek msodik felig vezethet vissza. Ebben az idben a fejlett adatfeldolgoz technikknak ksznheten a szervezetek mr rendelkeztek olyan egymstl elszigetelt rendszerekkel, amelyek lehetv tettk a vllalat gyfl-

menedzsmentjt1, tranzakciinak2, folyamatainak3, adminisztratv feladatainak automatizlt elltst4 s hatkonyabb erforrs kezelst5 is. sszefoglal nven az ilyen megoldsokat Vgrehajtst Tmogat Rendszereknek, azaz Operation Support System (OSS) megoldsoknak hvjunk, melyek fejlettebb utdai vgzik napjainkban is a vllalatok operatv tevkenysgnek dnt rszt. Br az Integrlt Vllalatirnytsi Rendszerek technolgiai s koncepcionlis tren is jelents fejldsen mentek keresztl, csak korltozott mrtkben kpesek a vllalat egszt rint krdsek megvlaszolsra, s a felsbb szinteken trtn vezeti munka tmogatsra. Az OSS-ek elssorban arra lettek optimalizlva, hogy mkdsk sorn nagy mennyisg adatot rgztsenek, kezeljenek s dolgozzanak fel a vllalat folytonos s megbzhat mkdst biztostva, gy sem adatszerkezetkben, sem pedig erforrsaikban nem kpesek megfelelen tmogatni a vezeti ignyeknek megfelel idszakos vagy ad-hoc elemzsek vgrehajtst vagy azok tbb szempontbl trtn prezentlst. A fenti problmk figyelembevtelvel szlettek meg az els az gynevezett vezeti informcis rendszerek (Management Information System, MIS), melyek modern rtelemben az els jelentskszt eszkzknek tekinthetk. Kezdetben ezek a szoftverek gyakorlatilag egyszer, interakci nlkli jelentsgenerl szoftverek voltak, melyek rszben az OSS-ek, rszben pedig sajt adatbzisukra tmaszkodva ksztettek elre definilt ignyek alapjn riportokat a magasabb szinten lv vezetk szmra. Legnagyobb htrnyuk az volt, hogy lekrdezsek s jelentsek sszelltshoz olyan elemz s tervez szakemberek segtsgre volt szksg, akik az zleti ignyeket s krdseket kpesek voltak az adatok szintjre lefordtani. Az IBM a vezeti informcis rendszerek fnykorban kezdett egy olyan interaktv rendszer fejlesztsbe, amely knnyen rthet s kezelhet felletet adott htkznapi felhasznlk kezbe, az adatok geolgiai szempontbl trtn analizlsra s megjelentsre. A szoftver a Geodata Analysis and Display System (GADS) nevet viselte, amit geolgiai adatokat elemz s megjelent rendszerknt fordthatunk magyarra. A hetvenes vek msodik felre a termket mr tbb rendrsg, tzoltsg, nkormnyzat s kzlekedsi trsasg is alkalmazta klnbz terleti, vezeti vagy tvonal-tervezsi feladatok megoldshoz. Az eltr brzolsi s elemzsi szempontok mellett ugyancsak ebben az idben kezdett egyre nvekv s tudatosabb figyelem irnyulni a fels zleti dntsek informatikai tmogatsra. A szervezet-kutats nll tudomnygg fejldsnek s az zleti tevkenysg rendszer alap felfogsnak ksznheten kialakultak a klnbz dntstmogat rendszerek (Decision Support System, DSS). A DSS nagy

CRM Customer Relationship Management, azaz gyflkezelsi rendszer TPS Transaction Processing System, azaz Tranzakci-feldolgoz rendszerek 3 PCS Process Control System, WF - Workflow System, azaz folyamatirnyt s munkafolyamat rendszerek 4 OAS Office Automation System, azaz irodaautomatizlsi rendszerek. 5 ERP Enterprise Resource Planning, azaz vllalatirnytsi rendszer
1 2

elnye abban jelentkezett, hogy fejlettebb, felhasznlbart felleteivel a vgfelhasznlk kezbe adta a rendszerben lv informcikkal kapcsolatos jelentsek sszelltsnak s brzolsnak lehetsgt, ugyanakkor egyszerre tmogatta a fizikai adatokon s az arra pl logikai modellen megfogalmazott lekrdezsek kezelst is. A dntstmogat s vezeti informcis rendszerek rtelmezse az vek-vtizedek alatt tbbszr is trtkeldtt, ugyanakkor fejldsk trvnyszernek tnik az eltr s folyamatosan vltoz vllalati ignyek mellett. A gyrtk ezeket az eltr ignyeket MIS s DSS megoldsaik kr szervezd klnbz funkcicsomagokkal prbltk megoldani. Ezek a kzpvezeti szinteken ltalnossgban megfelelek voltak, de a felsvezetk teljes vllalatra vonatkoz informcis ignyeit, mr nem tudtk teljes mrtkben kielgteni. E fontos igny ptlsra alakultak ki az Executive Information System (EIS)6 megoldsok, melyek szemlyre szabottan nyjtottak a felsvezetk szmra magas szint s aggreglt pnzgyi valamint statisztikai informcikat a vllalat egszre vonatkozan. A mainframe7 rendszerek letnsvel, a gyors tbbprocesszoros szerverek s szemlyi szmtgpek elretrsvel a vllalatok informatikai rendszerei is talakultak. A szerver s kliens oldali megvalstsok informatikban jl megfigyelhet ciklikussga a kzponti kiszolglk, adatbzisok s vgfelhasznlk szerepeit s lehetsgeit is tformlta. A terminlokat felvltottk a munkallomsokon fut kliensek, melyek segtsgvel az egyes felhasznlk testre szabhattk elemzsi krnyezetket, trolhattk lekrdezseiket s egyedi nzeteket definilhattak a szerver ltal felknlt lehetsgeken kvl. Az egynileg testreszabott s szerepkrk szerinti elemzs tmogatsa fokozatosan beplt a kiszolgl oldali logikba, a felhasznlk jobb menedzselhetsge vgett. A logikai rtegek felett az egyes szerepkrknek megfelelen kialakult az zleti modell rtege is, amely a logikai modellt fordtja le az egyes szerepkrket ellt felhasznlk ltal hasznlt zleti fogalmi kifejezsekre. Az informcis rendszerek fejldse megkvetelte az adatbzis-kezel rendszerek (Database Management System, DBMS) fejldst is, hiszen teljestmnyk kulcsfontossg a hatkony mkdshez. A kezdeti szigetszer rendszerek adatbzisaikkal a teljes vllalatot tfog krdsek megvlaszolsra sem technikailag, sem pedig adattartalmukban nem voltak kpesek vagy elegendek. A DSS rendszerekkel egytt, azok elemzseit kiszolglva megjelentek olyan kzponti adatbzisok adattrhzak -, melyek a szervezet klnll tranzakcis adatbzisaibl vettk adataikat. Ezzel a megkzeltssel egyrszt megoldottk a tranzakcis rendszerek elemzsek miatt bekvetkez felesleges terhelsnek problmjt, msrszt sajt, kimondottan elemzsekre kialaktott adatbzis smk hasznlatval a lekrdezsek komplexitst is cskkentettk. Az vek folyamn mind az analitikus adattrolsi s modellezsi mdszereket, mind pedig az ezek kiszolglst tmogat adatbzisszerverek

6 7

A szakirodalom nhny helyen Executive Support System (ESS) nven is hivatkoznak e rendszerekre Nagy teljestmny kzponti szmtgp, melyek erforrsait s szmtsi kapacitst a terminlon rkapcsoldott felhasznlk idosztsos elven hasznltk

kpessgeit is folyamatosan tkletestettk, melyek vgl elvezettek az Online Analytical Processing (OLAP) technolgia kialakulshoz. Az OLAP adatbzismotorokat s az ezekre pl vgfelhasznli eszkzket kimondottan gy terveztk, hogy az sszetett elemzsi feladatokat minl egyszerbb legyen megadni s velk hatkonyan lehessen vgrehajtani, mikzben segt a felhasznlnak vgigfrkszni akr magasabb szint sszegzett vagy alacsonyabb szint rszletezett adatokrl is legyen sz. Az OLAP technolgia jellemzen tmogatja az adatok tbb pldul id vagy tr - dimenzi menti elemzst, hierarchikus s idsoros lekrdezst, valamint a mi van akkor, ha tpus krdsek felvetst s elemzst is. Az OLAP adattrhzak olyan adatbzisok, melyeket kimondottan elemzsi cllal hoztak ltre egy adott tma kr felptve. Jellemzjk, hogy az adattrhzba kerl adatok nem vltoznak, trtneti jellegek s forrsaik tranzakcis rendszerek. Az adattrhzak s a forrs-adatbzisok eltr smja miatt szksg van olyan szoftverekre, melyek a forrsadatokat kinyersk utn azokat struktrjukban, tpusukban, mrtkegysgeikben s felbontsukban konzisztensen talaktjk s betlti a kzponti elemz adatbzisba. Az e clt szolgl eszkzk elnevezse a kivonatols (extract), talakts (transform), s betlts (load) funkciikbl add angol szavak rvidtse, vagyis az ETL lett. A 90-es vek msodik felben az OLAP adattrhzakra pl DSS rendszerek olyan kiterjedt szolgltatsokkal s elemzsi potencillal rendelkeztek, melyek jval tlmutattak a klasszikus rtelemben vett informatikai dntstmogatson. A DSS, mint elnevezs akarva-akaratlanul is, de szktette s behatrolta e rendszerek felhasznlst s fleg eladhatsgnak lehetsgeit, ezltal a piac mintegy kikvetelte egy rgi-j rtelmezs s elnevezs, a Business Intelligence (BI) hasznlatt.

2.2. Az zleti intelligencia fogalma


A Business Intelligence fogalmt, elsknt H.P. Luhn vezette be az IBM Journal 1958. oktberi szmban megjelent A Business Intelligence System cikkben. Luhn szerint az zleti intelligencia rendszerek olyan feldolgoz rendszerek lesznek, melyek az sszegyjttt adatokat s dokumentumokat automatikusan kpesek lesznek dekdolni, kinyerni azok informcitartalmt, s a szervezet ignycsoportjainak megfelelen rdekldsi profilokba sorolni [7]. Br Luhn cikkben mg a vllalatok ltal felhalmozott s ltrehozott papralap dokumentumokban, mikrofilmekben s kpernykpekben gondolkodott, elkpzelse messzemenen meghaladta kort s tbb vtizeddel elrevettette az adattrhzak s tudsbzisok mkdst. A modern rtelemben vett Business Intelligence fogalom els megjelenshez azonban mg tbb mint hrom vtizedet kellett vrni. Szakmai krkben az zleti intelligencia atyjaknt emlegetett Howard Dresner egy 1989-es rtekezsben a Gartner Inc. elemzjeknt az akkor npszer DSS s EIS rendszerek kpessgeit sszegezve egy olyan fogalmat szeretett volna alkotni, amely ltalnosabb defincit nyjt az informcik mennyisgi elemzsrl, felhasznlk szlesebb krt rintve. [8] 5

Az zleti intelligencia fogalmnak szleskr elterjedsre ahogy azt a vllalati informcis rendszerek fejldsnl is lthattuk -, a 90-es vek vgig vrni kellett, azt kveten azonban az informcis technolgik egyik legkeresettebb s legjvedelmezbb gazatv vlt. Az elmlt vtizedben szmos knyv, cikk, rtekezs s beszmol jelent meg a tmval kapcsolatban. Albbiakban az ezek ltal nyjtott defincikat felsorolva prblok meg ltalnos kpet kialaktani a Business Intelligence 21. szzadi fogalmrl. A Drexel University s New Jersey Institute of Technology egyetem professzorai Business Intelligence Techniques cm knyvkben az zleti intelligencit az albbiakban definiltk. Olyan adatelemz, jelentskszt s lekrdez eszkzk, amelyek kpesek segteni az zleti felhasznlknak abban, hogy tvergdjenek az adatok tengern, rtkes informcikat ellltva. [9] A vllalati informcis rendszerekkel tbb, mint 20 ve foglalkoz Laudon hzaspr az zleti intelligencit gyakorlatilag a dntstmogat rendszerekkel tekinti azonosnak, mg Daniel J. Power A Brief History of Decision Support System (magyarul A dntstmogat rendszerek rvid trtnete) cm munkjban gyakorlatilag ugyanerre a kvetkeztetsre jut. Az IBM weboldaln hasonl filozfit fogalmaz meg, mivel vlemnyk szerint az zleti intelligencia megoldsok olyan szoftverek, amelyek sszektik az embereket az informcival, hogy dntseiket a lehet legegyszerbb mdon hozhassk meg. Rod Newing a BI megoldsok szleskr elterjedsrl rt Higher intelligence cm cikkben az albbiakban hatrozta meg fogalmunkat. Az zleti intelligencia egy koncepci, amely krlbell hsz vvel ezeltt indult nll tjra az eredetileg vezetknek kszlt dntstmogat rendszerektl. A szervezetek azta rjttek, hogy dntshozknak a vllalat minden szintjn s terletn szksgk van napraksz, relevns s pontos informcikra, legyen sz akr rtkestsrl, termelsrl, kiskereskedelemrl, logisztikrl vagy ms szervezeti-egysgrl. [10] A HP Business Intelligence blogjban Vicky Farell a BI t egy jgenercis rugalmas jelentskszt s elemz eszkzknt emlti, ami az vek sorn nll letre kelt. Vlemnye szerint a Business Intelligence rendszerek az OLAP technolgik segtsgvel - webes portlokon keresztl az informatikai kpzettsg nlkli felhasznlk kezbe adja a lekrdezsek sszelltst, vizualizlst s megosztst, tbbnyire historikus adatokon. [11] A Microsoft Magyarorszg az zleti intelligencival kapcsolatban az albbiakat rja weboldaln: Vllalati szervezete az zleti intelligencit hvhatja segtsgl a versenyelnyt s nyeresgessget biztost dntshozatal tmogatshoz. Az zleti intelligencia rvn integrlhatja, trolhatja, elemezheti, s jelentsek ksztshez hasznlhatja fel az adatokat, ami teljesebb betekintst, s vgs soron jobb zleti teljestmnyt biztost. A tma slyt s aktualitst az is mutatja, hogy a vilg egyik neves IT elemz s tancsad vllalata, a Gartner Inc. egy a sajt CIO felmrse alapjn a 2009-es vre a Top-10 IT stratgiai technolgik 6

egyikeknt a Business Intelligence t nevezte meg. Elemzseik alapjn az zleti intelligencia alkalmazsa kzvetlenl pozitv hatssal lehet a vllalatok zleti teljestmnyre s drmaian javthatja a kitztt clok elrst az zletmenet minden szintjn - a vllalat stratgiai dntseitl az operatv feladatok szintjig. [12] Egy msik neves IT piacelemz vllalat, az IDC egy 2009-es Business Intelligence megoldsokat vizsgl tanulmnyban a BI fogalmt mr pontosabban s kzzel foghatbban definilta [13]. Vesset s McDonough a tanulmny szerzi - az zleti intelligencia piacot kt rszre osztottk: ltalnos cl(QRA8) illetve specilis elemz9 rendszerekre. Az ltalnos cl QRA szoftverek kategrija magban foglalja a kifejezetten ad-hoc adathozzfrshez tervezett lekrdez, multi-dimenzionlis elemz, valamint jelentskszt eszkzket s vezrlpultokat is. Jellemzjk, hogy mind az IT, mind pedig az zleti felhasznlk knnyen tudjk alkalmazni e megoldsokat. Ugyanakkor ide sorolhatk a szerver oldali OLAP technolgik s modellez eszkzk, valamint az elre konfigurlt szoftvercsomagok is, melyek tipikus funkcionlis terletek zleti modelljeit s transzformcis eszkzeit tartalmazzk. A specilis elemzrendszerek alatt olyan adatbnyszati s statisztikai eszkzket rtnk, amelyek mintk, hasonlsgok, kapcsolatok s rejtett informcik feltrkpezsvel foglalkoznak, vagy komplexebb feldolgozst ignyelnek egy hagyomnyos QRA tevkenysgnl. E kategriba sorolhatk pldul neurlis hlk modelljt alkalmaz elemzrendszerek, vagy az olyan statisztikai szoftverek is, amelyek olyan specilis alkalmazsi terletekre fokuszlnak, mint az ipari ksrletek, klinikai tesztelsek, kutatsi- vagy valsidej statisztikai-adatok elemzse. A fentieket sszefoglalva teht elmondhatjuk, hogy az zleti intelligencia fogalmn egy olyan koncepcit rtnk, ami biztostja a klnbz stratgiai szerepkrket ellt szemlyek munkjhoz, dntseihez szksges relevns s kell rszletezettsg informcikat a rendelkezsre ll adatok elemzse alapjn, a vllalat jobb teljestmnynek rdekben. zleti intelligencia megoldsokon pedig olyan eszkzket s technolgikat rtk, amelyek a vllalati adatvagyon felhalmozstl kezdve a felhasznlk rugalmas informlsig bezran e koncepci megvalsulst tmogatjk. Ide tartoznak tbbek kztt az operatv s ms kls forrsokbl szrmaz adatok gyjtst, transzformlst s betltst tmogat ETL eszkzk, az elemzsek vgrehajtst tmogat adatbzis s adattrhz megoldsok, a modellezst s optimalizlst segt adatmenedzsment szoftverek s az

QRA - A szakirodalom gy hivatkozik a hagyomnyos lekrdez, jelentskszt s elemz azaz Query, Report and Analysis megoldsokra 9 A szerzpros az ltalam hasznlt specilis elemz rendszerekre az angol Advanced Analytics fogalommal hivatkozik
8

sszefggsek feltrsra, elrejelzsek ksztsre szolgl matematikai vagy statisztikai mdszereket alkalmaz adatbnyszati eljrsok is. Ide sorolhatk azok a vkony s vastag-kliens megoldsok is, melyek az zleti s informatikai felhasznlk ignyeinek egyarnt megfelel lekrdez, jelentskszt s elemz felleteket valstanak meg, valamint az eredmnyek brzolst, finomtst s terjesztst tmogat eszkzk is.

2.3. Trendek s megoldsok napjainkban


A 20. szzad vgig a MIS, DSS s EIS rendszerek ugyan fokozatosan tvettk s beptettk az jabb s hatkonyabb technolgikat, de, mint nll rendszerek, fokozatosan tnnek el s olvadnak be (1. bra) az zleti intelligencia fogalomkrbe s eszkzkszletbe. Ugyanakkor a 21. szzad zleti szoftvereivel szemben tmasztott kvetelmnyek kzl a szleskr, integrlt funkcionalits mellett a mobil s knyelmi szolgltatsok is mr alapelvrsnak szmtanak.
Vllalati hierarchia
Felsvezetk Dntselksztk Funkcionlis kzpvezetk

20. szzad

21. szzad

EIS DSS DSS DSS MIS MIS MIS

zleti Intelligencia Megoldsok

Vgrehajtk, operatv tevkenysg vgzi

OSS

OSS

OSS

Integrlt vllalatirnytsi rendszer

1. bra Vllalati szerepkrk s tmogatrendszereik a 90-es vekben s napjainkban Az jabb dinamikus webes technolgik megjelensvel a vllalati szinten drga s nehezen menedzselhet kliens oldali alkalmazsokat felvltottk a szinte brhonnan elrhet interaktv vkony kliens megoldsok, melyek testreszabhat webes portlokon keresztl szolgljk az egyes szerepkrknek megfelel felhasznli ignyeket. A modern BI megoldsokban az ad-hoc elemzsek mellett tovbbra is igny mutatkozik a statikus kvetelmnyekkel rendelkez, napraksz s szemlyes riportok generlsra. Az zleti intelligencia rendszerek tbbsge ppen ezrt rendelkezik olyan prezentcis modullal, amely a felhasznl ltal krt friss adatokon generlt riportokat bizonyos esemnyekhez vagy idpontokhoz ktve automatikusan eljuttatja a cmzettekhez, gyakorlatilag tetszleges formtumban, legyen az egy egyszer PDF jelents, Microsoft Excel tblzat, XML llomny, interaktv Flash vagy egy weboldal. Megfigyelhet tendencia, hogy az zleti intelligencia megoldsok ltal prezentlt informcik jl hasznosthatak a vllalat szinte sszes szintjn. A hierarchia felsbb vezeti s dntshozi - szintjei

mellett a BI megoldsok alkalmazsa kezd egyre inkbb teret nyerni a mindennapi operatv feladatok elltsban rsztvev szinteken is. [10] A jelenlegi trendek alapjn mondhatjuk, hogy a jvben nagy fejlds vrhat a BI rendszerek koopercis lehetsgeinek fejlesztsben, ahol a prezentlt informcikat a rsztvevk kzsen, egyttmkdve rtelmezhetik s szabadon transzformlhatjk sajt megszokott irodai szoftvereiken a kzponti kiszolgl terhelse nlkl. Az IDC korbban emltett tanulmnya az zleti intelligencia eszkzk els szm beszlltjnak az SAP AG szoftverrist nevezte meg 2008-as piaci rszesedse alapjn. A sorban t kvet gyrtk a SAS, IBM, Oracle s Microsoft, melyek egytt a BI vilgpiac majdnem 60 %-t uraljk, ezrt rdemes e vllatok elkpzelseit s megoldsait is figyelembe venni az zleti intelligencia tmjnak vizsglatakor. Itt rdemes megemlteni, hogy a fenti gyrtk ltal szlltott szolgltatsok tbb mint 80%-ban a Vesset s McDonough ltal definilt ltalnos cl vgfelhasznli BI eszkzket takarja. A vilg vezet integrlt vllalatirnytsi rendszereinek beszlltja, az SAP AG egyben az zleti intelligencia piac legnagyobb rszesedssel rendelkez szereplje, amely az SAP NetWeaver BW megoldsval teljes kr szoftveres BI szolgltatst nyjt gyfelei rszre. A szoftvercsomag tbbek kztt sajt fejleszts OLAP technolgira pl adattrhz megoldst, a heterogn rendszerek integrlst segt ETL eszkzeit, valamint a vllalati infrastruktrhoz igazod SAP Enterprise Portal webes keretrendszert tartalmazza. A felhasznlk nkiszolgl webes felleteken vagy a kimondottan erre kifejlesztett lekrdez, elemz s jelentskszt eszkzk segtsgvel vgezhetik ad-hoc elemzseiket vagy kszthetik el jelentseiket, vezrlpultjaikat s brikat, melyeket a kollaborcis s publikcis platformokon keresztli terjeszthetnek. A vllalat piaci rszesedst biztostva 2007-ben felvsrolta az zleti elemz szoftverekre szakosodott, Crystal Reports jelentskszt szoftverrl hres BusinessObjects et. A SAS Institute Inc. Enterprise Business Intelligence s Business Visualization megoldsaiban sajt OLAP alap adattrhzval, integrcis s elemz eszkzeivel knlja zleti intelligencia szoftvereit. A vgfelhasznlk szerepkrknek megfelelen egy testre szabhat nkiszolgl portlon vagy vastag kliensen keresztl vgezhetnek historikus vagy prediktv elemzseket, adat- s szvegbnyszatot vagy kszthetnek statisztikkat, elrejelzseket a jobb s gyorsabb dntsek elsegtshez. Az IBM adattrhz s tartalommenedzsment megoldsa az Information Management csomag rszeknt elrhet, sajt fejleszts Infosphere Warehouse s Smart Analytics System adattrhz s elemz szoftverekre pl, amelyek tartalmi elemzseket, adat- s szvegbnyszatot, valamint integrcis feladatok elltst is tmogatjk. Ugyanakkor a Cognos 2007-es akvizcija sorn szerzett Cognos Business Intelligence megoldsa OLAP kpes vagy relcis adatforrsra pl valdi zleti intelligencia 9

szoftvercsomag, amelyben a felhasznlk nkiszolgl webes felleten futtathatnak lekrdezseket, adhoc elemzseket, illetve kszthetnek jelentseket s vezrlpultokat is. Az informcik megosztst a rendszer az IBM Cognos Go! szolgltatsain keresztl tmogatja, legyen sz e-mailkldsrl, Microsoft Office integrcirl, vagy mobil eszkzn val megjelentsrl. Az Oracle Inc. az albbiakban foglalja ssze zleti intelligencia megoldst: Az Oracle Business Intelligence (BI) az alaptechnolgik s alkalmazsok legtfogbb portfolijt knl megolds, amely az sszefggsek felismersn alapul, tgondolt vllalatirnytst szolglja piacvezet BI alkalmazsokkal, zleti adatelemz platformmal s adattrhzakkal. [14] A vllalat OLAP opcit is alkalmaz sajt Oracle Database adatbzis-kezel megoldsa mellett Oracle Warehouse Builder nvre keresztelt adattrhz tervez, modellez s ETL eszkzvel igyekszik kielgteni a felhasznlk ignyeit. Az Oracle Business Intelligence Suite szoftvercsomag kivlan egyttmkdik heterogn OLAP vagy relcis-adatbzisokkal s egyb adatforrsokkal. A felhasznlk a nagyvllalati infrastruktrba jl illeszthet nkiszolgl portlon keresztl vgezhetik elre definilt s ad-hoc elemzseiket, vagy kszthetnek vezrlpultokat s jelentseket. Az informcikat a BI Publisher s Delivery komponensek segtsgvel, tetszleges formtumban s mdon oszthatjk meg munkatrsaikkal vagy partnereikkel, akr mobileszkzkn keresztl is. Az Oracle olyan analitikai alkalmazsokat is rtkest, amelyek lefedik a specifikus zleti folyamatok s ipargak szles spektrumt, tovbb lehetsget biztostanak geolgiai adatok brzolsra is. A cg vek ta ersti pozcijt a BI megoldsok piacn, amelyet a Siebel 2005-s, a Hyperion 2007-es felvsrlsval alapozott meg. A Sun Microsystems 2009-es akvizcijval a szoftveres megoldsok mellett mr teljes kr hardver-szolgltatsokat is nyjt. A Microsoft az utbbi vekben rengeteget tett Business Intelligence szolgltatsainak fejlesztse rdekben, melyet a BI technolgira specializldott ProClarity 2006-os felvsrlsval alapozott meg. A Microsoft Business Intelligence megoldsban az adattrhzak menedzselst, elemzst s kls rendszerek integrcijt a gyrilag beptetett OLAP technolgival s jelents-generl mechanizmusval felvrtezett10 j genercis SQL Server adatbzismotor s ETL eszkzk biztostjk. A SharePoint Server nkiszolgl webes felletein a felhasznlk szerepkreiknek megfelelen szabhatjk testre oldalaikat s nzeteiket, megoszthatnak informcikat, kszthetnek vezrlpultokat s akr ms felhasznlkkal egyttmkdve krdezhetik le, elemezhetik s brzolhatjk az eredmnyeket a Microsoft Excel kpessgeit felhasznlva. A Microsoft a geolgiai informcik megjelentsre sajt webes trkpszeti megoldst, a Bing Maps et alkalmazza.

10

Az emltett funkcikat a Microsoft SQL Server Analysis Services s SQL Server Reporting Services szolgltatsok ltjk el

10

A ltez megoldsok mellett azonban a felhasznlk egyre tbbszr tallnak j lehetsgeket az zleti intelligencia rendszerek felhasznlsra az ipari termels monitorozstl kezdve, a krhzi felplsi mutatkon keresztl, az gyek rszleteiben kutat gyvdekig. [15] Napjainkban a vllalati levelezs, zenetklds s telefonls a cgen belli s kvli kommunikci egyik legfontosabb tnyezje, gy a jvben megjelenhet az igny a tnyleges kommunikcis folyamatok feltrkpezsre s azok zleti szempontbl trtn felhasznlsra is. Diplomatervem aktualitst az jelenti, hogy jelenleg nyilvnosan nem ismert olyan ltalnosan hasznlhat zleti intelligencia megolds, amely kpes lenne a kommunikcis csatornk figyelsvel, zenetek gyjtsvel s a kommunikci elemzsvel a vllalatok szmra zleti szempontbl hasznlhat informcikat ellltani.

11

3. Stratgiai fzis
E fejezet clja a vllalati kommunikci-elemzs problmakrnek feltrsa, a vllalati kommunikcis krnyezet sajtossgainak s lehetsgeinek felmrse a felmerl elemzsi ignyek figyelembevtelvel.

3.1. Krnyezet felmrse


3.1.1. Vllalati krnyezet s kommunikci kapcsolata
A vllalatok gazdasgi tevkenysget folytat szervezetek, amelyek fogyaszti szksgleteinek kielgtshez s szolgltatsok nyjtshoz bels struktrjukat valamilyen munkamegoszts alapjn alaktjk. A szervezetek tbbsge profit-orientlt berendezkeds, ami megkveteli az erforrsok hatkony s optimlis felosztst, melyben a kommunikcinak kulcsszerepe van. Minsge jelentsen meghatrozza a mkds milyensgt s kialakult mechanizmusaival mg a vezetsi struktra jellemzire is hatssal lehet. Albert Tucker hres fogolydilemma problmjval mutat r Bakacsi Gyula arra, hogy kommunikci nlkl a foglyok, egy mindannyiuknak hasznos cl rdekben kptelenek sszehangoltan cselekedni, vagyis kvzi szervezetknt mkdni. [16] A szervezeti magatarts kutatsa az utbbi idben olyan tudomnyterlett vlt, amely a szervezeteken bell a magatartsra gyakorolt egyni, csoportos- s strukturlis hatsokat vizsglja a clbl, hogy ezeket az ismereteket a szervezet hatkonysgnak nvelsre alkalmazza. Rviden sszefoglalva azzal foglalkozik, hogy a szervezeti struktrt s mkdst ltrehoz szemlyek s csoportok mit tesznek a szervezetben s hogyan befolysoljk annak teljestmnyt. A szervezeti magatarts nagy hangslyt fektet tbbek kztt a munkakrk kialaktsra s a munkavgzs szervezsre, amelyek a termelkenysggel, az emberi teljestmnnyel s a menedzsmenttel fggnek ssze. [16] Russell Ackoff a modern szervezet-kutats ttrje szervezeti-kommunikcis modelljben kzvetlen sszefggst mutatott ki a hibs kommunikci s a szervezet rossz hatkonysgt elidz hibs dntsek kztt. A csoportos kommunikcit vizsgl Janet Beavin Bavelas pszicholgus pedig arra mutatott r elszr, hogy feladatokat teljest csoportok esetben a kialaktott kommunikcis smk miknt jellnek ki hatalmi pozciba kerl embereket, hogyan alaktjk a csoport struktrjt, milyen mdon hatnak a tagok megelgedettsgre a csoportban elfoglalt helyk alapjn s nem utols sorban miknt hatnak a feladat megoldsra. A jobb szervezeti teljestmny rdekben a csoportok kialaktshoz, tszervezshez s az alulrl szervezd vezets kijellshez a vllalatoknak a jvben szksges lesz a bels s kls kommunikci vizsglatra a szervezeti pszicholgiai hatsok figyelembevtelvel.

12

A vllalatoknak legalbb annyira kell figyelnik a kommunikcira s az ezzel sszefgg mkdskre, folyamataikra, mint amekkora hangslyt fektetnek a pnzgyi tervezsre vagy a piac felmrsre, mivel a kommunikci-elemzs a modern szervezetfejleszts hangslyos tnyezjv vlt.

3.1.2. Tipikus vllalati kommunikcis csatornk


Nyilvnval, hogy a vllalati kommunikci elemzse csak akkor valsulhat meg, ha a szervezet kpes a megfelel csatornkon keresztl zajl kommunikcis folyamatokat s azok szereplit az elemzsi cloknak megfelelen szlelni s regisztrlni. Ezt csak abban az esetben lehet gpekkel megoldani, ha a kommunikci tviteli kzeget kpesek vagyunk figyelni s azon keresztl a rsztvevket is azonostani. A felhasznlk manapsg szmtalan klnbz mdon kommuniklhatnak egymssal, amely a csatornk figyelst els pillantsra megneheztheti. Ugyanakkor a tvkzls s informatika konvergencijnak ksznheten, az eltr kommunikcis csatornk kztti klnbsgek elmosdnak s az egysges digitlis, IP alap megoldsok fel toldnak el, melyek ellenrizhetsge egyre egyszerbb s olcsbb megoldsokat ignyel. Az albbiakban a vllalkozsok ltal leginkbb alkalmazott kommunikcis csatornkat s jellemziket veszem soron.

Telefon
A legtbb nagyobb vllalat mr rendelkezik valamilyen sajt vezetkes vagy VOIP telefonkzponttal egyrszt bels kommunikcijnak egyszerstse, msrszt pedig hvskltsgeinek c skkentse s kzbentartsa rdekben. Az ilyen szervezeteknl elterjedt megolds, hogy az alkalmazottak sajt vonallal vagy mellkkel rendelkeznek, melyek kezelsrl a kzponti cmtr gondoskodik. A cmtrak lehetsget biztostanak mobil-munkallomsok esetn a telefonvonalak dinamikus kiosztshoz, ugyanakkor a hvsok szerepli ezltal knnyen azonosthatak lesznek brhol is vgzik ppen munkjukat. Egy telefonbeszlgets egy vagy tbb szemly kztt folytatdhat, ahol a szereplk akr menet kzben is becsatlakozhatnak vagy kilphetnek, melyek tnyt a telefonkzpontok rgzthetik. Mr manapsg is szmtalan olyan zleti terlet ltezik pldul gyflszolglatok -, ahol a hvsok tnyn kvl magt a beszlgets tartalmt is rgztik a ksbbi visszahallgathatsg cljbl. A beszlgetsek tartalmi feldolgozshoz a modern hang s beszd-felismersi eljrsokkal lehetsg nylik azok szveges cmkzsre is a tovbbi elemzst segtend. A lehetsgek felsorolsakor termszetesen nem szabad megfeledkezni a mobiltelefon megoldsokrl sem. A vllalatok szemszgbl a relatve olcs s gyakorlatilag infrastrukturlis kltsgek nlkl fenntarthat hangtviteli s adat-szolgltatsok vonz alternatvt jelentenek a sajt telefonkzpontok zemeltetsvel szemben. Ugyanakkor a mobiltelefon 13 hlzatokon keresztl bonyoltott

telefonbeszlgetsek az elfizet vllalatok szmra ltalban nem rhetk el, mivel e megoldsokban hasznlt technolgik s eszkzk kls szolgltatk kezben vannak, melyek tevkenysge l lami engedlyhez kttt.

E-mail
A vllalatok msik, leginkbb npszer kommunikcis megoldsa az elektronikus levelezs. Mivel a vllalatok szinte kivtel nlkl rendelkeznek sajt levelezszerverekkel , a kldtt s fogadott e-mailek figyelse egyszer feladat. A szereplk azonostsa a fenntartott cmtrak segtsgvel ugyancsak egyszer feladat a bels cmek s csoporttagsgok ismeretben, a domain-en kvli e-mail cmek azonostsra pedig a vllalatok ltal karbantartott CRM adatbzisok hasznlhatk. Az elektronikus levelezs sajtossga - a hagyomnyos levelezstl eltren -, hogy a felad ltal kldtt zenet minden egyes cmzettnl nll entitsknt jelenik meg, a terjedsi viszonyoktl fggen akr egymstl eltr idpontokban. Elfordulhat pldul olyan eset, hogy egy betelt postafik esetn az egyik szerepl csak napokkal ksbb kapja meg zenett, ami az elemzs sorn figyelembevett vlaszidk tekintetben nagy jelentsget hordozhat. Ugyanakkor az egyes fogad felek ugyanazt az zenetet eltr kzbestsi mdokkal, kzvetlenl, msolatknt vagy titkos msolatknt is megkaphatjk, melyek az rtelmezs szempontjbl ms-ms jelentssel brhat. Tartalom szempontjbl az e-mail az egyik legvltozatosabb kommunikcis forma, hiszen az ltala hordozott zenet tartalmazhat sima vagy HTML szveget, begyazott tartalmat, de csatolmnyknt tetszleges fjlokat is kpes trolni, melyet a strukturlatlan s sszetett tartalom dekdolsakor figyelembe kell venni a ksbbi elemzs szempontjbl.

Azonnali zenetklds
Az azonnali zenetklds, - angolul Instant Messaging (IM) - napjaink egyik legelterjedtebb szveges ugyanakkor vals-idej kommunikcis megoldsa. ltalban meglv e-mail vagy VOIP alkalmazsokhoz szoktk trstani s jellemzjk, hogy a felhasznlk jelenlti llapotukat kzztve lben cseveghetnek rvid szveges zeneteken keresztl, de bizonyos megoldsok akr a fjlok kldst is lehetv teszik. Az e-mailekhez hasonlan, az azonnali zenetek naplzsa s elemzse ugyancsak knnyen megvalsthat vllalati kereteken bell, amennyiben a vllalat mr rendelkezik valamilyen sajt azonnali zenetkld szolgltatssal.

Fax
A fax a papr alap vllalati mkds egyik legregebb s legegyszerbb kzbestsi formja, mely a dokumentumok tovbbtst telefonos hlzaton teszi lehetv. A faxok megfelel gyjtse ugyanakkor csak akkor lehetsges, ha a vllalati fax vagy telefonhlzat az e-mailekhez hasonlan kzponti rendszeren keresztl kerlnek tovbbtsra. A felad s cmzett szemlyek azonostsa a telefonszmok

14

vagy mellkek kzponti cmtrbl trtn kiolvassval, vagy a faxszerverek azonostsi mechanizmusainak hasznlatval lehetsges. A faxok tartalmi elemzs szempontjbl bizonyos mrtkben az e-mailekre hasonltanak, hiszen a fax szerverek megjelensvel a kzvetlen klds eltt elfogott faxok szinte tetszleges formtum dokumentumok, fjlok lehetnek melyek tartalmi elemzse a csatolmnyokhoz hasonlan megoldhat -, azonban a telefonhlzaton keresztli tovbbts utn a fogadott faxok mr kpi informciknt llnak csak rendelkezsre, melyek rtelmezse OCR11 technolgik bevonst ignylik.

3.2. A vllalati kommunikci-elemzs lehetsgei


A kommunikci vizsglatval feltrkpezhetek a kommunikci rsztvevinek, vagyis a szervezet tagjainak s csoportjainak bels s kls kapcsolatai, valamint a kommunikci sorn elltott tipikus szerepeik, melyek ltal olyan sszefggsek fedezhetk fel, amik a szervezeti felptsbl nem felttlen olvashatk ki. A kommunikci tartalmnak megfelel kivonatolsval s szvegbnyszati mdszerekkel megllapthatak azok a tmk, amik az adott szemlyekhez, vagy csoportokhoz kthetk, melyek ltal lehetsget biztostanak l tma-szemly trkpek ksztsre is a szervezeten bell. A szervezet kommunikcijnak elemzsvel egy olyan fellnzeti kpet kaphatunk folyamatainkrl, melyekben az adott gyek knnyen nyomon kvethetek s idben felismerhetk az olyan kommunikcis elakadsok, melyek htrltathatjk a vllalat mkdst. Nem utols sorban a kommunikcis csatornk s azok szerepli a vllalat erforrsai, melyek mennyisgi elemzsvel kimutathat azok terheltsge. Ezeket az adatokat felhasznlva az erforrsok tszervezsvel javthat azok hatkonyabb kihasznltsga. sszefoglalsul elmondhat, hogy a vllalati kommunikci mennyisgi s minsgi elemzsvel lehetsget kapunk kommunikcis erforrsaink terhelsi s teljestmnybeli vizsglathoz, segtsgvel feltrkpezhetjk szervezetnk tagjainak bels s kls kapcsolatait, tma-rsztvev trkpeit s nem utols sorban nyomon kvethetnk konkrt gymeneti folyamatokat is.

11

OCR Optical Character Recognition, azaz optikai karakterfelismer technolgia, ami lehetv teszi kpeken lv karakterek felismerst s szvegg alaktst.

15

3.3. Az elemzsi ignyek s brzols koncepcija


Az elemzst vgz felhasznlknak lehetsget kell biztostani a kommunikci fontosabb tulajdonsgai alapjn trtn rszletes szrsekre. Ilyen jellemz a kommunikci idpontjnak behatrolsa egy idintervallum megadsval, a kommunikci szereplinek, akr konkrt szerepkkel felad vagy cmzett trtn szktse, vagy zenetek tmjnak kijellse. Az albbiakban a klnbz elemzsi eredmnyek brzolsnak koncepcionlis terveit ismertetem. Az brzolsok kidolgozsnl az rtelmezst elsegtve fontos szem eltt tartani, hogy az egyes szimblumok a klnbz krnyezetekben is egysgesen jelenjenek meg. Ezrt a tovbbi brzolsok sorn a szemlyeket szimpla krrel, a csoportokat pedig dupla vonal krrel fogom jellni, a tmkat tglalappal, a hangslyosabb kommunikcis momentumokat pedig flkvr bettpussal vagy vastagabb lekkel jellm.

3.3.1. Kapcsolati hl
A kommunikciban rsztvev szereplk kapcsolatnak legkzenfekvbb brzolsra kapcsolati-hlt alkalmazok, amely egyarnt tartalmazhat kls s bels szemlyeket s csoportokat is. A 2. brn lthat egy ltalam elkpzelt tipikus kapcsolati hl. A kommunikci egyes szereplit a grf csompontjai prezentljk. Kt csompont kztt akkor tallhat l, ha kzttk trtnt kommunikci. Az lek irnytottsga a kommunikci irnyt jelli, mg annak slyozsa azt mutatja meg, hogy a kt szerepl hnyszor kommuniklt egymssal.
145 Szemly 1 200 Szemly 2 143

132 25 Szemly 3 123 Csoport 1 20 Szemly 4 30 Csoport 2 114

170 40

Szemly 5

75

Szemly 6

2. bra Kapcsolati hl koncepcionlis brja Az lek a slyok ltal trtn vastagtsval grafikusan knnyen kiemelhetk s leolvashatk az egymssal gyakran kommunikl szereplk, melyek halmazt a tovbbiakban klikknek nevezzk.

3.3.2. Tma Rsztvev trkp


Az zenetek tartalmnak megfelel mdon trtn kivonatolsval - kulcsszavainak logikai szinten trtn csoportostsval - felismerhet azok tmja. E tmk s a kommunikciban rsztvev szemlyek s csoportok sszektsvel kaphatjuk meg a tma rsztvev trkpet, melynek brzolsi koncepcijt a 3. bra mutatja. 16

Szemly 1 23 167 Szemly 2

128

Csoport 1 23

Szemly 5 40 12 150 Csoport 2

Tma 1

Tema 2
239 Szemly 3 157 Szemly 4

Tema 3

13

3. bra Tma Rsztvev trkp koncepcionlis brja A tma-rsztvev trkp olyan grf, amelyek ktfle csompontot tartalmazhat: tmt vagy rsztvevt prezentl csompontot. l csak tma s rsztvev kztt futhat s azt a jelentst hordozza, hogy az adott szemly az adott tmval kapcsolatban llt egy msik szemllyel folytatott kommunikcija sorn. Amennyiben az l a szemlytl a tma fel mutat, az azt jelenti, hogy a kommunikcit a szemly kezdemnyezte ahhoz a tmhoz kapcsoldan. A tmbl a szemly fele mutat l azt a jelentst hordozza, hogy a kommunikci sorn az adott tmban a kommunikci rsztvevje a fogad fl szerept tlttte be. Az lek slyozsa s vastagtsa a kapcsolati hlkhoz hasonlan a kommunikci gyakorisgt jelli.

3.3.3. Folyamattrkp
A szervezetek megosztott munkavgzse sorn gyakran merlhet fel igny a prbeszdek fellrl trtn vizsglatra, amelybl megllapthat, hogy egy adott gymenet kommunikcis folyamata ppen hol tart, vagy mely rsztvevknl akadt el. A kommunikci sorn az egyes zenetek kln pldnyokban s akr eltr idpontokban jelennek meg cmzetteknl. Ugyanakkor a kommunikcis tevkenysg sorn a rsztvevk vlaszaikkal s tovbbtott zeneteikkel jabb s jabb pldnyokat hoznak ltre, melyek egymsra hivatkoznak. A 4. bra egy ilyen, a rsztvevknl kln-kln pldnyknt megjelen zeneteket s kapcsolataikat brzolja az id-tengely mentn.
Szemly 1 Szemly 2 Szemly 3 Szemly 1 Szemly 2 Szemly 3 id tengely Szemly 4 Szemly 4 Szemly 2 Szemly 4 Szemly 3

4. bra Feldertett folyamattrkp koncepcionlis brja

17

3.4. Megvalstand rendszerfunkcik sszefoglalsa


A cl egy olyan kommunikcit elemz zleti intelligencia rendszer megvalstsa, amely a vgfelhasznlk szmra egyszer s hatkony elemz megoldst nyjt a kommunikciban szerepl rsztvevk kapcsolatainak elemzshez, a tma-resztvev kapcsolatok feltrshoz s gymeneti folyamatok feldertshez. A kapott eredmnyeket a rendszernek az elemzs brzolsi koncepcijnak megfelelen kell brzolnia. Az elemzsek sorn lehessen szrni az olyan ltalnos kommunikcis jellemzkre , mint adott rsztvevk krre, a rendszer zemeltetje ltal definilt tmkra, vagy, hogy a kommunikci mely idintervallumba esett. A tmk kzponti kezelse a kommunikcis folyamatok vllalati szinten egysges logikai csoportostst hivatott megvalstani. Ugyanakkor feladat az e-mailek kzponti gyjtse, az elemzs szempontjbl fontos kommunikcis rszletek (pl. szereplk, tmk, stb.) feldolgozsa s ksbbi elemzs cljbl trtn eltrolsa. Az e-mailek megfigyelsnek elsegtshez a levelezszerver a rajta thalad leveleket egy mappba fogja gyjteni. A rendszernek alkalmasnak kell lennie a rsztvevk azonostshoz hasznlt elrhetsgek, valamint ezek tulajdonosainak s csoporttagsgi adatainak kezelsre is. A tervezs sorn figyelembe kell venni, hogy a rendszer ksbbi fejlesztsek keretben ms kommunikcis csatornkon trtn kommunikci elemzsre is alkalmas legyen, m ezek megvalstsa mr nem trgya ennek a dolgozatnak.

18

4. Elemzsi fzis
E fejezet clja az elz stratgiai rszben ismertetett clok, fogalmak s funkcik pontostsa s azok kisebb funkcionlis sszetevkre bontsa, valamint az elemzs fogalmi modelljnek fellltsa.

4.1. E-mailek az elemzs szemszgbl


Ahogy azt a bevezetben mr jeleztem, diplomamunkm s a megvalstott kommunikci elemz rendszer elssorban az e-mailek gyjtsre, feldolgozsra s elemzsre fkuszl, ezrt ebben az alfejezetben az e-mailek technikai sajtossgait ismertetem.

4.1.1. Trtneti ttekints


Az internetes levelezs hossz vtizedek alatt fejldtt azz, amit ma e-mailnek neveznk, s emberek millirdjai hasznlnak. A szmtgpeken keresztl forgalmazott elektronikus levelezs az 1960-as vekig vezethet vissza. Kezdetben az ugyanazon mainframe-ekre csatlakozott terminl felhasznlk alkalmaztk az egyms kztti zenetek cserjre, majd ksbb klnbz megoldsok segtsgvel lehetv vlt tbb egymssal sszekttt szerver kztti kommunikci is. Az Internet snek tekintett ARPANET hetvenes vekbeli trnyersvel egytt terjedt az elektronikus levelezs npszersge is. A mr meglv hlzatok fokozatos sszekapcsolsval megjelent az igny az addig szeparltan mkd levelezrendszerek sszektsre, egyttmkdsre s egy kzs elektronikus levelezsi platform kidolgozsra. A ma is hasznlatos @ jel bevezetst egy bizonyos Ray Tomlinson nevhez kthetjk, aki e szimblum felhasznlsval cmezte meg els e-mail zenett, elvlasztva egymstl a cmzett felhasznl nevt s annak szmtgpnevt.

4.1.2. Szabvnyok s ajnlsok


Az Internetes protokoll-szabvnyok kidolgozsrt felels Internet Engineering Task Force (IETF) csoport 1982-ben az ARPANET Szveges zenet-formtum szabvnya12 alapjn megalkotta az RFC 822 szabvnyt, ami csaknem 20 vig volt a hivatalos Internetes zenet-formtum (Internet Message Format) szabvnya. Ezzel a formtum-szabvnnyal azonban az az alapvet problma, hogy csak 7-bites ASCII karakterek hasznlatt engedlyezi, amely lehetetlenn teszi az eredeti kdtbln kvli specilis s nemzeti karakterek - pldul kezetes betk hasznlatt. 1996-ban e hinyossg ptlsra alkotta meg az IETF az RFC 2045 2049 szabvnytervezeteket, a klnbz kdols s formtum tartalmak kezelsre,

12

A dokumentum RFC 733 Standard for the format of ARPA Network Text Messages cmen jelent meg

19

amit Multipurpose Internet Mail Extensions (MIME) nvvel emlegetnek, amit magyar nyelvre Tbbfunkcis Internet zenet-kiterjesztsknt fordthatunk. A MIME szabvnyok [17] segtsgvel a levelez alkalmazsok ktflekppen is kdolhatjk a nem ASCII tartalmakat. Az egyik megolds a tbbnyire sima szvegek tvitelre alkalmazott quoted printable formtum, mg a msik, binris tartalmak pldul csatolmnyok 7-bites lershoz ltalban a base64 tartalomkdolt szoktk hasznlni. A quoted printable alaptlete, hogy brmely 8-bites jel lerhat kdjnak hexadecimlis szmknt trtn brzolsval. E kdolsnl a szveg ASCII karaktereit tartalmaz rszeit nmagval, mg az ASCII kdtbln kvl es karaktereket egy = jel utn sajt hexadecimlis kdjukkal rjuk le. Az nbrzols all termszetesen kivtelt kpez maga az = jel, illetve a sor vgi nyomtatsban nem megjelen (whitespace) karakterek, melyeket szintn hexadecimlis kdjukkal kell lerni. A Base64 kdols elve a fentiekkel szemben a bitek binris-tcsoportostsn alapul. A kdoland 8bites jelek binris kdjt egyms mell rva 24 bites csoportokra osztjuk, ezutn a csoportokbl sorban vesznk 6-bitenknt binris szmokat, melyek rtkt ASCII karakterekk alaktjuk. Ezzel a megoldssal egy 8 bites tartalom 3 szimblumt 4 darab ASCII karakterrel rhatjuk le. Az utbbi vekben ugyanakkor tbb kiegszts is kszlt a fenti dokumentumokhoz, gy a 2001-ben elkszlt s 2005-ben javasolt szabvnny ellpett, RFC 822 t felvlt RFC 2822, s a MIME RFC szabvnytervek tovbbi tartalmi s biztonsgi mdostsai is megjelentek. Az IETF az zenet-formtum szabvnyostsn tl az e-mailek hlzaton trtn kzbestsi protokolljn a Simple Mail Transfer Protocol (SMTP) szabvnyostsn is dolgozik.

Andrea
MUA
To: bence@beta.hu From: andrea@alpha.hu Message..

4.

b v To

bt

S s-

P MT

A MT

mx.beta.hu mail.beta.hu

PO P

1. Szerkesztse

A MT

3. Nvfelolds utn MX rekordok lekrse

3, 5. IM Let AP lt , v s ag ye gy b

To: bence@beta.hu From: andrea@alpha.hu Message..

5. bra Interneten keresztl trtn e-mail kzbests koncepcionlis brja Az e-mailek kzbestse SMTP n keresztl az 5. bra alapjn, az albbi mdon trtnik. Els lpsben a felad megszerkeszti zenett, amit levelez kliense13 a megfelel Internet zenet-formtumra

13

A vgfelhasznlk ltal elrhet klnbz e-mail kliensekre vagy webmail megoldsokra a szakirodalom ltalban Mail User Agent (MUA) kifejezssel hivatkozik

ld K 2.

smtp.alpha.hu

s TP SM

S DN

Internet

nameserver.beta.hu

MUA

Bence

20

alaktva tovbbt egy e-mailkld szolgltatst nyjt szervernek. Amennyiben az e-mail domain-en kvli cmre tovbbtand, a levelez szerver a cltartomny levelezszervernek14 nvfeloldsa utn SMTP n tovbbtja azt. A helyi levelezszerverekrl a cmzettek levelez klienskkel klnbz protokollokon keresztl tlthetik le zeneteiket.

4.1.3. zenet-formtum rszletei


Az IETF ltal szabvnyostott formtum e-mailek kt rszre oszthatk, a fejlcre illetve az zenet trzsre, melyekre a szakirodalom header illetve body kifejezsekkel hivatkozik [18].

E-mailek fejlc rsze


Az zenetek fejlc rsze strukturlt szveges informcikat tartalmaz, amelyeket mezknek hvunk. A mezk tbbek kztt a levl feladjrl, cmzettjeirl, kzbestsek mdjrl, feladsnak idejrl, az zenet trgyrl, azaz gyakorlatilag brmirl trolhatnak informcikat, amit az egyes levelez kliensek s szerverek belernak. A fejlc struktrja alapjn minden mez j sorban kezddik, melynek legels karaktere egy nyomtathat ASCII karakter, amely egyttal a mez nevnek els karaktere is. A mez rtkt annak nevtl a : (kettspont) karakter vlasztja el s addig tart, amg egy j sor els karaktere egy nyomtathat ASCII karakter nem lesz, vagyis addig, amg nem kezddik egy j mez. A fentiek rtelmben egy mez rtke lehet tbb soros is, amennyiben az j sorokban szerepl rtkek nyomtatsban nem megjelen karakterrel pldul szkzzel, vagy tabultorral - kezddnek. Az e-mailek fejlc rszvel kapcsolatos pontos szintaktikai megktseket az RFC 5322 szabvny rszletezi, ami az RFC 2822 ltal nyitva hagyott krdseket hivatott tisztzni, melyek kzl az e-mail cmek trolsra alkalmas mezket rdemes megemlteni. A cm mez rtkei a tnyleges e-mail cmen kvl opcionlisan tartalmazhatjk az ahhoz tartoz nevet is. Ebben az esetben a cm-rtke a megnevezs_kifejezse <cm> formtumot kveti, melyben megnevezs kifejezst minden esetben szimpla vagy dupla idzjelek kz kell tenni. Amennyiben a mez tbb cm-rtket is trolhat, a fenti formtum cmeket egymstl vesszvel elvlasztva kell lernunk. Gyakran pldul az zenet trgya vagy ppen egy cmzett neve esetben - elfordulhat, hogy egy fejlc mezben olyan rtket kell trolnunk, ami nem rhat le ASCII karakterekkel. Ilyen helyzetekben kell alkalmaznunk a korbban mr emltett tartalomkdolsi eljrsokat, melyeket mezk es etben =?KARAKTERKSZLET?KDOLS_MDJA?KDOLT_SZVEG?= formtumban kell megadni. A nyit s zr szimblumok kztt tallhat hrom paramtert a krdjel vlasztja el egymstl, melyben az els a kdolt szveg karakterkszlett, a msodik a kdols mdjt, a harmadik pedig a konkrt kdolt

14

A szakirodalom azokra a szerverekre, amelyek rszt vesznek az e-mailek Interneten trtn tovbbtsban Mail Transfer Agent (MTA) kifejezssel hivatkozik.

21

szveget tartalmazza. A kdols mdja quoted printable esetben egy Q bet, Base64 esetben pedig egy B bet lehet. Ezek alapjn a nevemet egy e-mail cm mez rtkeknt az 1. tblzatban bemutatott mdokon lehet ASCII karakterekknt brzolni az alapjn, a hasznlt kdlap s kdol fggvnyben. 1. tblzat 'Murti kos' kifejezs kdolsai egy e-mail fejlc mez rtkeknt
Kdlap iso-8859-2 utf-8 iso-8859-2 utf-8 Kdols mdja quoted printable quoted printable base64 base64 Mez ASCII rtke =?iso-8859-2?Q?'Mur=E1ti =C1kos'?= =?utf-8?Q?'Mur=C3=A1ti =C3=81kos'?= =?iso-8859-2?B?J011cuF0aSDBa29zJw==?= =?utf-8?B?J011csOhdGkgw4Frb3Mn?=

Az e-mailek fejlceiben leggyakrabban hasznlt s az elemzrendszer szempontjbl fontos mezket, rvid lersukkal a 2. tblzatban foglaltam ssze. 2. tblzat Gyakori e-mail fejlc mezk s jelentsk
Meznv To From Sender Cc Bcc Reply-To Delivered-To Date Subject Message-ID In-reply-to References Received Jelentse A cmzett(ek) cm listjt tartalmaz mez Az e-mail zenet szerzjnek cme Az zenet tnyleges feladjt jell mez, amennyiben az zenet szerzje ms, mint a felad pldul egy megbzott. Cm(ek)re rkez zenet msolat Cm(ek)re rkez titkos msolatot Cm, amelyre a vlaszt vrja a felad Az a cm, melyre az eredeti zenetet tirnytva lett a kzbests sorn (pl levelezsi lista egy konkrt tagja) Levl elkldsnek dtuma Levl trgya Levl szerver oldali egyediazonostja, mely a tbbszrs kzbestsek elkerls Arra a MessageId ra hivatkozik melyre az adott zenet vlaszknt lett szerkesztve. Arra a MessageId-ra hivatkozikMelyik M_ID-ra hivatkozva A levl tovbbtsban rsztvev szerverek ltalban feljegyzik az e-mailek fejlcben, hogy mely msik szervertl, mikor s milyen mdon kaptk az zenetet tovbbtsra. E mezk segtsgve visszakvethetk az e -mailek tja az Interneten.

E-mailek tartalmi rsze


A trgy mez kivtelvel az e-mail teste hordozza az zenet szveges, begyazott s csatolt, - egyszval teljes - tartalmt 7-biten kdolva, a MIME szabvnyokban definilt mdokon. Egy e-mail teste lehet sima szveg (Simple Message), de akr tbbfle tartalmat (Multipart Message) is hordozhat magban, melyek akr klnbz mdokon is lehetnek kdolva. Az zenetek tartalmi elemeit a 3. tblzatban ismertetetett mezk rjk le s jellik ki az e-mail testben.

22

3. tblzat E-mailek tartalmi elemeit ler mezk s jelentsk


Meznv Content Type Rvid lersa Tartalmi elem MIME tpust tartalmaz mez, amely informci szolgltat az ltala hordozott adat tpusrl. Paramterei lehetnek: charset: Szveges tartalom esetn a karakterkszletet jelli. boundary: Az adott tartalmi elemet hatrol sorokat adja meg Content-Disposition Content-Transfer-Encoding Szvegbegyazott (inline) vagy csatolt (attachment) tartalmat jell mez. Paramter tartalmazhatja a csatolmny nevt is (filename) Az adott tartalmi rsz kdolsi eljrst rja le (pl.: quoted-printable vagy base64)

Az e-mailekben szerepl tartalmak megfelel kezelshez s megjelentshez az gynevezett MIME tpusok15 nyjtanak segtsget a dekdolst kveten. A MIME tpusok hasonl szerepet ltnak el, mint az egyes opercis rendszerekben hasznlatos fjlkiterjesztsek, vagyis az llomny tartalmt hivatottak jelezni. Mivel az informatikban ismert szmtalan fjlformtum csaknem mindegyikhez tartozhat sajt MIME tpus, ezrt annak kidolgozi a tpusok lerit hierarchikusan hatroztk meg. A hierarchia legfels szintjn a tartalmak tpusaik alapjn 8 fcsoportba16 soroltk, melyek mindegyike tovbbi altpusokra bonthat. Az egyes ftpusokat rvid magyarzattal s nhny fontosabb pldval az A fggelk A1 tblzatban ismertetem. Az e-mailek feldolgozsa sorn a tartalmak kibontshoz fel kell ksztennk rendszernket a legklnflbb zenet-struktrk s MIME tpusok feldolgozsra.

4.2. Termszetes fogalmak sszefoglalsa


Az albbiakban sszefoglalom a vllalati kommunikcis krnyezet feltrsakor felmerlt termszetes fogalmakat s kifejezseket.

Szemly, tag, csoport


A szervezetben valamilyen tevkenysget vgz szemlyeket a szervezet tagjainak nevezzk. A szemlyek tevkenysgi krl, feladataik, helyzetk, vagy tetszleges kzs tulajdonsguk alapjn klnbz csoportokba tartozhatnak. Egy szemly termszetesen tbb csoportnak is tagja lehet. Itt jegyzend meg, hogy egy szemly csoporthoz tartozsa idben nem lland, gy egy szemly csoporttagsga egy adott idintervallumban rtelmezend.

Az ltalam hasznlt MIME tpus kifejezsre az angol nyelv szakirodalom MIME-Type vagy MIME Media Type nven hivatkozik 16 A 9. MIME tpus az example nevet viseli, amely csupn bemutat s tesztelsi clokat szolgl, l krnyezetben nem fordul el.
15

23

Kommunikci, kommunikcis csatorna, kzbestsi md


Azt a folyamatot vagy esemnyt tekinthetjk kommunikcinak, melynek sorn egy adott szemly vagy csoport valamilyen informcit kzl egy vagy tbb nem felttlenl ms szemlynek vagy csoportnak valamilyen kommunikcis csatornt felhasznlva. Kommunikcis csatornn azt a kzeget rjk, melyen keresztl a kommunikcis folyamat ltrejn a rsztvev felek kztt. Ugyanakkor az egyes csatornkon az informci a felekhez klnbz mdokon juthatnak el, melyek az informci tartalmra nem, de az rtelmezsre hatssal lehetnek. Ilyen pldul az e-mailek esetben kzvetlen, msolat vagy titkos msolat szerinti levelezs.

zenet, kivonat, tma


A kommunikcis folyamat sorn kzlt informci fizikai megjelense valamilyen konkrt formban, ami az egyes kommunikcis csatornk kpessgeitl fggen lehet hang, szveg, kp vagy tetszleges fjl. Minden zenet az informcitartalmtl, a kontextustl s az elzmnyektl fggen valamilyen jelentst hordoz, ami sszefoglalhat pr kulcskifejezssel, melyet kivonatnak hvunk, melyeket nagyobb tmkba sorolhatunk.

Rsztvev, szerepl, felad, ad, kld, fogad, vev


A kommunikcis folyamatban rsztvev szemlyeket vagy csoportokat rtjk e fogalmak alatt. Egy kommunikcis folyamatban rsztvev feleket szereplknek vagy rszvevnek neveznk, melyben ktfle szerepet lthatnak el. A feladnak, adnak vagy kldnek nevezzk azt a felet, aki a kommunikci sorn egy zenetet megoszt a msik fllel, vagyis a fogad fllel, vagy ms nven vevvel.

Cmek, elrhetsgek
A klnbz kommunikcis csatornkon az egyes rsztvevk elrshez ismerni kell azok cmeit, telefonszmait, ami alapjn az zenet kzbesthet szmukra, melyek rviden elrhetsgeknek neveznk. Egy elrhetsg termszetesen a kommunikcis csatornhoz szorosan ktdik, ugyanakkor egy rsztvevnek tbb elrse is lehet, akr egy kommunikcis csatornn is.

4.3. Kommunikci-elemzs fogalmi modellje


A cl egy olyan specilis kommunikcis modell ltrehozsa volt, amely az elz bekezdsben rviden ismertetett elemzsi lehetsgek feldertshez nyjt megfelel krnyezetet, azok egyedi s kzs tulajdonsgait figyelembe vve.

4.3.1. ltalnos kommunikcis modell


A klasszikus kommunikcis modell szerint (6. bra) a kld zenett kdols utn egy tviteli kzegen (csatornn) tovbbtja a fogad fl fel, aki az zenetet dekdolva fogadja azt. 24

Nyilvnval, hogy az emberi kommunikci gpi elemzst, csak gy valsthatjuk meg, ha a kld s fogad kztt kpesek vagyunk az zenetet hordoz jelkszletet elfogni s rtelmezni. Ebben az esetben az elemzst vgz gp is egy fogad flknt jelenik meg modellnkben.
Csatorna kdol dekdol

ad

vev

6. bra Kommunikci ltalnos modellje Az emberi kommunikci csupn gpekkel trtn minsgi elemzse azonban lehetetlen feladat. Soha nem lehetnk kpesek olyan eszkz ptsre, mely csupn a kommunikcis csatornn keresztl minden esetben kpes rekonstrulni a fogad fl ltal rtelmezett zenetet. Ez annak ksznhet, hogy az emberi kommunikci egy dinamikus, llapottal rendelkez tevkenysg, melynek helyes rtelmezse lehetetlen az elzmnyek s kontextus ismerete nlkl. Az rtelmezsi folyamat kzben gyakran tallunk olyan hivatkozsokat, utalsokat, amelyek a kontextus vagy elzmnyek ismeretben korbban mr rtelmezsre kerltek azonban zenetnkben explicite nem szerepelnek. Az ilyen elemeket a szakirodalom tacit, azaz nma elemeknek nevezi, melyek rtelmezshez bonyolult tartalomkezelsi, szvegbnyszati, nyelvfeldolgozsi s szemantikai mdszerekre van szksg. Belthat, hogy ez a kommunikcis modell nem alkalmas a fenti elemzsekhez, ugyanis nem nyilatkozik a kommunikci elzmnyeirl, kontextusrl, de magrl az zenet tartalmrl sem, ami a kommunikcis folyamat rtelmezsnek fontos rsze. Ennek eredmnyeknt kialaktottam egy hierarchikus fogalmi modellt (7. bra), amely megklnbzteti a kommunikcis folyamat s a tartalomkezels egyes szintjeit, de ezeket egytt alkalmazza az elemzsi clok elrshez.

Folyamok Szlak zenetek Kzbestsek

Folyam: logikailag sszekapcsolhat tmk Szl: egymsra hivatkoz zenetek lnyege zenet: konkrt zenetek tartalma Kzbests: zenet kitl kinek s hogyan jutott el

7. bra Kommunikci-elemzs fogalmi modelljnek sematikus brja

25

4.3.2. Kommunikcis folyamat szintjei


Kzbestsek szintje
A kzbests kommunikcis modellnk legals szintje, amely a kommunikcit egy kld s egy felad esetre vezeti vissza, lerva, hogy az adott zenet mikor s milyen mdon kerlt tovbbtsra egy adott kommunikcis csatornn. Ez a megkzelts azt jelenti, hogy tbbszerepls kommunikci esetn modellnkben egy adott zenet tovbbtsa a feladtl annyi kzbestsknt jelenik, ahnyan azt tnylegesen fogadjk. Az elemzsek szempontjbl teht e szint kpviseli a tnyleges szereplk kztti kommunikcis kapcsolatokat s azok pontos jellemzit. Itt rdemes megjegyeznnk, hogy a kommunikci rsztvevi szemlyek vagy csoportok lehetnek. Egy zenetnek egy kldje van, de tbb fogadja is lehet, m csak a pillanatnyi rtelmezs krdse, hogy a feladt vagy cmzettet egy szemlynek vagy egy csoportnak, azaz egy csoport nevben vagy ppen egy csoport rszre kldtt zenetnek tekintjk. Kzbestsi mdon a kommunikcis csatornn keresztl trtn tovbbts mdjt rtjk, amelyek pldul e-mailek esetben azt jelenti, hogy egy cmzett az adott zenetet a feladtl kzvetlenl, msolatknt vagy rejtett msolatknt kapta-e meg. A kzbestsek ez ltal lerhatk a felad, a cmzett, az zenet, a felads s kzhezvtel ideje, valamint a kommunikcis csatorna s a kzbestsi md megadsval.

zenetek szintje
Az zenetek olyan nll entitsok, melyek a kommunikci tnyleges tartalmt hordozzk. Ezek a kommunikcis csatornn keresztl tovbbthat zenetek lehetsgeihez mrten gyakorlatilag tetszleges tpusak lehetnek, legyen sz akr beszdrl, akr rott szvegrl, kprl vagy viderl. Ezek a tartalmak, ahogy azt mr korbban ismertettem a kommunikci elzmnyeire s kontextusra explicit s implicit mdon ptve rtelmezhetk a rsztvevk ltal. Nyilvnval, hogy egy tbbszerepls kommunikcis folyamatban a kzbestsek sorn egy adott zenet kerl tovbbtsra minden egyes rsztvevhz, ezrt egy zenet szorosan kapcsoldik annak kzbestseihez is. Az elemzs minsge attl fgg, hogy az egyes zenetek teljes tartalmt miknt tudjuk kivonatolni, azaz milyen mdon vagyunk kpesek a teljes tartalom rtelmezse utn annak lnyegi rszeit az elzmnyek s kontextus ismeretben bizonyos kulcsszavakkal kiemelni s ltalnos tmjt meghatrozni. Az zenetek ez ltal teljes tartalmukkal kivonatolt kulcsszavaikkal, tmjukkal, illetve annak kzbestseivel jellemezhetk.

Szlak szintje
Szlnak nevezzk az zeneteknek olyan fa struktrjt, melyben a gykeret leszmtva minden zenet a fban az t megelz - eggyel alacsonyabb szinten lv szl - zenetre hivatkozva jttek ltre a 26

kommunikci sorn, teht az ezek kztti sszefggs az elzmnyre hivatkozs miatt egyrtelmen kimutathat. Egy zenet, ha nem ktdik direkt egyetlen levlhez sem, nmagban is alkothat egy szlat. A szlak szintje ezek ismeretben a kommunikcis folyamat elzmnyeit explicite ler kapcsolatok szintje. Ez jellemezhet a szlat alkot zenetek fjval, amely gy kzvetve magban foglalja a szl sszestett kulcsszavait s tmit, valamint a kzbestsek szintjn keresztl annak szereplit egyarnt.

Folyamok szintje
A kommunikcis folyamat legfels szintjn a folyamatok llnak: folyamokon azon szlak sszessgt rtk, amelyek tmjukban valamilyen logikai szinten azonosak, ezltal tallhat kzttk valamilyen szorosabb tmabeli sszefggsi kapcsolat. E kts azonban nem olyan egyrtelm, mint a szlaknl megismert explicit hivatkozs, ezrt ezek feltrkpezshez mr komolyabb kontextus rtelmezsi s szvegbnyszati eljrsok szksgesek. A folyamok szintjnek jellemzi gyakorlatilag nem klnbznek a szlaknl ismertetettektl, hiszen itt is egymssal kapcsolatban ll zenetekrl van sz, azonban a folyamok esetben ez a kapcsolat implicit s logikai termszet.

4.3.3. A tartalomkezels szintjei


Ahogy lthattuk a kommunikcis-folyamatok klnbz szintjeinek alkalmazsa megkveteli a tartalmak eltr rszletezettsg kezelst is, melyek alapjn hrom tartalomkezelsi szintet hatrozhatunk meg.

Teljes tartalom szintje


A tartalomkezels legrszletesebb szintje. Az ad ltal kldtt zenet tartalmi rszeinek sszessgt rtjk, ami magban foglalja a kommunikci teljes szvegt s esetleges csatolmnyait is.

Kivonatok szintje
A kivonatok szintjn az zenetek teljes tartalmt annak tpustl fggen jellemzen valamilyen mdszerrel szvegesen prezentljuk, amelybl szvegbnyszati mdszerekkel kulcsszavakat hozhatunk ltre, melyek a teljes tartalom lnyegi rszeit rjk le. A kivontok elksztse ktflekppen trtnhet a rendszer intelligencijtl fggen: Nem informlt kivonatols sorn a kulcsszavakat csak teljes tartalom vizsglata alapjn hatrozzuk meg a klnbz kifejezsek elfordulsa vagy szvegsrsge alapjn. Informlt kivonatols sorn azonban a tartalmak elemzsekor, mr eleve egy adott kontextushoz s elzmnyhez tartoz kulcsszavakat prblunk szlelni, - pldul a kommunikci szl ismeretben, ezltal a kivonat nem csak a teljes tartalom, hanem a kommunikcis folyamatban betlttt szerepe s kapcsolata alapjn is jellemezhetv vlik.

27

Tmk szintje
A tmk kezelse elemzsi modellnk legabsztraktabb tartalomkezelsi szintje, melyben a tartalmak lersa a kivonatolt kulcsszavak alapjn, mr csak azok tmjnak megjellsre szortkozik, ezltal lehetv vlik azok logikai csoportostsa. Az elemzs sorn alkalmazott kivonatolsi szablyok, vagy fejlettebb tartalomkezels esetben ontolgia17 legalbb kezdeti felptse szksges a helyes mkdshez, mely alapveten emberi intelligencit s beavatkozst ignyl feladat.

4.4. Funkcik meghatrozsa


A stratgiai bekezdsben ismertetett rendszerfunkcikat a 8. brn lthat mdon t nagy s azon bell szmos kisebb funkcicsoportra osztottam.
Vllalati Kommunikcit elemz rendszer

Gyjts

Feldolgozs

Trols Rsztvevk adatainak kezelse Szemly s csoport adatok nyilvntartsa

Elemzs

Hozzfrs

E-mailek gyjtse Tbbszrs beolvass kiszrse

zenetek feldolgozsa Rsztvevk azonostsa

Komm. adatstruktra trolsa Id trolsa

Tmk kezelse

Kapcsolati hl elemzs Tma-rsztvev elemzs

Lekrdezsek sszelltsa

Kivonatolsi szablyok kezelse

Kapcsolati-hl brzolsa Szemly-tma trkp brzolsa Folyamattrkp brzolsa

E-mailek tads feldolgozsra

Tartalom kibontsa Tovbbi rszletek kinyerse Komm. adatstruktra felptse Trol funkci meghvsa

Komm. csatorna s md trolsa Rsztvevk trolsa

Elrhetsgek nyilvntartsa
Felvtel, mdosts, trls

Felvtel, mdosts, trlse

Folyamat felderts

Kivonat trolsa

Tma adminisztrci Rsztvev adminisztrci

8. bra Vllalati kommunikcit elemz rendszer funkcionlis hierarchija

4.4.1. Gyjts, megfigyels


A funkci szerepe az adott kommunikcis csatornn thalad zenetek gyjtse s tadsa a feldolgozst vgz funkcis egysgnek, megoldva az zenetek tbbszrs beolvassnak elkerlst is. Dolgozatom esetben a megvalsts csak e-mailek gyjtsre korltozdik, de ez a funkcionlis egysg fogja ksbb tartalmazni a tovbbi kommunikcis csatornk figyelst vgz funkcikat is.

17

Az ontolgia szmtstechnikai rtelemben a valsg egy terletrl vagy annak egy sajtos nzpontjrl alkotott viszonylag kimert s szabatos fogalmi sma, melynek szerepe az sszetartoz fogalmak kapcsolatainak, viszonyainak s szablyainak szemantikai szempontbl trtn lersa.

28

4.4.2. Feldolgozs
Itt trtnik a megfigyels sorn gyjttt kommunikcis adatok feldolgozsa, melynek sorn az albbi feladatkrket kell elltni: Rsztvevk azonostsa a kommunikcibl kinyert elrhetsgek alapjn Tartami rszek kinyerse a klnbz tartalomdekdolk segtsgvel. Elkszl az zenet kommunikcis modellbeli megfelelje. Kommunikci szempontjbl egyb fontos adatok kinyerse, mint pldul a csatornn trtn kzbests mdja s a kommunikci idpontja, stb.. Kommunikcis modellnek megfelel adatstruktra felptse Kommunikcis adatstruktra tadsa elemzs cljbl trtn trolsa

4.4.3. Trols
Ez a funkcionlis egysg valstja meg a kommunikcis elemzsek szempontjbl fontos sszes adat trolst s szolgltatst, ami az albbi feladatkrket rinti: Kommunikcis adatstruktra trolsa, ami tartalmazza a kommunikci szereplit, tartalmt, idejt s a csatornn trtn kzbests mdjt is Trolja a rsztvevk, vagyis a szemlyek s csoportok adatait, tagsgi informciit s elrhetsgi adatait a cmzsek feloldshoz. Tmk kezelse, melynek sorn a rendszer zemeltetje karbantarthatja a kommunikci logikai kategorizlsban rsztvev kivonatolsi szablyokat

4.4.4. Elemzs
A stratgiai szakaszban ismertetett hrom elemzsi mdot megvalst funkci, mely az elemzseket a trol funkci ltal szolgltatott kommunikcis adatokon vgzi. Kapcsolati hl elemzs, melynek feladata a kommunikci sorn egymssal kapcsolatban ll rsztvevk felkutatsa Tma-rsztvev elemzs, melyben a kommunikci sorn felmerlt tmk s a kommunikl rsztvevk kapcsolatnak feltrsa a feladat Folyamat felderts, melynek feladata egy adott gymenethez kapcsold kommunikci feldertse

4.4.5. Hozzfrs
A vgfelhasznlk szmra elrhet felletek, melyek a rendszerhez trtn hozzfrst biztostjk. A lekrdezs, brzols s az adminisztrci alapfunkciit ltja el, melyeken keresztl az albbi funkcikat lehet elrni.

29

Lekrdezsek sszelltshoz szksges felletek elksztse a klnbz elemzsek futtatshoz Kapcsolati hl elemzs sszelltsa, indtsa s eredmnyeinek brzolsa Tma-rsztvev elemzs sszelltsa, indtsa s eredmnyeinek brzolsa Folyamat felderts sszelltsa, indtsa s folyamattrkp brzolsa Tmakezels adminisztrcis felleteinek megvalstsa a trol funkcionlisegysg rsztvev adatok kezelshez Rsztvev adminisztrci felleteinek megvalstsa a trol funkcionlisegysg

tmakezelshez

4.5. A feldolgozs feladatai s problmi


4.5.1. Szemlyek azonostsa
Az e-mailek feldolgozsa sorn az elsdlegesen megoldand feladat a szemlyek azonostsa, melyhez szksg van egy olyan nyilvntartsra, mely tartalmazza a szervezet tagjainak s kls partnereinek szemly s e-mail cm megfeleltetseit. Az azonosts az zenetek fejlc rszben szerepl e-mail cmekhez tartoz szemlyek kikeressvel trtnik az elemzsi smba illeszts eltt. A feldolgozsi idben trtn zenet-szemly trsts azrt lnyeges, mert elfordulhat, hogy egy szervezet mkdse sorn egy adott e-mail cmet egy munkakr megvltozsval egy msik szemlynek ad t. Ebben az esetben az azonos cmet hasznl, de idben eltr kt kln szemly ltal kldtt s fogadott e-maileket az elemzrendszer a megfelel szemlyekhez fogja trstani.

4.5.2. Csoportok azonostsa


A csoportok kommunikcijnak elemzse sszetett problma. Az esetek tbbsgben nem derthet fel egyrtelmen, ha egy adott szemly tbb csoportnak is tagja, gy a szemly ltal kldtt zenetrl ltalban nem dnthet el, hogy melyik csoport nevben eljrva kldte a felad. Az zenetek s csoportok trstsa ezrt feldolgozsi idben nem oldhatk meg, azokat elemzsek sorn, a szemlyek feldertsekor kell figyelembe venni azok idben aktulis csoporttagsgait alapjn, melyhez szksg van egy csoporttagsg nyilvntartsra is.

4.5.3. Szlak azonostsa


Szksges az egyes zenetek egymsra trtn direkt hivatkozsainak feldolgozsi idben trtn azonostsa, mely lehetv teszi a szlak ptst, gy az elemzs idejre mr kszen llhatnak a logikai szint kapcsolatok vizsglathoz. A szlak azonostsa kzvetlenl lehetsges a feldolgozand zenetek

30

References s In-Reply-To fejlc meziben szerepl zenetazonostk kinyersvel, melyek egyttal a hivatkozs mdjt is elruljk.

4.5.4. Tbbszrs feldolgozs elkerlse


Elfordulhat, hogy az egyes zenetek a fizikai kzbestsek sorn valamilyen oknl fogva tbbszrsen is a feldolgoz alrendszerhez jutnak. Az ilyen tpus zenetek viszonylag knnyen kiszrhetek a fejlcben tallhat MessageId mez segtsgvel, vagy a mr feldolgozott zenetek tartalmi lenyomat (hash) alapjn trtn sszevetsvel.

4.5.5. Idbeli kauzalits biztostsa


A vllalaton kvli hlzatokbl rkez zenetek esetben elfordulhat, hogy az eltr idbelltsok miatt bizonyos egymsra hivatkoz zenetek ok-okozati sszefggse idben felcserldik. Az ilyen anomlik elkerlse rdekben ezek javtst feldolgozsi idben meg kell oldani gy, hogy a hivatkoz zenet kldsi ideje legalbb annyi legyen, mint a hivatkozott zenet.

4.5.6. Tartalom kibontsa


A modern levelez kliensek kpesek zeneteinket a sima szveg mellett HTML s akr rich text formtumokban, szvegbe gyazott tartalmakkal egytt is kezelni. Az zenetek olvashatsgt azonban biztostani kell a gyengbb kpessgekkel rendelkez pldul webes vagy mobil levelezk szmra is. A legtbb kliens ezt gy ri el, hogy a levl zenett dupliklva kdolja, egyrszt a felad ltal beszerkesztett, msrszt pedig a cskkentett funkcij kliensek szmra olvashat mdon egyszer szvegknt. Amennyiben az zenet rendelkezik szvegbe gyazott tartalmakkal, gy azokat csatolmnyknt is kdoljk az alkalmazsok. A feldolgozs sorn fel kell ksztennk rendszernket a legklnflbb MIME tpus elemek s struktrk dekdolsra s azok kivonatols szempontjbl hasznlhat szveges s csatolt rszeinek ideiglenes trolsra is. Ugyanakkor a tbbszrs kdolst alkalmaz zeneteknl a tartalmak kibontsa sorn figyelni kell a feldolgozshoz leginkbb felhasznlhat egyedi rszek kinyersre, szem eltt tartva a kivonatols elsegtst s a gazdasgos trhely felhasznlst is.

4.5.7. Tartalmak kivonatolsa


A feldolgozs sorn kinyert tartalmak lnyegi rszeinek kivonatolsa az elemzs elksztsnek egyik legfontosabb rsze, hiszen a kivonatols sorn keletkez kulcsszavak segtsgvel trtnik az egyes zenetek magasabb szint tematikai, logikai sszekapcsolsa, melyek generlshoz szvegbnyszati megoldsok szksgesek.

31

4.5.8. Vllalati krnyezet elismerete


A feldolgozs s elemzs segtshez a krnyezeti elismeretek is szksgesek a szervezettel s a lehetsges kontextusokkal kapcsolatban. Ilyen ismeretek a korbban mr emltett e-mail cm, szemly s csoport nyilvntartsok vagy a folyamatok feltrsa szempontjbl, a tartalomkezels szinteknl mr emltett kulcssz s tma kivonatolsi-szablyok s ontolgia ptse.

4.6. Jelenlegi elemz megoldsok ttekintse


Az elemzrendszer tervezst mr ltez kommunikcit elemz megoldsok felkutatsval kezdtem. Br rengeteg olyan alkalmazst talltam, amely kpes e-mailek vllalati szint sszegyjtsre s a tartalmukban trtn tetszleges keressre, de egy kivtelvel nem talltam olyan megoldst, ami a tartalomkezelsen tl, az ebben a fejezetben definilt elemzsi szempontoknak valamilyen szinten is megfelelt volna.

4.6.1. Deep Email Miner


A Deep Email Miner egy nylt forrskd, JRE 5 verzira pl e-mail elemz megolds, amely alapveten ktfle funkcit lt el. Kpes kirajzolni az zenetek alapjn a szemlyek kapcsolati hljt illetve kpes listzni a klnbz szlak zeneteit. A projekt ugyanakkor nem foglalkozik vagy legalbbis publikusan ad megoldst a szabvnyos Internet Message formtumban lv e-mailek feldolgozsra, mivel azt adottnak tekinti. Az e-mailek egy egyszer 3 tbls adatbzis smban vannak letrolva, az zenetek, szemlyek s a kzbestsek egyedeivel. Az zenetek tartalma csak sima szveg lehet, csatolmnyokat, tartalomkontnereket s ms szvegeket nem kpes kezelni. A szoftver a csoportok kezelst nem tmogatja s egy szemlyhez csak egy e-mail tartozhat, gy sajnos a tbb cmmel rendelkez szemlyek ugyan azonos nvvel, de tbb csompontknt jelennek meg. A szoftver kapcsolati hl brzol fellete ugyanakkor kidolgozott, lehet vele szrni idintervallumra, kzbestsi mdra s arra, hogy egy kapcsolat minimum hny zenetbl lljon. A finomtshoz azonban szemlyekre nem llthat be szrfelttel. Az zenetek cmkzse manulis, vagyis a felhasznlk beltsra van bzva. sszesen ktfle cmkt alkalmazhatunk: magn vagy zleti. Az zenetek keresshez termszetesen tartozik egy kulcssz modul is, ami a nylt forrskd Word Vector Tool knyvtrat hasznlja, azonban az csak az alkalmazs memrijba betlttt zenetekben tud keresni, mivel a kulcsszavak nem kerlnek trolsra az adatbzisban. A Deep Email Miner sem koncepcijban, sem pedig architektrjban nem fedi az ltalam kitztt clokat, mivel csoportkezels, szemlyszrs, csatolmnyok, tetszleges cmkk s adatbzis alap

32

perzisztens kulcssz-keress hinyban nem alkalmas vllalati kommunikci elemzsre. Azonban kapcsolati-hlk felletn alkalmazott megoldsait rendszerem tervezsekor s fejlesztsekor mindenflekppen figyelembe kvntam venni. sszefoglalsul - tmm aktualitst hangslyozva - elmondhatjuk, hogy jelenleg nem ltezik olyan nyilvnosan elrhet eszkz, amely alkalmas lenne vllalati kommunikci elemzsre.

4.7. Elemzsi fzis sszefoglalsa


A kommunikci-elemzs tmakrnek feltrsa sorn ismertettem a vllalati kommunikci-elemzs lehetsgeit s jelentsgt a modern szervezetfejlesztsben. Kiemeltem hrom elemzsi mdot, - a kapcsolati hl elemzst, a tma-rsztvev elemzst, s a folyamat feldertst - s ezekhez definiltam brzolsi koncepcikat is. Ezek fogjk alkotni a megvalstand elemzrendszer vgfelhasznli elemz felleteinek megjelentsi mdjait. Az ltalnos kommunikcis modell s a kiemelt elemzsi mdok figyelembe vtelvel megalkottam a kommunikci elemzs fogalmi modelljt, melyben magt a kommunikcis folyamatot ngy, a tartalomkezelst pedig hrom szintre osztottam. Ezekhez kapcsoldva definiltam olyan kulcsfogalmakat, mint a kzbests, rsztvev, zenet, szl, folyam, tartalom, kivonat s tma, melyek a logikai adatmodell egyedeit hivatottak elkszteni. Bemutattam a leggyakoribb vllalati kommunikcis csatornkat s rszletesen kifejtettem az elektronikus levelezs mkdst s zenetformtumnak fontosabb rszleteit, meghatroz szabvnyait s ajnlsait. Ismertettem ez e-mail zenetekbl kinyerhet, elemzs szempontjbl hasznos fejlc mezket s kitrtem a tartalmak dekdolsnak rszleteire is, melyek a megvalstand e-mail feldolgozs fontos rszei lesznek. A vllalati krnyezet, a fogalmi modell s a kommunikcis csatornk ismeretben definiltam a feldolgozs f feladatait s problmit, melyeknek a szemlyek, csoportok s szlak azonostst, az idbeli kauzalits biztostst, a tbbszrs feldolgozs elkerlst, a tartalmak kibontst, kivonatolst s a krnyezeti elismeretek kezelst neveztem meg. Az elemzsi fzisban ugyanakkor kutattam jelenlegi kommunikcit elemz megoldsok utn is, melyeket figyelembe kvntam venni az elemzrendszer megvalstshoz. A kutats eredmnyeknt egyetlen hasonl alkalmazst talltam, a Deep Email Miner-t, melyet rszletesen szemgyre is vettem. A felmrs vgn megllaptottam, hogy a szoftver csak nagyon kis rszben fedi le a dolgozatomban kitztt elemzsi clokat. Tmm aktualitst hangslyozva vgl arra a megllaptsra jutottam, hogy jelenleg nem ltezik olyan nyilvnosan elrhet eszkz, amely alkalmas lenne vllalati kommunikci elemzsre.

33

5. Tervezsi fzis
E fejezet clja az elzekben ismertetett funkcik modulokba szervezse s pontos megtervezse, valamint a fogalmi modell egyedeire s kapcsolataira pl logikai adatmodell s elemzsi adatbzis megtervezse.

5.1. Tervezi dntsek


5.1.1. Hromrteg gyfl-kiszolgl architektra
A rendszer erforrsainak elosztsakor az elsdleges szempont, hogy minden komponens a sajt feladatt a lehet leghatkonyabban lthassa el. ppen ezrt sztvlasztottam az adatok fizikai kezelst s a rpl alkalmazsi logikt, valamint a vgfelhasznlk ltal hasznlhat prezentcis felletek rtegt. A kiszolgl oldalon az adatok fizikai kezelst ellt adatbzisszerver s egy kztes rteg, az alkalmazsi logika kiszolglja kerl kialaktsra, mely a hlzaton rkapcsold gyfelek elemzsi krseit hajtja vgre. A kliens oldalon mr csak a krt s szksges informcik jelennek meg, melyeket a felhasznlk szabadon transzformlhatnak a kiszolgl tovbbi terhelse nlkl. A rtegek kztti interfszek tviteli kapacitsa a megolds kritikus pontja, mert mg a kiszolgl oldalon felttelezhetjk az adatbzisszerver s alkalmazsszerver kztti megfelel svszlessget, a kliensek s az alkalmazs-szerver kztti kapcsolatrl mr nem mondhat el ugyanez. Kliens oldalrl vkony svszlessget felttelezve a kommunikcit a lehet legtmrebben kell megvalstani, melyet a mr elkldtt informcik kliens oldali jrahasznostsval s gyorsttrazsval tervezem megoldani.

5.1.2. Web Service alap kliens-szerver kapcsolat


A weben trtn egyttmkds egyik legelterjedtebb mdja a Web Service k hasznlata, melyek lehetv teszik tvoli eljrsok paramterezett hvst s vlaszok kldst HTTP n keresztl XML dokumentumok segtsgvel. A kiszolgl eljrsainak hvsa gy gyakorlatilag brmilyen klienssel megvalsthat, ezrt a kliens s szerver kztti egyttmkdst a platform-fggetlen Web Service megoldsra tervezem.

5.1.3. E-mailek gyjtse s feldolgozsa


Gyjts mdja
A kommunikcis zenetek gyjtse a leghatkonyabban a tovbbtsi-lncba trtn belpssel oldhat meg, hiszen zembelltsa jval kevesebb beavatkozst ignyel, mint a felhasznlk postafikjainak elrse. Ez utbbi megoldssal ugyanis az a problma, hogy a betlt alrendszernek 34

minden egyes megfigyelt postafikhoz hozz kell frnie, amelynek adminisztrlsa nehezen megoldhat. Ezzel szemben az els megoldsban elg a kimen s berkez levelek kiszolglit figyelni egy-egy bekelssel a teljes csatorna elemzshez. Az e-mailek megfigyelsnek elsegtshez a levelezszerver a rajta thalad leveleket egy mappba fogja gyjteni, melyeket a pufferel modul a feldolgoz s betlt modulnak tovbbt.

Gyjts s feldolgozs kln modulban


Br mindkt funkci az e-mailek elemzrendszerbe tltst ltja el, kln modulban trtn megvalstsuk szksges. Az e-mailek gyjtse a kommunikcis csatornba trtn belpssel azt jelenti, hogy a gyjtst vgz modul a levelezszerveren fut, azonban a feldolgozst erforrs ignyes feladatai miatt egy msik gpen ajnlott elvgezni a levelezszerver indokolatlan terhelst elkerlve.

Puffer tbla s aszinkron feldolgozs


Ugyanakkor a gyjts elsdleges feladata, hogy az elfogott zeneteket tadja a feldolgozst vgz modulnak, azonban ez az tads nem trtnhet szinkron mdon, hiszen a feldolgozs (a rsztvevk, tartalmak s egyb informcik kibontsval) jval idignyesebb feladat. Az e-mail pufferel modul egy puffer szerept betlt adatbzis tblba fogja beszrni a feldolgozsra vr zeneteket, melyeket ksbb a feldolgoz modul innen vesz el. A puffer tbla ugyanakkor a betltsi fzisnl fontos tbbszrs feldolgozs elkerlst is segti a tblra vonatkoz megktsekkel, gy az ilyen tpus zenetek mr beszrsi idben el lesznek utastva.

Kzvetlen adatbzis elrs


A rendszer megvalstsnl alapvet szempont, hogy a feldolgozs sorn az adatokat gy kell elkszteni, hogy az elemzsekhez a hatalmas halmazok elrshez a lehet legkevesebb adatbzis mveletre legyen szksg. Ugyanakkor a feldolgozs s a smba trtn beszrs kltsges s idignyes feladat, melyet gy kell idzteni, hogy kpes legyen az zenetek feldolgozsra s betltsre gy, hogy az jonnan rkez, feldolgozsra vr zenetek ne torldjanak fel. A fentieket figyelembe vve a gyjt s feldolgoz funkcikat ellt modulok a gyorsabb rendszerbe tlts rdekben kzvetlenl az adatbzist fogjk elrni az alkalmazsszerver megkerlsvel.

5.1.4. Krnyezet kivlasztsa


A gyjtsi alrendszer tervezsekor kiemelt szempont a klnbz levelezsi kiszolglkhoz trtn bepls, ezrt platform-fggetlensg figyelembevtelvel a Java krnyezetre esett a vlaszts. A kiszolgl s kliens oldali logikk megvalstsnl kimondottan a nagyvllalati s kiszolgl rendszerek megvalstsra alkalmas krnyezetet kerestem, melyek zemeltetse s karbantartsa egyszer, ezrt e modulok megvalstst Microsoft Windows platformra s .NET keretrendszerre tervezem.

35

5.1.5. Adatbzisszerver kivlasztsa


Vllalati kommunikci sorn naponta folyamatosan akr tbb ezer zenet is thaladhat, melyek talaktsa, feldolgozsa, kivonatolsa, trolsa, indexelse s elemzse hatalmas erforrsokat emszthet fel. Az adatbzisszerver megvlasztsakor kiemelt szempont, hogy olyan DBMS szolglja ki az elemzrendszert, amely kpes nagy mennyisg adat hatkony kezelsre. Az ltalnos adatbzis funkcik mellett tmogatnia kell a tbbdimenzis elemzseket, s a kivonatolsi funkcik megvalstshoz rendelkeznie kell szvegbnyszati megoldssal is. Dntsem ezrt az Oracle Database 11g megoldsra esett, mely OLAP s Text opcik teleptsvel megbirkzik a fenti feladatokkal.

5.2. Alrendszerek s modulok meghatrozsa


A modulok meghatrozsakor els sorban a hasonl rendeltets funkcionlis elemek s a tervezi dntseknl meghatrozott szempontokat vettem figyelembe. A modulokat az architekturlis dntsek miatt 4 alrendszerbe szerveztem, melyeket a 9. bra szemlltet. Az bra aljn a rendszerrel prhuzamosan brzoltam az t f funkcionlis terletet is.
E-mail betlt alr.
M TA
zenet Pufferel modul

Elemzs kiszolgl

Kliens alkalmazs
Vgfelhasznli felletek Kapcsolati hl elemzs Szemly-tma trkp Folyamat feltrkpezs Erforrs statisztikk Adminisztrcis felletek Szervezeti adatok Rendszerbelltsok

Elemzsi Adatbzis-szerver
OLAP s Szvegbnyszat tmogatsa Kommunikcis adatok s fizikai elezsi modell

Adatelrsi rteg

Komm. Puffer
Nyers adat

Feldolgoz s betlt modul

Cmkzs s kivonatols Kiszolgl modulok, osztlyok

Elemzsek vgrehajtsa Rendszer adminisztr.

Adatelrsi rteg

Kzs Rendszerknyvtrak s Osztlyok

HTTP kapcsolat

Gyjts

Feldolgozs

Trols

Elemzs

Hozzfrs

9. bra Kommunikcit elemz rendszer architektrja s funkcionlis felosztsa Az e-mail betlt alrendszer biztostja az e-mailek gyjtst, feldolgozst s beszrst. Az elemzsi adatbzis gondoskodik az elemzsi adatstruktra s az ahhoz kapcsold adatok trolsrl. Az elemzsi kiszolgl ltja el az zleti logika szerept, mely a kliensektl rkez elemzsi s adminisztrcis krseket szolglja ki. A kliens alkalmazs feladata a vgfelhasznlk szmra egyszer s knyelme s fellet nyjtsa az elemzsi s adminisztrcis feladatok elltshoz, valamint az elemzsi eredmnyek brzolshoz. Az egyes modulok s osztlyok rszletes defincijt a dolgozat terjedelmt figyelembe vve nem ismertetem, azonban az elemzs szempontjbl fontosabb alkotk osztlydiagrammjt az A fggelkben rszletezem.

36

5.2.1. E-mail betlt alrendszer


Ez az alrendszer tekinthet kommunikcit elemz zleti intelligencia rendszernk ETL eszkznek.

E-mail Pufferel modul


Az e-mail pufferel modul szerepe az zenetek gyjtse a tovbbtsban rsztvev szerverektl s betltse egy puffer tblba. Az ltalunk felptett krnyezetben a levelezszerverek tovbbtsi lncba belpve az e -maileket egy mappba gyjtik. Az e-mail pufferel modul temezett mdon futtatva a belltott mappbl az zeneteket egyenknt kiolvasva elkszti azok hash kulcst s betlti a puffer adatbzis tbljba feldolgozsra vr sttuszjelzssel. Amennyiben egy levl mr szerepel a puffer tblban, gy az adatbzis elutastja a beszrst. A modul a paramtereket parancssorbl vagy konfigurcis fjlbl is tveheti, ahol megadhat, hogy az zenetek beolvassa mely mappbl trtnjen, pufferels utn trldjenek-e az zenetek s termszetesen az adatbzisok hozzfrse is itt llthat be. Alaprtelmezsknt a pufferbe tlttt zeneteket a modul automatikusan trli a mappbl. A megvalstand feladatok sszefoglalva: Paramterek beolvassa parancssorbl vagy konfigurcis fjlbl Beszdes md a futs rszletes nyomon kvetshez s naplk generlshoz zeneteket tartalmaz mappa e-mailjeinek beolvassa s tartalmukbl hash kpzs E-mailek hash kulcsokkal trtn betltse a puffer tblba Belltstl fggen, a pufferelt zenetek trlse a forrsmappbl

Kommunikcis Puffer
Szerepe a feldolgozsra vr levelek trolsa s itt trtnik a levelek tbbszrs feldolgozs elleni vdelme, mivel a pufferelend levelek beolvassa sorn a teljes zenet tartambl egy hash kpzdik, amelynek fenntartott mezt elsdleges, egyedi kulcsaknt hasznlunk (BUFFER_ID). Amennyiben egy zenet mr bent van a puffer tblban, vagyis a hash rtke mr szerepel valamelyik BUFFER_ID mezben, gy az adatbzis az egyedisg srlse miatt jelezni fog s megakadlyozza az ismtelt beszrst. 4. tblzat E-mail betlt alrendszer ltal hasznlt puffer tbla
CAD_RAWDATA
BUFFER_ID DATA STATUS CATEGORY COMM_ID VARCHAR2(400 byte) CLOB NUMBER(1,0) NUMBER(1,0) VARCHAR2(400 byte)

Puffer tbla Az zenet HASH kulcst trol szveges mez egyedisg megktssel A teljes, feldolgozsra vr nyers e-mail Ez a mez jelzi, hogy egy e-mail feldolgozsra vr-e A kommunikcis csatorna azonostjt trol mez A feldolgoz modul ltal visszart e-mail MessageID ellenrzsi clokbl

37

E-mail feldolgoz s betlt modul


Az e-mail feldolgoz s betlt modul lekrdezi s feldolgozza a puffer tbla mg feldolgozatlan nyers kommunikcis zeneteit, ezek alapjn felpti a kommunikcis adatstruktrt, majd beszrja az elemzsi adatbzisba. A modul a paramtereket parancssorbl vagy konfigurcis fjlbl is tveheti, melyeken keresztl az adatbzisok hozzfrse llthat be. A megvalstand feladatok sszefoglalva: Paramterek beolvassa parancssorbl vagy konfigurcis fjlbl Beszdes md a futs rszletes nyomon kvetshez s naplk generlshoz Feldolgozatlan e-mailek lekrdezse a puffer tblbl E-mailek feldolgozsa o o o o o o E-mail MessageId fejlc mezjnek kiolvassa sszes cmzett s kzbestsi md kiolvassa Cmek alapjn rsztvevk azonostsa s ismeretlen rsztvevk regisztrlsa Tartalmi rszek (trgy, szveg, csatolmny s begyazott elemek) kibontsa E-mail szlbeli elzmnynek s hivatkozsi mdjnak kiolvassa Szlbeli elzmny idpontjnak s az aktulis e-mail idpontjnak egyeztetse (kauzalits megrzse) Kommunikcis adatstruktra felptse s beszrsa az elemzsi adatbzisba

5.2.2. Kzs Rendszerknyvtrak s osztlyok


Az architekturlis felpts miatt megosztott elemzsi s hozzfrsi funkcikat megvalst knyvtrak, melyeket a kliens s szerver kzsen hasznl, mind a hlzati, mind pedig a bels mveletek sorn.

38

Magba foglalja az albbi osztlyok s komponensek egysges kezelst: Rsztvevt megvalst osztlyok, kapcsold enumercik, rsztvevk gyorsttrazsi megoldsa s kapcsolatler osztlyok Kommunikcis modellt megvalst osztlyok s kapcsold enumercik Elemzsekhez hasznlt egysges lekrdezst megvalst osztlyok Elemzsek eredmnyeit prezentl osztlyok Listk - pldul tmk, csatornk, kzbestsi mdok univerzlis trolst, gyorsttrazst megvalst osztlyok s eljrsok Kliens s szerver kztti esemnyvezrelt zenetkezels osztlyai

5.2.3. Elemzs kiszolgl


Az elemzs kiszolgl Web Service interfszen keresztl fogadja s szolglja ki a kliensektl rkez elemzsi s adminisztrcis krseket. Feladata az elemzsek futtatsa, vllalati adattrzs kezelse, valamint a tma s kivonatolsi szablyok karbantartsa az adatbzis szvegbnyszati kpessgeire tmaszkodva. Az alrendszer az adatbzisszerverhez egy sajt adatelrsi rtegen keresztl csatlakozik, melyek a kzs rendszerknyvtrak moduljait hasznlva az albbi szolgltatsokat pti. Elemzsi szolgltatsok Elemzs vgrehajt modul Kapcsolati hl elemzs vgrehajtsa Tma-rsztvev elemzs vgrehajtsa Folyamat feltrkpezs vgrehajtsa

Adminisztratv szolgltatsok Adminisztrcis modul Rsztvev osztly fl emelt funkcik Rsztvev pldny ltrehozsa, mdostsa, betltse Rsztvev pldnyok listjnak lekrdezse, szrfelttelekkel Tagsgi adatok kezelse - adott rsztvev csoportjainak s csoport esetben tagjainak lekrdezse, mentse Rsztvevk elrhetsgnek lekrdezse, mdostsa Ismeretlennek jellt rsztvev cserje ismert rsztvevre, elrhetsg regisztrlsval

Tma s kivonatolsi szablyok fl emelt szolgltatsok Tmk listjnak lekrdezse Kivonatolsi szably ltrehozsa, mdostsa, lekrdezse, futtatsa Kivonatolsi szablyok listjnak lekrdezse

39

Egyb feladatok s szolgltatsok Web Service interfsz megvalstsa a kliensekkel trtn kommunikcihoz Szerver zeneteinek tovbbtsa a kliensek fel Kapcsolati adatok tovbbtsa a kliens fel Sessionkezels kliensenknt a dediklt adatkapcsolat biztostshoz Adatelrsi rteg megvalstsa Adatelrsi rteg s egyb osztlyok kztti konvertlst segt eljrsok

5.2.4. Kliens alkalmazs


A vgfelhasznlk elemz s adminisztrcis felleteit megvalst kliens-oldali alkalmazs, melyen keresztl az elemzsi kiszolgl ltal nyjtott elemzsi s adminisztrcis szolgltatsok elrhetv vlnak. Elemzsi felleteivel a felhasznlk egyszeren llthatjk ssze s futtathatjk lekrdezseiket, elemzseiket, valamint a kapott eredmnyek a korbban ismertetett brzolsi koncepcik alapjn brzolja. Az brzolhatk transzformlhatk szemlyek vagy csoportok szerint is, valamint az lek irnytottsga is ki- s bekapcsolhat az elemz szndktl fggen. Az adminisztrcis felletek a rendszer karbantarti szmra biztostjk a vllalati rsztvevk, tagsgi adatok, elrhetsgek, s kivonatolsi szablyok kezelst. Ezltal a kliensben megvalstand funkcik s feladatok Elemzsi szolgltatsok Elemzsek sszelltsra alkalmas egyszer felhasznli fellet megvalstsa o o o o Rsztvevk egyszer keresse, listzsa, csoportostsa s kijellse szrsekhez Tmk szerinti szrs Szrs idintervallum alapjn Szrs a kommunikci gyakorisga alapjn

Elemzsi krsek kldse a kiszolgl megfelel tvoli eljrshoz s kiszolgl vlasznak fogadsa Web Service en keresztl Korbban mr lekrdezett adatok helyi gyorsttrazsa Kapcsolati hl brzolsa o o Kapcsolatok tbbfle nzetben trtn megjelentse: szemly-szemly, csoportszemly, csoport-csoport Kapcsolati lek irnytott s irnytatlan megjelentse Kapcsolatok tbbfle nzetben trtn megjelentse: tma-szemly, tma-csoport Kapcsolati lek irnytott s irnytatlan megjelentse

Tma-rsztvev trkpek brzolsa o o

Folyamattrkp brzolsa

40

Adminisztrcis szolgltatsok Kivonatolsi szablyok lekrdezse s listzsa Kivonatolsi szably megjelentsre, szerkesztsre, mentsre s futtatsra alkalmas fellet megvalstsa Rsztvevk lekrdezse, listzsa Rsztvev megjelentsre, szerkesztsre, mentsre alkalmas fellet o o o o Szemly s csoport adatok szerkesztse Rsztvevhz tartoz elrhetsgek felvtele, szerkesztse, trlse Rsztvev csoporttagsgi adatainak felvtele, szerkesztse, trlse Ismeretlen rsztvevk azonostst szolgl rsztvev cserl eszkz

5.2.5. Elemzsi adatbzisszerver


A kzponti adatbzisszerver biztostja a kommunikcis modell fizikai trolst s elemzst. A gyors s hatkony elemzsek rdekben olyan adatbzismotort alkalmazunk, amely OLAP s szvegbnyszati megoldsokat is alkalmaz. Az elemzshez azonban az adatbzisszerver mellet szksg van a kommunikci szempontjbl jl hasznlhat logikai adatmodellre s adatbzis smra is, melyek tervezst a kvetkez rszben ismertetem.

5.3. Adatbzis tervezse


5.3.1. Logikai adatmodell
A logikai modell tervezse elsdleges clja az elemzsi fejezetben ismertetett fogalmi modell lefordtsa egyedek, attribtumok s kapcsolataik szintjre, melyek alapjn az adatbzis sma knnyen felpthet. Hagyomnyos tranzakcis adatbzisok tervezse esetn az elemzsi fzisbl a tervezsi fzisba kerl modell kulcskvetelmnye, hogy az redundancia-mentes, azaz normalizlt legyen. A normalizls segt olyan adatbzisokat ltrehozni, melyek nem tartalmaznak szksgtelenl redundns adatokat, gy a beszrsok, mdostsok s trlsek ltal nem jhetnek ltre olyan kvetkezetlensgeket, melyek trolt adataink ksbbi hasznlhatsgt rontank az adatmanipulci, a teljestmny s a helyessg tekintetben. Ugyanakkor meg kell jegyeznnk, hogy adatbzisunkat jelen esetben elemzsi s lekrdezsi clokra fogjuk hasznlni, amely sok tbla, kapcsolat, rendezs s csoportosts esetben rengeteg processzoridt emsztene fel a normalizlt forma miatt. ppen ezrt meg kell tallni az sszer megoldst a normalizlt forma s a leggyakoribb lekrdezsek kapcsolsi kltsgeinek optimalizlsra. Az adatbzis sma tervezshez ezrt azt a mdszer alkalmazom, hogy a logikai modellt redundanciamentestem, majd a leggyakoribb lekrdezsi szempontokat figyelembe vve bizonyos rszeit

41

denormalizlom a tblk kapcsolsi kltsgeinek minimalizlshoz, vagyis a teljestmny nvelsnek rdekben. A fentiek rtelmben az elz fejezetben ismertetett fogalmi modell elemeibl s jellemzibl a 10. brn lthat mdon elksztettem a modell Entits-Relcis Diagrammjt (ERD). A sma jobb tlthatsga rdekben a kulcsok s attribtumok listjt az brn nem jelltem, m az A fggelk A2 pontjban ezeket is ismertetem. A logikai adatmodell s a fogalmi modell megfeleltetsnek szemlltetsre az entitsok s kapcsolatok krl tglalapokkal jelltem a megvalstott szintet.
Szlak szintje Szl
1 elzmnye

Vllalati krnyezet
cme
*

rsze

Cm

Folyamok szintje Tma


*

tmja

1 * *

zenet
1

* 1 kzbestse

felad

Csoport
1 1 1 isa *

zenetek s tartalomkezels szintje

kivonat
*

rsze

Kzbests
*

Rsztvev
cmzett
isa

tagsg
*

Kulcssz

Szemly

Csatolmny

Kzbestsek szintje

10. bra Logikai adatmodell Entits Relcis Diagramja

5.3.2. Fizikai adatmodell


A lekrdezseink teljestmnynek javtsa rdekben szksges a logikai modellnk talaktsa s kapcsolatainak egyszerstse. Az zleti intelligencia rendszerek adattrhz megoldsainl leggyakrabban alkalmazott adatbzis sma a csillag-sma, mely az elemzsek szempontjbl, egy kzponti tnytblbl s a krltte elhelyezked csoportostsi, szrsi s egyb kifejtsi szempontokat tartalmaz dimenzitblkbl ll. A tnytbla sorai adatrekordokat tartalmaznak, melyek a dimenzitblkhoz egy-egy idegen kulccsal kapcsoldnak, gy ezeken keresztl elrhetv vlnak a dimenzi attribtumai. A tnytbla soraiban tallhat adatokat teht gy rtelmezhetk, hogy megkeressk a dimenzitblkban a kulcsoknak megfelel rekordokat. E megolds elnye, hogy egy ilyen adatstruktrban a tbbszrs tttes tblakapcsolsok szmnak cskkensvel vagy kizrsval a lekrdezsek ksztse s futtatsa is egyszerbb vlik, hiszen egy jl felptett csillag-smban a tnytblhoz kapcsold dimenzitblkat pr egyszeres

tblakapcsolssal kzvetlenl elrhetjk.

42

A rsztvevk ftpus egyede, a szemly s csoport ISA kapcsolata miatt sszetett helyzetet eredmnyez, ami a lekrdezsnk teljestmnyt ugyancsak rontja. Az ilyen tpus kapcsolat kikszblshez a szemly s csoport egyedeket megszntettem, m attribtumaikat sszevonva felvettem a rsztvev egyedhez s bevezettem egy j attribtumot az altpus jellsre, mellyel megklnbztethet, hogy szemlyrl vagy csoportrl van-e sz. Az elemzs-gyorsulsnak azonban ra van, mivel a kapcsolatok tszervezsvel bizonyos attribtumok redundns trolsa szksges. Ez ugyan megnveli az adatmanipulls kltsgeit, de elemzrendszernknl ez nem lnyeges szempont, hiszen a kommunikcis adathalmazon menet kzben csak bvtst vgznk.

5.3.3. Csillag-sma kialaktsa


Tnytbla
Az elemzsek szempontjbl leglnyegesebb egyedek a rsztvevk, az rintett tmk, kulcsszavak, a szlak s termszetesen maguk a kzbestsek, mivel az utbbi hatrozza meg, hogy ki, kivel, mikor s mirl kommuniklt. Ezek alapjn az elemzrendszer csillag-smjt a 11. brn lthat mdon a kzbestsek tnytblja kr ptettem, melynek dimenzii a kommunikci rsztvevi - a felad s cmzett szerepben -, annak tmi, kulcsszavai s szla lett.

Tma Csatolmny
*

Kulcssz
*

Szl
1

E-mail cm
*

tmja rsze
* * * * *

rsze
*

kivonat
1 elzmnye * 1

cme felad
1 1 1

zenet

Kzbests
*

Rsztvev
*

kzbestett

cmzett

tagsg

11. bra Tervezett Csillag-sma Entits- Relci Diagramja A 12. brn lthat, hogy a kzbestsek tnytblja a korbbi kapcsolatok felptshez szksges idegen kulcsok, valamint mg kt j id s dtum dimenzi idegen kulcsnak bevtele miatt ugyan kiszlesedett, de az gy kialaktott sma jval egyszerbb vlt az eredeti logikai modellnl, gy a lekrdezsek is egyszerbben vgrehajthatv vltak.

43

CAD_PARTICIPANTADDRESS [Cm] FK1 PARTICIPANT_ID [Rsztvev ID] ADDRESS [Egyedi Komm. Cm] CATEGORY [Komm. Csatorna] PK

CAD_PARTICIPANT [Rsztvev] PARTICIPANT_ID [Rsztvev ID] NAME [Nv] FOREIGN_ID [Trzsszm] TYPE [Szemly vagy Csoport] STATUS [Sttusza] PRIMARY_GROUP [Elsdleges csoport]

CAD_PARTICIPANTRELATION [Tagsg] FK1 FK2 USER_ID [Szemly ID] GROUP_ID [Csoport ID] ACTIVE [Aktv tagsg] MEMBER_FROM [Tagsg kezdete] MEMBER_TILL [Tagsg vge] CAD_TAG [Tma] COMM_ID [zenet ID] TAG_ID [Tma]

CAD_THREAD [Szl] PK THREAD_ID [Szl ID] NAME [Szl megnevezse] PK CAD_DATE [Dtum dimenzi] PK DATE_KEY [Mestersges Kulcs] YEAR [v] MONTH [Hnap] DAY [Nap] QUARTER [Negyedv] WORKDAY [Munkanap-e] FK1 FK2 CAD_SUBCOMM [Kzbests] SUBCOMM_ID [Kzbests ID] CATEGORY [Komm Csatorna] SUBCATEGORY [Kzbests md] RESULT [Sikeres kzbests] FROM_PARTICIPANT [Felad] TO_PARTICIPANT [Cmzett] SENT_TIME [Klds ideje] RECEIVED_TIME [Fogads ideje] JOINT_SEC [Kapcsols mp] DURATION_SEC [Komm. Hossza] COMM_ID [zenet ID] PREV_COMM_ID [Elz zenet ID] PREV_DELAY_SEC [Ksleltets elzhz] PREV_LINKMODE [Vlasz vagy Tovbbts] THREAD_ID [Szl azonostja] DATE_KEY [kzbests dtumkulcsa] TIME_KEY [Kzbests idkulcsa]

CAD_KEYWORD [CAD_KEYWORD] COMM_ID [zenet ID] KEYWORD [Kulcssz]

CAD_TIME [Id dimenzi] PK TIME_KEY [Mestersges kulcs] HOUR [ra] MINUTE [Perc] SECOND [Msodperc] TIME_OF_DAY [NAPSZAK]

FK3 FK5

CAD_COMM [zenet] PK COMM_ID [zenet azonost] LINKED [Eredeti zenet csatolva] LINK [Csatols URL-je] CONTENT [Teljes szveges tartalom] KEYWORDS [Kulcsszavak halmaza]

FK4 FK6 FK7

CAD_ATTACHMENT [Csatolmny] PK ATTACHMENT_ID [Csatolmny ID] ATTACHMENT [Csatolmny tartalma] COMM_ID [zenet ID] CONTENT_TYPE [Tartalom tpusa]

FK1,I1

12. bra Az elemz adatbzis csillag-smja A dtum s id dimenzik bevezetsvel az elemzrendszer kpes lesz olyan elemzsek vgrehajtsra s sszehasonltsra, melyek napszakokra, munkanapokra, vagy akr negyedves adatokra vonatkoznak. Ugyanakkor a dtumfggvnyek hasznlatnak mellzse miatt a kzbestsek tnye is gyorsabban lekrdezhetv vlt az egyes attribtumok szerint.

Kulcsok
A kzbests, zenet, csatolmny s rsztvev tblk esetben az elsdleges kulcsokat (primary key PK) mestersgesen GUID18 -ok generlsval mestersgesen osztottam ki, mg a dtum dimenzi elsdleges kulcsnak az HHNN dtumformtum, az id dimenzinak pedig az PPMM idformtum rtkeket vlasztottam szmknt brzolva, egyedisget biztost megszortssal. Ennek ksznheten a dtumintervallumokra trtn szrs vissza lett vezetve az egsz szmok kztti relcikra.

18

GUID - Globally Unique Identifier globlis egyedi azonost. Olyan lvletlen azonost, melyben az egyedi kulcsok szma annyira nagy (2128) hogy kt azonos szm generlsnak a valsznsge gyakorlatilag nulla.

44

Idegen kulcsok (foreign key - FK) akkor jelennek meg, ha egy kapcsolatban a tbla a gyermek szerept tlti be, ami jl megfigyelhet smnkban a tnytblk s a csoport-tagsg, illetve rsztvev-cm kapcsolatok definilsakor.

Indexek
Az indexek felvtelekor azt az elvet kvettem, hogy azokra az attribtumokra kell indexet pteni, melyekre a lekrdezsek a leggyakrabban irnyulnak, ezrt nyilvnvalan a kulcsok mellett, a tma, kulcssz, zenet azonost, valamint a dtum s id dimenzik attribtumaira is definiltam indexeket.

5.4. Kls komponensek


Az elemzrendszer tervezsekor a megvalstand feladatok ismeretben megvizsgltam, hogy vannake olyan ksz megoldsok, melyeket lehet s rdemes is felhasznlni a megvalsts sorn.

5.4.1. Sun JavaMail TM API


A Sun Microsystems ltal fejlesztett JavaMail
TM

API [19] egy keretrendszert biztost az IETF ltal

szabvnyostott e-mail zenetek ltrehozshoz, levelez kiszolglkrl trtn lekrdezshez, trolshoz s feldolgozshoz. A nyers zenetek feldolgozst megknnyt komponens kpes olyan Java objektumokat pldnyostani, melyek segtsgvel az e-mailek fejlc mezit s tartalomkontnereit knyelmesen s gyorsan ki lehet nyerni.

5.4.2. Microsoft GLEE MS AGL


Az elemzsi eredmnyek brzolsi lehetsgeinek megvalstshoz egy grf alap interaktv prezentcis rteget, a Microsoft Research ltal fejlesztett Microsoft Automatic Graph Layout (MSAGL) .NET referenciacsomag, egy korbbi verzijt a Microsoft Graph Layout Execution Engine (GLEE)-t vlasztottam, amely kereskedelmi s zleti felhasznlst kivve szabadon hasznlhat. A komponens segtsgvel a fejlesztk komplett eszkzgyjtemnyt kapnak grfok vektoros megjelentsre s interaktv esemnykezelsre.

5.4.3. Oracle Data Provider


A .NET keretrendszerben fejlesztett komponensek Oracle adatbzissal trtn egyttmkdshez az Oracle Data Provider .NET csomagjt vlasztottam. A komponensgyjtemny ms driverektl eltren natv mdon tmogatja az Oracle specifikus adattpusokat is [20]. A csomag tartalmaz szerveroldali menedzsment eszkzkkel egyttmkd eszkzket, melyek segtsget nyjtanak az adatbzisok tervezshez, adminisztrcijhoz, trolt-eljrsok hibajavtshoz, ugyanakkor lehetsget biztost akr a futs idben generlt lekrdezsek finomhangolshoz is Microsoft Visual Studio 2005 s 2008 fejleszti krnyezetekben.

45

6. Rendszer fejlesztse
6.1. Krnyezet ismertets
Ebben a szakaszban ismertetem a tervezsnl kivlasztott krnyezetekhez s kls komponensek fejlesztshez s tesztelshez hasznlt pontos verzikat, fejleszteszkzket s szmtgp konfigurcit. A Java komponensek fejlesztshez a NetBeans IDE 6.8, mg a .NET keretrendszer alatt fut komponensek implementlshoz a C# nyelvet s a Microsoft Visual Studio 2008 integrlt fejleszti krnyezetet hasznltam. A fejlesztsi s tesztelsi hardverkrnyezetknt sajt notebookomat hasznltam, gy a teljes fejlesztsi konfigurcit az 5. tblzat tartalmazza. 5. tblzat Fejlesztshez s tesztelshez hasznlt hardver- s szoftverkonfigurci Szmtgp Processzor RAM Opercis Rendszer Java krnyezet .NET krnyezet Adatbzisszerver Egyb komponensek HP Compaq nw8240 Intel Pentium M, 2,13 GHz (32bit) 2048 MB Windows 7 Enterprise 32-bit (6.1 build 7600) Java 6 Update 20 Microsoft .NET Framework 3.5.7283 Oracle Database 11g - 11.1.0.7.0 Oracle Developer Tools for Visual Studio 11.1.0.0720 Oracle JDBC Driver 11.1.0.7.0 Sun JavaMail API 1.4 Micosoft Research GLEE 1.0

6.2. Implementci
6.2.1. E-mail betlt alrendszer
E-mail Pufferel modul caEmailBufferer projekt
Ez az egyszer Java SE 6 konzolalkalmazs valstja meg az e-mailek pufferelst vgz modult, amely a szerveren lv leveleket a fjlrendszerbl kiolvasva betlti a puffer tblba Oracle Database 11g JDBC Driver segtsgvel.

E-mail feldolgoz s betlt modul caEmailBufferParser projekt


Ez a Java SE 6 konzolalkalmazs ltja el az caEmailBufferer ltal a puffer tblba betlttt, mg feldolgozatlan sttusszal rendelkez e-mailek feldolgozst s trolst az elemz adatbzisba. A puffer tblban az zenetek nyers Internet Message formtumban vannak rekordonknt trolva. A feldolgozsra vr e-maileket lekrdezs utn egy sajt SimpleMail osztllyal reprezentlom, ami a Sun JavaMail API MimeMessage osztlyt pldnyostva nyeri ki az elemzsi modellhez szksges adatokat az ltalam fejlesztett eljrsokkal. A felptett elemzsi adatstruktra elemzsi adatbzisba trtn

46

beszrst a SimpleMail osztlybl szrmaz SimpleMaiDatabaseObject vgzi. Sikeres beszrst kveten a puffer tblban az aktulis rekord sttusza feldolgozott llapotba kerl. A megvalstott modul osztlydiagramjt s tovbbi mkdst az A fggelk A3. pontja tartalmazza.

6.2.2. Kzs rendszerknyvtrak s osztlyok caCoreLibrary


A megvalstott rendszerknyvtr a kliens s szerver ltal hasznlt osztlyokat s eljrsokat tartalmazza egy kzs DLL-ben. A logikai modell ltal definilt egyedek s a rendszer mkdse szempontjbl lnyeges osztlyok s eljrsok funkcijuk alapjn modulokba vannak szervezve, melyeket a 6. tblzat, mg az elemzs szempontjbl fontosabb osztlyokat a 7. tblzat rszletezi. 6. tblzat Kzs rendszerknyvtr moduljai s szerepk
Rendszerknyvtr caAnalysisResults caComm caParticipant caRelation caConvert caGlobalList Szerepe Elemzsek eredmnyeit ler osztlyok gyjtemnye Kommunikcis modell s az azzal kapcsolatban ll enumercik, osztlyok s eljrsok gyjtemnye Rsztvevk s az ahhoz kapcsold osztlyok s statikus eljrsok gyjtemnye Szemlyek s csoportok kztti kapcsolatokat prezentl osztlyok Sajt osztlyok s tulajdonsgaik statikus konvertl eljrsai A kliens oldali listk - pldul tmk, csatornk, kzbestsi mdok univerzlis trolst, gyorsttrazst s grafikus prezentcijt ellt osztlyok s eljrsok Kliens s szerver kztti zenetkezelst biztost esemnykezelst tmogat, osztlyok s statikus eljrsok gyjtemnye sszelltott hierarchikus felttelek SQL lekrdezsekk alakt osztlyok gyjtemnye Egyb rendszerosztlyok s enumercik knyvtra

caMessageService caSQL caSystem

Az implementls sorn a kollekcik s halmazok hatkonyabb kezelse cljbl a .NET 3.5 keretrendszer beptett generikus lista osztlyt hasznltam. 7. tblzat Kzs rendszerknyvtr fontosabb osztlyai s szerepk
Osztly vagy Enumerci caCommCategory caCommSubcategory caParticipantType caParticipant caParticipantObject caParticipantAddress caSubCommItem caSubCommItemObject caTaggingRule caMessage caGlobalList Szerepe Kommunikci csatornk listja Kommunikcis csatornk kzbestsi mdjait jell lista Rsztvevk tpust jell lista (szemly vagy csoport) Rsztvev egyedet ler osztly Rsztvev egyed kiterjesztett osztlya, gyorsttrazshoz s megjelentshez Rsztvev cmt reprezentl osztly Kzbests egyedt ler osztly Kzbests egyed kiterjesztett osztlya, gyorsttrazshoz s megjelentshez Kivonatolsi szablyt megvalst osztly A rendszer ltal generlt zenet osztly esemnyvezrelt zenetkezelshez A kliens oldali listk - pldul tmk, csatornk, kzbestsi mdok univerzlis trolst, gyorsttrazst s megjelentst ellt osztly

47

6.2.3. Elemzs kiszolgl - caServiceHost


Az elemzs kiszolgl rendszert egy nmagt hostol.NET Windows Communication Foundation Service-knt implementltam, mely elindtsa utn a gp 8511-es portjn szolglja ki a HTTP n rkez Web Service hvsokat a caServiceLibrary szolgltatsaira ptve.

caServiceLibrary WCF Service projekt


A szerver szolgltatsait a WCF Service Library Service nev osztly vgzi az IService interfsz implementlsval, melynek adminisztrcis eljrsait a 8. tblzat, elemzsi eljrsait pedig a 9. tblzat ismerteti. A kliensek ltal kezdemnyezett hvsok szerver oldalon minden esetben j adatelrsi osztlyt pldnyostanak, gy az egyes elemzsi s adminisztrcis mveletek egymstl elklntetten hajthatk vgre.

Adminisztrcis modul
Az adminisztrcis modul eljrsai a rendszerknyvtrak alapobjektumai szintjn nyjtanak sszetett szemly, csoport s cm-kezelsi, valamint a caTaggingRule osztlyra pl kivonatolsi szolgltatsokat. 8. tblzat Kiszolgl oldali rendszeradminisztrcis eljrsok
Szerep j adatkapcsolat nyitsa Szerver zenetek letltse Rsztvev pldny lekrse Rsztvev pldny mentse Rsztvev lista lekrdezse Rsztvev csoportjainak lekrse Rsztvev csoportjainak mentse Rsztvev tagjainak lekrse Rsztvev tagjainak mentse Rsztvev cmeinek lekrse Rsztvev cmeinek mentse Rsztvev cserje msikra Tmk listjnak lekrdezse Tma trlse Kivonatolsi szably lekrse Kivonatolsi szablyok listja Kivonatolsi szably mentse Kivonatolsi szably futtatsa Web Service eljrs Connect GetMessages LoadParticipant SaveParticipant LoadParticipantList LoadParticipantGroups SaveParticipantGroups LoadParticipantMembers SaveParticipantMembers LoadParticipantAddress SaveParticipantAddress ReplaceParticipant LoadTagList DeleteTag LoadTaggingRule LoadTaggingRuleList SaveTaggingRule RunTaggingRule Eredmny osztlya caMessage List<caMessage> caParticipant caParticipant List<caParticipant> List<caParticipant> List<caParticipant> List<caParticipant> List<caParticipant> List<caParticipantAddress> List<caParticipantAddress> caMessage List<string caMessage caTaggingRule List<caTaggingRule> caTaggingRule caMessage

Kivonatolsi szablyok caTaggingRule osztlyok


A kiszolgl logika szvegbnyszati feladatait az Oracle Text opci szolgltatsaira ptve terveztem megoldani, melyek tmogatsra a caTaggingRule osztlyokat hoztam ltre. Ezek gyakorlatilag olyan

48

objektumok, amelyek elre elksztett SQL utastsokat foglalnak magukba kulcsszavak s tmk generlshoz.

Elemzs-vgrehajts
Az elemzsek a kiszolgl 9. tblzatban szerepl eljrsain keresztl vgezhetk el. Az elemzsek mindegyike sajt eredmnyosztllyal rendelkezik. Ezek a kisebb svszlessg hlzatokon is csak az eredmny szempontjbl leglnyegesebb informcikat tartalmazzk, a tbbletinformcikat pedig a kliensek gyorsttra biztostja. A hrom elemzsi eredmnyosztly mezit az A fggelk A5. pontja tartalmazza. 9. tblzat Kommunikci-elemzst megvalst eljrsok s eredmnytpusaik
Elemzs

Kapcsolati hl elemzs Tma-rsztvev elemzs Folyamat fekderts

Web Service eljrs GetParticipantRelationAnalysisResultList GetTagParticipantAnalysisResultList GetFlowAnalysisResultList

Eredmny osztlya caRelationAnalysisResult caTagParticipantAnalysisResult caFlowAnalysisResult

Adatelrsi rteg - caDataAccessLayer projekt


Az adatok fizikai kezelst egy kztes adatelrsi rteggel oldottam meg, amely a kiszolgl szolgltatsszint eljrsaibl kerlnek meghvsra a caDatabaseService osztly pldnyostsval. Az adatelrsi rteg az elemi mveleteket adatbzis-specifikus hvsokk alaktja az Oracle Data Provider .NET osztlyaira s szolgltatsait hasznlva.

6.2.4. Kliens alkalmazs caClient projekt


Az elemzrendszer vastag-kliens megoldsa egy Windows Forms projekt, amely sajt osztlyain kvl a caCoreLibrary, caGraphLibrary knyvtrakra pl s a szerverrel trtn kommunikcihoz a ServiceClient osztlyt hasznlja. Az elemzsi s adminisztrcis funkcikat kln rlapok ltjk el, melyek a fablakban MDI gyermekknt jelennek meg. A Forms nvtrben szerepl rlapok (10. tblzat) tetszleges pldnyban futhatnak, melyek mindegyike a fablak kapcsolat pldnyt msolva kommunikl a szerverrel. 10. tblzat Kliens funkcikat megvalst rlapok s lersuk
Elltott funkci Kliens alkalmazs fablaka MDI szl Kapcsolati-hl elemzs Folyam felderts Tma-rsztvev elemzs Kapcsolatkezels Rsztvev rszleteinek rlapja Rsztvev kezelfellete Rsztvev cserl eszkz Keres felletekhez Rsztvev-vlaszt Windows Forms rlap
FormMain FormParticipantRelationAnalysis FormFlowAnalysis FormTagRelationAnalysis FormConnect FormParticipant FormParticipantMgmt FormParticipantReplaceTool FormParticipantSelector

49

Kivonatolsi szably rszleteinek rlapja Kivonatolsi szablyok kezelfellete

FormTaggingRule FormTaggingRuleMgmt

A gyakran hasznlt rlapfunkcik elltshoz - mint pldul a rsztvevk listzsa, kivlasztsa, szrse, valamint az ltalnos keresfellet kialaktsa - sajt vezrlket fejlesztettem, melyek a projekt Controls nvterben tallhatak.

Eredmnyek grafikus prezentcija caGraphLibrary


Az rlapok eredmnyeinek brzolst megvalst s interaktv elemzst lehetv tev Windows Forms vezrlk projektje a caGraphLibrary, melynek osztlyai generljk az elemzsi fejezetben koncepcionlisan felvzolt brzolsi mdoknak s tervezsi feladatoknak megfelel grafikus kimeneteket. A hrom elemzsi mdhoz fejlesztett hrom Windows Forms vezrl osztlyt a 11. tblzat tartalmazza. 11. tblzat brzolst megvalst vezrlk osztlyai s lersaik
brzolsi md Kapcsolati hl Tma-rsztvev trkp Folyamattrkp Windows Forms vezrl osztly
caRelationGraph caCompetencyDigaram caCommFlow

A vezrlk fejlesztsben a Microsoft GLEE ltal biztostott osztlyokat s GUI vezrlket hasznltam. Az elemzsek eredmnyhalmazt .NET generikus listaknt troltam s a grfok felptst, valamint a memriban lv halmazok kezelst LINQ for Objects19 megoldssal valstottam meg.

19

LINQ Language Integrated Query, A Microsoft .NET keretrendszer beptett lekrdez nyelve, amely az SQL hez hasonl szerkezettel kpes objektumhalmazokon s adatobjektumokon klnbz kivlasztsi s adatmanipullsi mveleteket vgrehajtani

50

7. rtkels
Az elemzsi s tervezsi fzisban kitztt clok s feladatok sikeresen megvalstsra kerltek, gy elkszlt a kommunikcit elemz rendszer ngy alrendszere, az e-mail betlt, az elemzsi kiszolgl, az elemzsi adatbzisszerver s a kliens alkalmazs is, a szvegbnyszati funkcik kivtelvel az sszes funkcit lefedve. Az egyes osztlyok, modulok s modulcsoportok mkdst kln-kln s sszekapcsolsuk utn is teszteltem mestersgesen elksztett teszteseteken, mg a rendszer egsznek mkdst sajt levelezsemen hibakeressi mdban s empirikus mdszerekkel is ellenriztem, ami gy a hibk folyamatos javtsa utn helyesnek bizonyult. A tovbbiakban a feladatkirsnak megfelelen az E-mail betlt s az Elemzsi s Hozzfrsi alrendszer funkciin keresztl rtkelem az e-mailek feldolgozst, relci-elemzst s azok kapcsolati-hls megjelentst vgz komponenseket.

7.1. E-mail betlt alrendszer rtkelse


Az e-mailek fjl-forrs-bl trtn feldolgozst az elz fejezetben ismertetett caEmailBufferer s caEmailBufferParser Java modulok vgzik. A levelezs tovbbtsi lncbl egy mappba gyjttt emailek pufferelst az elbbi, mg a pufferelt zenetek tnyleges feldolgozst s elemzsi -modellnek megfelel talaktst s betltst az utbbi JAR konzol-alkalmazs vgzi.

7.1.1. Teljestmny rtkelse


Az alrendszer teljestmnybeli tesztelst klnbz mret s szmossg zenethalmazokon teszteltem. A mrsek a pufferel s feldolgoz komponensek sorostott futtatsval, beszdes mdban szolgltatott futsi idk alapjn kszltek, melyek eredmnyeit a 12. tblzat tartalmazza. A mrsi tblzat minden egyes sora egy tesztfutst jelent. Az els sor az resjrati tesztfuttatst jelenti, ahol a modulok elindultak, de nem talltak sem betltend, sem pedig feldolgozand zenetet. Az A oszlop tartalmazza az egy futs alatt beolvasott e-mailek szmt, a B oszlop pedig ezeknek az emaileknek a teljes mrett KB-ban. C oszlop mutatja, hogy az adott e-mail halmazon a pufferel modul mennyi ideig futott, a D pedig ugyanezt a feldolgoz modul futsi idejre. Az E oszlop tartalmazza a kt modul futsi idejnek sszegt. F oszlop a relatv futsi idt tartalmazza, ami a teljes futsi id a rendszer resjrati idejvel cskkentett rtket jelenti (E-2945 ms), mely a rendszer bemelegedsi idejt ezltal kiveszi a tovbbi szmtsokbl. G oszlop egy zenet tlagos mrett adja meg (B/A), mg a H oszlop egy zenet tlag, relatv beszrsi idejt (F/A). A mrs legrdekesebb rtke az I oszlop, amely azt mutatja, meg, hogy tlagosan mennyi relatv idt ignyel 1KB adat beszrsa a rendszerbe.

51

12. tblzat E-mail betlt alrendszer modulok tesztjnek mrsi eredmnyei


A Email (db) B Teljes mret (KB) C Pufferel futtsa (ms) D Feldolgoz futsa (ms) E sszes Beszrsi Id (ms) F Relatv beszrsi id (ms) G Egy zenet tlag mrete (KB) H Egy zenet relatv tlag besz ideje (ms) I 1 KB tlag relatv besz. id (ms)

1 5 10 25 1 5 10 25 1 5 10 25 1 5 10 25 1 5 10 25 1 5 10 20 1 50

1 5 10 25 2 10 20 50 4 15 30 90 5 36 70 192 300 967 2 264 5 076 1 058 5 214 11 614 30 195 3 635 35 372

1 550 1 595 1 715 1 723 2 828 1 695 1 734 1 739 2 047 1 598 1 643 1 719 3 007 1 406 1 609 2 203 2 922 1 688 3 063 5 656 10 407 2 547 7 968 20 203 45 500 3 703 25 484

1 395 1 643 2 283 2 507 3 201 1 895 1 979 2 910 2 910 1 640 1 890 2 406 4 047 1 656 1 891 2 047 2 657 1 781 2 531 3 797 6 625 2 343 5 031 9 281 22 313 4 547 26 111

2 945 3 238 3 998 4 230 6 029 3 590 3 713 4 649 4 957 3 238 3 533 4 125 7 054 3 062 3 500 4 250 5 579 3 469 5 594 9 453 17 032 4 890 12 999 29 484 67 813 8 250 51 595

293 1 053 1 285 3 084 645 768 1 704 2 012 293 588 1 180 4 109 117 555 1 305 2 634 524 2 649 6 508 14 087 1 945 10 054 26 539 64 868 5 305 48 650

1,0 1,0 1,0 1,0 2,0 2,0 2,0 2,0 4,0 3,0 3,0 3,6 5,0 7,2 7,0 7,7 300,0 193,4 226,4 203,0 1 058,0 1 042,8 1 161,4 1 509,8 3 635,0 707,4

293,00 210,60 128,50 123,36 645,00 153,60 170,40 80,48 293,00 117,60 118,00 164,36 117,00 111,00 130,50 105,36 524,00 529,80 650,80 563,48 1 945,00 2 010,80 2 653,90 3 243,40 5 305,00 973,00

293,00 210,60 128,50 123,36 322,50 76,80 85,20 40,24 73,25 39,20 39,33 45,66 23,40 15,42 18,64 13,72 1,75 2,74 2,87 2,78 1,84 1,93 2,29 2,15 1,46 1,38

A fejlesztsi hardver s szoftver konfigurcin vgzett mrsek eredmnyeinek vizsglatval elmondhat, hogy az zenetek 1KB-ra es tlagos beszrsi ideje a komponensek indulsi idejt is figyelembe vve (I oszlop) annl gyorsabb, minl nagyobb az egyszerre beolvasott zenethalmaz mrete (A, B oszlop). Termszetesen a futsi idk javthatk, ha a pufferelsi s feldolgozsi modulok soros feldolgozs helyett prhozamosan vannak futtatva, mivel gy az elz prhuzamos fzisban pufferelt zeneteket a feldolgoz modul az jabb pufferelsi ciklussal prhuzamosan kpes feldolgozni s beszrni az elemzsi adatbzisba. Megllapthat, hogy a rendszer szk keresztmetszete a modulok indtsi s listzsi fzisa, ami az resjrati tesztnl figyelhet meg, hiszen a moduloknak kln-kln is krlbell 1,5 msodperc kellett, mire elindultak s lekrdeztk a betltsre vagy feldolgozsra vr e-mailek res listjt.

7.2. Elemzs rtkelse


7.2.1. Elemzsi modulok bemutatsa
Az megvalstott kliens alkalmazs elemzsi s adminisztratv funkciit a vgfelhasznlk bejelentkezs utn rhetik el a bal oldalt elhelyezked fa struktrj menbl. Az elemzs men alatt 52

rhet el a tervezs sorn kitztt hrom elemzsi md, a kapcsolati hl elemzs, a tma-rsztvev elemzs s a folyamat felderts. Az elemzsek a terveknek megfelelen megoszlik az elemzsi-kiszolgl s kliens kztt. Az elemzsek vgrehajtst kizrlag a kiszolgl ltja el, a lekrdezsek sszelltsa, rszletekkel trtn kiegsztse s brzols pedig a kliens erforrsait hasznlja. A tmk listjnak letltse s gyorsttrazsa a kliens indulsakor trtnik, ami a tovbbiakban gy nem terheli a szerver erforrsait.

Elemzfellet ismertetse
A terveknek megfelelen a megvalstott kliens az sszes elemzshez egysges szrsi felletet (13. bra) biztost, melyen a felhasznlk gyorsan s egyszeren llthatjk be elemzsi szempontjaikat. Itt adhat meg, hogy az elemzs milyen idintervallumban trtnjen, milyen tmkban keressen, konkrt rsztvevk megjellsvel, valamint az is megadhat, hogy minimum hny zentet vegyen figyelembe kt rsztvev kapcsolatnak feltrskor.

13. bra A rendszer ltalnos elemzfellete

Kapcsolati hl elemzs bemutatsa


A kapcsolati hl elemz modul az ltalnos elemzsi szempontok belltsa utn sszelltja lekrdezst, majd az elemzsi krst eljuttatja a szervernek. A kiszolgl a krsnek kln adatbziskapcsolatot dediklva elvgzi az elemzst, majd a kis svszlessgre kialaktott reduklt eredmnyhalmazt visszakldi a kliensnek, amik ezutn az eredmnyek oldalon jelennek meg.

53

A vizualizcik oldaln az elemzs eredmnyt brzolja a tervezsi cloknl kitztt mdon (14. bra). Ezen a felleten a felhasznl az brzolst tovbb finomthatja az alapjn, hogy a szereplket szemlyek vagy csoportjaik alapjn kvnja megjelenteni vagy, hogy szmt-e a kommunikci irnya. A kapcsolati lek automatikus vastagtsval a rendszer kiemeli a gyakran kommunikl klikkeket s a vgeredmny akr kpknt is exportlhat.

Adorjn R

14. bra Kapcsolati hl vizualizcis modulja (A 14. bra Murti kos rsztvevvel kapcsolatban ll szemlyeket jelenti, melyen a rendszer feltntette a kapcsolatok irnyt is. A kprl leolvasat a vastagtott leket figyelembe vve, hogy az adott elemzsnl a GOE Irodval gyakran kommuniklt a szerepl.)

Tma-rsztvev elemzs bemutatsa


A tma-rsztvev kapcsolat a rsztvev elemzsi modulhoz hasonlan pl fel. Az elemzsi szempontok belltsa utn a kliens krst a szerver fel tovbbtja, majd a kapott eredmnyeket a tervezsi szempontoknak megfelelen brzolja a vizualizcik oldalon (15. bra).

54

15. bra Tma-rsztvev elemzs vizualizcis modulja (A 15. bra olyan elemzst brzol, melyben a rsztvevket csoportjaik alapjn jelentettk meg, gy leolvashat, hogy azok milyen tmkban kommuniklnak. A vastagtott leknek ksznheten leolvashat, hogy az Egyetem a leggyakoribb tma a hrom csoport kztt.)

Folyamat felderts
A folyamat felderts sorn az elemzsi szempontok belltsa utn az elemzs eredmnyeinek lekrdezse hasonlan trtnik, a mik kt elemzi modulhoz, azonban az brzols mdja itt eltr. A rendszer az egyes zenetpldnyokat az gymentben elfoglalt helyk alapjn az idtengely mentn fa struktrban brzolja (16. bra). Az brzolsi mdok kztt vlaszthat, hogy az zenetpldnyok vagy azokat birtokl rsztvevk ltal trtnjen a vizualizci. (A 16. brn egy folyamat felderts eredmnye lthat, ahol a piros krk brzoljk az egyes zenetpldnyokat s az bra fels rszn elhelyezked vzszintes tengely mutatja az brzolt zenetpldnyok dtumait. Az zenetpldnyok kztt fut lek az jellik, hogy egy pldny a msiknak a folytatsa a kommunikciban. Ezltal az brrl leolvashat, hogy Murti kos 2005.04.12 n kapott egy zenetet, melyre csak kt napos ksssel vlaszolt. Ugyanakkor az e-mailre mg aznap kapott vlaszt, m a prbeszd ott meg is llt.)

55

16. bra Folyamat felderts vizualizcis modulja Az elemzsekhez tartoz tovbbi kpernykpek s magyarzatok a C fggelkben tallhatk.

7.2.2. brzols rtkelse


Rsztvev- s tma-rsztvev kapcsolat brzolsa
A kliens vizualizcis moduljait a Microsoft GLEE komponenseire ptettem, melyek a .NET generikus lista osztlyaira plnek, gy technikai felskorltot az ltaluk trol lek s csompontokra csak a futtat hardver ad. Ugyanakkor teszteltem ezeknek a komponenseknek abbl a szempontbl, hogy mennyire gyorsan kpesek megjelenteni a bementknt kapott grfot. A tesztels sorn vletlenszeren generltam N csompontos grfot, melyben egyszer N, 2N, majd 5N darab lt vletlenszeren hztam be a csompontok kztt. A grf generls idejt nem, csak az brzols idejt mrtem a teszt sorn, melynek eredmnyeit a 13. tblzat tartalmazza. 13. tblzat GLEE brzolsi teljestmnye klnbz csompont s l konfigurcik esetben
Csompontok N l grf szma (db) kirajzolsa (ms) 0 0 1 156 2 156 5 468 10 312 25 625 50 1250 100 3437 200 6875 250 14687 500 25937 1000 40156 2N l grf kirajzolsa (ms) 0 312 625 468 2968 6781 22813 35968 41687 76875 155468 5N el grf kirajzolsa (ms) 0 937 1718 5156 15312 30625 38843 43750 101250 223281

56

A teszt eredmnyei alapjn meg lehet jsolni, hogy egy tlag 200 fs vllalat esetben, ha minden alkalmazott tlagban 5 emberrel tartja gyakran a kapcsolatot, akkor a cg teljes kapcsolati hljnak kirajzolsa krlbell 3 msodpercet vesz ignybe a tesztkonfigurcin.

7.2.3. Elemzs hlzati rtkelse


A megvalstott WCF Web Service-en kldhet zenetek maximlis mrett a WCF alaprtelmezsben 65KB-ban hatrozza meg, teht az a kliens s a szerver kztti 1 kommunikci fels korltja. Ebbl az rtkekbl kiszmolhat az egyes elemzsi mveletek alatt tvihet eredmnyek is. A mrshez a Microsoft Visual Studio WCF Test Client eszkzt hvtam segtsgl, melyben a generlt Web Service hvs s vlasz XML zenetek pontosan vizsglhatak. A 14. tblzat e mrsek eredmnyt tartalmazza. 14. tblzat Egy kommunikcis elemzsi zenet alatt tvihet rsztvevk szma
A Elemzs B res vlasz mrete (byte) 5062 5042 4995 C tlagos eredmnysor mret (byte) 504 422 596 D Egy eredmnysorban kdolt kapcsolat (db) 2 2 1 E Egy zenetben tlagosan tvihet sszes kapcsolat (db) 238 284 101

Kapcsolati hl elemzs Tma-rsztvev elemzs Folyamat felderts

Az A oszlop jelli, hogy milyen elemzs eredmnyrl van sz, a B oszlop az res vlasz mrett tartalmazza, ami nagyjbl megfelel a vlasz XML bortk mretnek. A C oszlop azt jelli, hogy egy tlagos eredmnysornak mekkora a mrete, mg a D oszlop azt mondja meg, hogy egy ilyen eredmnysorban hny rsztvev azonostja vihet t. Az E oszlop ez alapjn azt mondja meg, hogy a teljes 65KB mret zenet esetben maximum hny rsztvev vihet t egyszerre, az XML bortk mrett nem szmolva (~(65000-B)*D/C). Teht az elemzrendszer lekrdezseiben maximum az E oszlop rtkeinek megfelel kapcsolat vihet t, ami a jelenlegi konfigurci technikai korltja az elemzsi zenetkezelsre nzve. Ezzel visszafele kiszmthat, hogy egy olyan lekrdezs esetben melyeknl tlagosan 5 kapcsolat van minden rsztvev kztt, a rendszer csak 238/5, vagyis 47 rsztvevt tud egyszerre megjelenteni, a rsztvev kapcsolat elemzs esetben. A korlt termszetesen nvelhet az alaprtelmezett WCF zenet mretkorlt nvelsvel, de arnyaiban a mrt rtkeknek megfelelen nem fog vltozni.

57

8. sszefoglals
Diplomatervemben a feladatkirsnak megfelelen az zleti intelligencia fogalomkrnek s aktulis megoldsainak ismertetsvel, valamint a vllalati krnyezet s kommunikci lehetsgeinek, problmakrnek elemzsvel relis clokat tztem ki egy vllalati kommunikcit elemz rendszer tervezshez s megvalstshoz. Megalkottam egy ltalnosan hasznlhat fogalmi-modellt s az erre pl elemzsi s brzolsi koncepcikat is vllalati kommunikci elemzshez. Diplomamunkm ugyanakkor a sokfle kommunikcis csatorna figyelembevtelvel nagy s sszetett feladatnak bizonyult, ezrt dolgozatom csak az e-mail gyjts s feldolgozs rszleteinek tervezsre s megvalstsra tr ki. Az elemzsi fzisban ismertetett funkcik alapjn a rendszer tervezsekor a vllalati IT krnyezet sajtossgait s a modern mrnki megoldsokat figyelembe vve felptettem a rendszer architektrjt, megterveztem logikai adatmodelljt s adatbzis smjt, tovbb kidolgoztam az egyes modulok s komponensek rszleteit is. A rendszer implementcija sorn a megtervezett modulokat s komponenseket a szvegbnyszati modulok kivtelvel kifejlesztettem, gy az t f funkcionlis egysget megvalstottam, melynek eredmnyeknt elkszlt a kommunikcit elemz rendszer. A rendszer az ltalnosan hasznlhat kommunikcis modell segtsgvel ms kommunikcis csatornra pl, betlt alrendszerek bekapcsolst is tmogatja, gy a jvben elkszlhet egy a teljes vllalatot lefed kommunikcit elemz rendszer is, ami az e-mailek, azonnali zenetek s faxok mellett kpes lesz akr a telefonbeszlgetsek szvegg alaktsra s elemzsre is. A fejleszts sorn az egyes modulokat, komponenseket s alrendszereket folyamatosan teszteltem, ellenriztem s javtottam, aminek eredmnyeknt a rendszer mkdse vgl helyesnek bizonyult a kitztt funkcionlis clok megvalstsval. Az rtkels sorn a rendelkezsemre ll konfigurcin elvgzett mrsek alapjn ismertettem az email betlt alrendszernek teljestmnyt s annak fokozsnak lehetsgeit, valamint a klienssel vgezhet elemzsek s brzolsok teljestmnyt s technikai korltait, ugyanakkor rmutattam ezek kikszblsnek lehetsgeire is. Szndkaim szerint az elkszlt kommunikci elemz rendszer jvbeli tovbbfejlesztsvel s az e mail mellett tovbbi kommunikcis-csatornkra elksztett zenetgyjt komponenseivel a vllalatok szmra hasznos s teljeskr elemz rendszerr vlik

58

A fggelk Elemzs s Tervezs


A1. MIME ftpusok
Az IETF ltal kidolgozott MIME szabvnyok tartalmi elemeinl hasznlatos nyolc MIME ftpus s rvid magyarzataik pldkkal illusztrlva. A1. tblzat MIME ftpusok s magyarzataik nhny gyakori pldval MIME Ftpus text Lers s nhny gyakori altpus Szveges tartalom pl: text/plain: Sima szveg text/richtext: RichText formtum szveg text/html: HTML tartalom text/xml: XML llomny text/csv: Karakterrel tagolt tblzat Kpi tartalom - pl.: text/png: Portable Network Graphics kp text/jpeg: JPEG kp Hang tartalom pl.: audio/mpeg: MP3 hangfjl audio/x-wav: WAV llomny Video tartalom pl.: video/mpeg: MPEG video video/x-msvideo: AVI video Specilis alkalmazs vagy llomny pl.: application/octet-stream: Binris alkalmazs pl: exe, class application/pdf: PDF dokumentum application/vnd.ms-excel: Microsoft Excel tblzat application/msword: Microsoft Word dokumentum sszetett zenetszerkezet jell ftpus pl.: multipart/mixed: Tbb tartalmi elemet magba foglal tartalmi elem multipart/alternative: Tbbfle mdon eltrolt tartalom jelolje Klnbz modellek jellje pl: model/vrml: Virtual Reality Modelling Language felr fjlja zenetkezelsi informcik jellsre szolgl pl: delivery-status: kzbestsi jelentst hordoz tartalom

image

audio

video

application

multipart

model message

59

A2. Logikai adatmodell attribtumai s kulcsai


A fogalmi modell jellemzi alapjn a logikai modell egyedeihez az albbi vals attribtumokat rendeltem. Az egyedi azonostkat alhzssal jelltem. A2. tblzat Logikai adatmodell egyedei, kulcsai s attribtumai zenet zenet egyedi azonostja zenet teljes szvege Csatolmny Csatolmny egyedi azonostja Csatolmny tartalma Csatolmny tpusa Csatolmny fjlneve Kulcssz Egyedi Kulcssz Szl Szl egyedi azonostja Szl megnevezse Cm Egyedi cm azonostja Kommunikcis csatorna Kzbests Kzbests egyedi azonostja Kommunikcis csatorna Kzbests mdja Klds ideje Fogads ideje Rsztvev Rsztvev egyedi azonostja Megjelensi nv Sttusza (Azonostatlan /Aktv /Trlt) Szemly ISA Rsztvev Vllalati trzsszma Alaprtelmezett csoportja

Csoport ISA Rsztvev Tma Egyedi Tma

A szemly s csoport egyedeknl itt jegyzend meg, hogy azok a Rsztvev egyed altpusai, ezrt ISA kapcsolattal rklik a rsztvev egyed attribtumait. A csoport egyedeinl azrt nem jelltem attribtumokat, mivel a rsztvev attribtumai pontosan lefedik ezeket.

60

A3. caEmailBufferParser projekt implementcija

A1. bra Az e-mail pufferel modul (caEmailBufferParser) UML osztlydiagramja A SimpleMail osztly vgzi a getAllContent() fggvny segtsgvel a levl teljes tartalmi rszeinek, vagyis a trgynak, a levl szvegnek s a csatolmnyok szveges reprezentnsainak sszefzst is egy string mezbe. Egy arra megfelel logika a kivonatolsi szablyok alapjn, szvegbnyszati mdszerekkel a teljes tartalombl kiemeli annak kulcsszavait s meghatrozza. A megvalstott rendszerben jelenleg csak a sima szveges tartalmak kinyerse s sszefzse lett kifejlesztve, a PDF, DOC s ms szveges fjlok tartalmnak dekdolsa nincs megoldva.

A levlben szerepl szemlyek beazonostst a SelectOrInsertParticipantAddress() eljrs vgzi az


e-mailcm rsztvev prostsok lekrdezsvel. Amennyiben egy adott szemly nem azonosthat email cme alapjn, a rendszer ismeretlen rsztvevknt rgzti, melynek ksbbi feloldst a rendszer adminisztrtorra bzza. A feldolgozs utn a felptett zenetpldny trolst a SimpleMail osztlybl szrmaz SimpleMaiDatabaseObject vgzi gy, hogy az zenetek MessageID ja alapjn ha van neki megkeresi az elemzsi adatbzisban lv levl szlbeli elzmnyt s ezek alapjn kiszmolja a vlaszidket. Egy zenet annyi pldnyban kerl bele a Kzbests tblba, ahny From-To, From-CC s From-Bcc pr kpezhet belle. Az adatbzis mveleteket az Oracle Database 11g JDBC Driver csomagot felhasznlva PreparedStatement osztlyokon keresztl hajtom vgre.

61

A4. Kzs rendszerknyvr

62

A2. bra - Kzs rendszerknyvtr fontosabb osztlyai s enumercii

A5. Elemzsi eredmnyosztlyok

A3. bra Elemzsi eredmnyosztlyok A hrom megvalstott eredmnyosztly az eredmnyhalmaz 1-1 sort prezentljk, a teljes halmazt .NET generikus lista trolja. Ezek az osztlyok az elemzs eredmnynek szempontjbl csak a legfontosabb adatokat tartalmazzk a minimlis hlzati adatforgalom rdekben.

63

B fggelk A rendszer hasznlata


E fggelk tartalmazza a diplomatervhez csatolt adathordozn tallhat tartalmak ismertetst s a megvalstott kommunikcit elemz rendszer fontosabb technikai rszleteit, melyek szksgesek a rendszer zembelltshoz, futtatshoz s karbantartshoz.

Adathordoz tartalma
A csatolt adathordoz tartalmazza e dokumentum elektronikus vltozatt, valamint az albbi elemeket

Binaries mappa
E mappa tartalmazza a lefordtott kliens (caClient), szerver (caServer) s az e-mail betlt alrendszer komponenseinek binrisait (caEmailAgents).

Docs mappa
E dolgozathoz kszlt brk, tblzatok s egyb dokumentumok szerkeszthet vltozatai

References mappa
Az elemzrendszer megvalstshoz felhasznlt kls komponensek disztribcii.

Screenshots mappa
A rendszer futsrl kszlt kpernykpeket tartalmaz mappa

Scripts mappa
Ez a mappa tartalmazza az elemz adatbzis smjt, a smt rt s teszt adatokkal feltlt SQL fjlokat, valamint a szerver komponens WCF szolgltatst engedlyez netsh shell scriptet is.

Sources mappa
A megvalstott rendszer Java s .NET forrskdjt tartalmaz mappa.

E-mail betlt alrendszer


zenetek pufferelse - caEmailBufferer
szksges krnyezet s komponens: JRE 6 update 20 OJDBC 6

futtats: java -jar caEmailBufferer.jar parancssori paramterek: - property <PROPERTY FJL> Belltsokat tartalmaz fjl betltse alaprtelmezsben caEmailBufferer.settings verbose Beszdes zemmd bekapcsolsa, fleg log fjlok generlshoz delete_buffered Sikeresen pufferelt zenetek trlse a forrsmappbl

64

zenetek feldolgozsa caEmailBufferParser


szksges krnyezet s komponens: JRE 6 update 20 OJDBC 6 JavaMail API 1.4

futtats: java -jar caEmailBufferParser.jar parancssori paramterek: - property <PROPERTY FJL> Belltsokat tartalmaz fjl betltse alaprtelmezsben caEmailBufferParser.settings verbose Beszdes zemmd bekapcsolsa, fleg log fjlok generlshoz

Elemzs kiszolgl
Az adatbzis sma Oracle adatbzis al trtn teleptse s a WCF service engedlyezse utn az elemzs kiszolgl a caServiceHost.exe konzolalkalmazssal indthat. Indts utn a konzolon megjelenik, hogy a kliensek milyen url-en csatlakozhatnak hozz. A szerver szolgltatsait Web Service-en keresztl ltja el, melynek WSDL je lekrdezhet futs kzben a http://localhost:8511/caService?wsdl url-rl.

Kliens alkalmazs
A kliens alkalmazs futtathat ClickOnce teleptssel vagy telepts nlkl is. Amennyiben a felhasznl azonban az alkalmazs teleptse mellett dnt, gy indtskor a szoftver ellenrzi, hogy van -e frissebb verzija s amennyiben tall, felajnlja az automatikus frisstst. A kliensek a caClient.exe alkalmazssal indthatk, melyek ezutn a megjelen kapcsolatkezelsi felleten csatlakozhatnak az elemzs kiszolglra.

65

C fggelk Kpernykpek
C1. bra Kapcsolati hl elemzs eredmnye szemly nzet, irnyts nlkli md

Adorjn R

A kpernykpen egy kapcsolati hl elemzs eredmnye lthat, melyben a rsztvevket konkrt szemlyekknt brzoltuk, a kapcsolatok irnytst pedig kikapcsoltuk. C2. bra Kapcsolati hl elemzs eredmnye csoport nzet, irnytott md

66

A C2 bra a korbbi elemzssel megegyez eredmnyt mutatja csoport nzetben, irnytott kapcsolati lekkel. A kliens oldalon a gyorsttrazott csoporttagsgok ismeretben a program a szemlyeket tagsgi adataik szerint csoportostotta. C3. bra A rendszer ltal regisztrlt ismeretlen rsztvevk listja

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

... ... ... ... ...


... ... ... ... ... ...

A C3 bra szemllteti, hogy ha a rendszer egy e-mailhez nem tallja az adott rsztvevt, gy ismeretlenknt rgzti Registered sttusszal, melyet ksbb az adminisztrtor lecserlhet vagy sszefslhet vals felhasznli rekordokkal, a C4 brn lthat rsztvev cserl eszkz segtsgvel. C4. bra Rsztvev cserl eszkz kpernykpe

67

C5. bra Murti kos rsztvev rekordja s cmei

A C5 bra azt szemllteti, hogy egy rsztvevnek akr tbb cme is lehet a rendszerben, tbbfle csatornhoz is. C6. bra Murti Csald nev csoport tagjai s csoportjai

A C6 brn lthat, hogy a rendszerben csoportok is lehetnek tagjai ms csoportoknak.

68

Irodalomjegyzk
1. Ensor, Dave s Stevenson, Ian. - Oracle-tervezs Budapest: Kossuth Kiad, 2000. 2. Laudon, Kenneth C. s Laudon, Jane P. Management Information Systems: Managing the Digital Firm (9th Edition). Prentice Hall, 2005. 3. Power, Daniel J. - A Brief History of Decision Support Systems DSSResource.com. [Online] 2007. mrcius 10. [Hivatkozva: 2010. mrcius 27.] http://dssresources.com/history/dsshistory.html 4. Raffai, Mria - Informcirendszerek fejlesztse s menedzselse Budapest: Novadat Kiad, 2003. 5. Kvri, Attila BI Projekt: Adattrhz s zleti intelligencia zleti intelligencia (Business Intelligence, BI) fogalma [Online] 2007. oktber 27. [Hivatkozva: 2010. mrcius 20.] http://www.biprojekt.hu/Uzleti-intelligencia-Business-Intelligence-BI.htm 6. Kkai, Bln - zleti Intelligencia az Informatikban Dunajvros: Fiskolai Kiad, 2005. 7. Luhn, H.P. - A Business Intelligence System. IBM Journal. 1958. oktber, old.: 314-319. 8. Dresner, Howard - Business Intelligence at age 17. China Martens, Computerworld, 2006. oktber 23. 9. Anandarajan, Murugan, Anandarajan, Asokan s Srinivasan, Cadambi A. Business Intelligence techniques: a perspective from accounting and finance New York: Springer, 2004. 10. Newing, Rod. - Higher Intelligence Racounter on Business Intelligence. 2009. december 1, old.: 6. 11. Farrel, Vicky. HP Business Intelligence Solutions BI Trends and New Generation of Business Intelligence [Online] 2010. 03 19. [Hivatkozva: 2010. 03 29.] http://www.communities.hp.com/online/blogs/business-intelligenceblog/archive/2010/03/19/bi-trends-and-the-new-generation-of-business-intelligence.aspx. 12. Gartner - Gartner Identifies the Top 10 Strategic Technologies for 2009 [Online] 2008. oktber 14. [Hivatkozva: 2010. mrcius 21.] http://www.gartner.com/it/page.jsp?id=777212

69

13. Vesset, Dan s McDonough, Brian - Worldwide Business Intelligence Tools 2008 Vendor Shares IDC paper, 2009. 14. Oracle Magyarorszg - Az Oracle Business Intelligence megoldsai [Online] 2010. [Hivatkozva: 2010. 03 29.] http://www.oracle.com/global/hu/business_intelligence/index.html 15. Couper, Ben - Racounter on Business Intelligence, Introduction 2009. december 1, old.: 1. 16. Bakacsi, Gyula. Szervezeti magatarts s vezets Budapest: KJK-KERSZV Jogi s zleti Kiad, 2003. 17. IETF, Network Working Group - Multipurpose Internet Mail Extensions (MIME) Part I-V. IETF, 1996. RFC 2045-2049. 18. IETF, Network Working Group - Internet Message Format The Internet Society, 2001. RFC-2822. 19. Sun Microsystems, Inc - JavaMail Guide for Service Providers Palo Alto: Sun Microsystems, Inc, 1998. 20. Oracle Inc. - Oracle Data Provider for .NET Developer's Guide 11g Release 1 Oracle Inc, 2009. 21. Bgel, Gyrgy - IQSqs Blog Intelligencia [Online] 2006. szeptember 27. [Hivatkozva: 2010. mrcius 18.] http://www.iqsys.hu/web/guest/blog/-/blogs/28816/maximized 22. Ward, J. - Principles of Information Systems Management New York: Routledge, 1995. 23. Ditter, Harald - The Value of Business Intelligence Bucharest: Ensight Management Consulting, 2009. 24. Laudon, Kenneth C. s Laudon, Jane Price Management Information System: A Contemporary Perspective New York: Macmillan Publishing, 1988. 25. Ackoff, Russel L. s Emery, Fred. On purposeful systems: an interdisciplinary analysis of individual and Social Behavior as a System of Purposeful Events New Jersey: Aldine, 2006. 26. Gajdos, Sndor - Adatbzisok Budapest: Megyetemi Kiad, 2006. 27. Hewlett-Packard. Top 10 Trends in Business Intelligence for 2010 28. Mager, Johannes. Deep Email Miner Application Sydney: University of Technology, Sydney, 2006

70

You might also like