kd Mumbai

बिझनेस इंटेलिजन्स

डेटा वेअरहाऊसमध्ये डेटा आणताना अनेक पायऱ्या ओलांडाव्या लागतात. उदा. डेटा जमवणं (सोर्स), तो एकत्र करणं (डेटा फ्यूजन), नको तो डेटा काढणं (डेटा क्लीन्सिंग), कुठली माहिती कुठे आहे याविषयीची एक डिक्शनरी तयार करणं (मेटाडेटा) आणि त्यानंतर प्रत्यक्ष माहिती ही डेटा वेअरहाऊसमध्ये घालणं (लोड) या त्या पायऱ्या.

कुठल्याही कंपनीमध्ये अनेक डेटाबेसेसमध्ये वेगवेगळ्या तऱ्हेची माहिती ठेवलेली असते. उदा. आपल्या ग्राहकांबद्दलची माहिती, आपल्या सप्लायर्सबद्दलची माहिती, आपल्या कर्मचाऱ्यांबद्दलची, आपल्या उत्पादनांबद्दलची, निर्यातीबद्दलची माहिती वगैरे! या माहितीवरती कुठलंही 'डेटाबेस मॅनेजमेंंट सॉफ्टवेअर (डीबीएमएस)' त्याला प्रश्न विचारल्यानंतर उत्त्तर शोधण्याची सुविधा देत असते. त्यालाच 'क्वेरी सॉफ्टवेअर' असं म्हणतात. उदाहरणार्थ आपल्याकडे आलेल्या ग्राहकांपैकी १८ ते २५, २५ ते ३० आणि ३० ते ४० अशा वयोगटात किती माणसं आहेत? त्यांचं सरासरी उत्पन्न किती? असे प्रश्न विचारल्यास तो क्वेरीचा सॉफ्टवेअर प्रोग्रॅम त्या ग्राहकाच्या डेटाबेसमधून जाऊन प्रत्येक रेकॉर्ड वाचून आपल्या प्रश्नाचं उत्तर जमवत जातो आणि सगळी रेकॉर्डज् वाचल्यानंतर आपल्या प्रश्नाचं उत्तर देतो. अर्थात यासाठी कुठलाही ग्राहक कंपनीकडे (उदा. बॅंकेकडे) आला की त्याला एक प्रश्नपत्रिका (क्वेश्चनेयर) द्यावी लागेल. त्यात त्याचं नाव, पत्ता याबरोबरच त्याचं वय, पगार हेही अर्थात त्याला विचारावं लागेल. याच माहितीच्या जोरावर डेटाबेस क्वेरीचा प्रोग्रॅम आपल्याला उत्तर देतो. पण यात एक लक्षात येईल की आपल्याला जी माहिती हवी आहे त्याविषयीचा प्रश्न आपल्याला या क्वेरीला विचारावा लागतो. स्वत:हून यापलिकडे

हे क्वेरी सॉफ्टवेअर काहीच करत नाही.

पण आपल्याला आपल्याकडल्या सगळ्या माहितीमधल्या दोन गोष्टींमधले संबंध शोधून त्यातला पॅटर्न शोधायचा असेल तेव्हा हे काम 'डेटा मायनिंग' या सॉफ्टवेअरकडे दिलं जातं. मायनिंग म्हणजे खणणं. डेटा मायनिंगमध्ये अक्षरश: माहिती खणून तिचा उपसा पाडून 'त्यातून काही निष्कर्ष मिळतो का?' हे बघितलं जातं. अर्थातच त्यासाठी खूपच मोठ्या प्रमाणावर गणित किंवा संख्याशास्त्र वापरावं लागतं. उदा. पूवीर्ची माहिती तपासून एखाद्या बॅंकेला जर कोणी सांगितलं की, 'तुमच्याकडे असलेल्या ठेवीदारांपैकी २५ ते ३० गटातल्या मंडळींंमधले जे एमबीए झालेले, इन्फोटेकमध्ये काम करणारे, शहरातले, अविवाहित असतील तर ते मोटारगाडीकरता कर्ज घेतील. विवाहित असतील तर घराकरता कर्ज घेतील आणि जे या गटात मोडणार नाहीत ते कर्जच घेणार नाहीत आणि हे होण्याची शक्यता ९० टक्के आहे'. तर? आता हे समजल्यावर ती बॅंक काय करेल? बॅंक अर्थातच (कदाचित मोटार कंपन्यांच्या बरोबर योजना आखून) त्या त्या गिऱ्हाईकांना आपल्या कॉल सेंटर्सच्या तफेर् फोन करून, 'तुम्हाला घरासाठी कर्र्ज हवंय का ?' किंवा 'तुम्हाला मोटारगाडीसाठी कर्ज हवंय का ?' असे प्रश्न विचारून भंंडावून सोडेल. थोडक्यात डेटाबेस क्वेरी ही भूतकाळाकडे बघते, तर डेटा मायनिंंग भविष्यकाळाचा अंदाज वर्तवते.

गंमत अशी की, १९८०च्या दशकानंतर विशेषत: सेवा क्षेत्रात जागतिक स्पर्धा खूपच जीवघेणी झाली. त्यामुळे दोन बॅंकातला किंवा दोन विमानसेवांमधला फरकच गिऱ्हाईकांना कळेनासा झाला. कारण सगळ्या बॅंंकांचे व्याजदर तेच होते आणि विमानसेवेचे दर सर्वसाधारणपणे तेवढेच होते. मग फरक करायचा कसा? हा फरक ग्राहकांना जास्तीत जास्त मदत करण्यानं होईल (कस्टमर सव्हिर्स) असं यावेळी कंपन्यांना वाटायला लागलं. आणि १९९०च्या दशकात 'कस्टमर रिलेशनशिप मॅनेजमेंट (सीआरएम)'चा उदय झाला. यावेळेला 'आपला ग्राहक आपल्याला माहिती पाहिजे' म्हणजेच त्याच्या वयोमानाप्रमाणे, मिळकतीप्रमाणे त्याच्या खरेदी-विक्रीच्या आणि इतर सवयी या कळल्या पाहिजेत आणि त्यानंतर त्याप्रमाणे त्यांना कर्ज उपलब्ध करून दिलं पाहिजे वगैरे गोष्टी सुरू झाल्या. अर्थातच, डेटा मायनिंंगमुळे हे शक्य झाल्यानं त्याचं महत्त्वही याचकाळात वाढलं.

पण कित्येकवेळेला हा डेटा माइन करताना अनेक डेटाबेसेस तपासण्याची गरज असते. यामुळे आपल्या कंपनीतले आतले (उदा. गिऱ्हाईक, सप्लायर्स, उत्पादन..) डेटाबेसेस एकत्र करावे लागतात. याशिवाय कित्येक वेळेला वस्तूंच्या बाजारभावाबद्दल किंवा प्रतिर्स्पध्याबद्दल माहिती किंवा इतर डेटाबेसेस (उदा. फोन नम्बर्स इ.) हे बाहेरून विकत घ्यावे लागतात. ही सगळी माहिती एकत्र गुंफावी लागते. यातूनच डेटा वेअरहाऊसची कल्पना निघाली. फक्त फरक एवढाच की डेटा वेअरहाऊसमध्ये बऱ्याचदा डेटाबेसपेक्षा खूपच जास्त माहिती कोंबलेली असते; डेटाबेसमध्ये सध्या लागणारी माहिती असते तर डेटा वेअरहाऊसमध्ये याशिवाय पूर्ण भूतकाळातलीही! शिवाय दिलेल्या प्रश्नांना उत्त्तरं चटकन मिळावीत किंवा त्या माहितीतले संबंध (पॅर्टन्स) शोधता यावेत म्हणून या डेटा वेअरहाऊसमध्ये माहितीची रचना (प्रत्यक्ष माहिती, त्यातले इंडेक्सेस, किंवा चेन्स इ.) हे वेगळ्या तऱ्हेने मांडावे लागतात. आणि वेग वाढावा म्हणून कित्येक वेळेला वेगवेगळे डेटाबेसेस हे वेगवेगळ्या कम्प्युटर्सवर ठेवून समांतर कम्प्युटिंगचा वापर करावा लागतो. यामध्ये एकाचवेळी सगळ्या कम्प्युटरवरची माहिती एकदम वाचली जाऊ शकते आणि वेळ वाचतो. याऐवजी एकच कम्प्युटर असेल तर माहिती वाचताना ती एकापाठोपाठ वाचावी लागल्यामुळे वेळ खूप लागू शकतो.

डेटा वेअरहाऊसमध्ये डेटा आणताना अनेक पायऱ्या ओलांडाव्या लागतात. उदा. डेटा जमवणं (सोर्स), तो एकत्र करणं (डेटा फ्यूजन), नको तो डेटा काढणं (डेटा क्लीन्सिंग), कुठली माहिती कुठे आहे याविषयीची एक डिक्शनरी तयार करणं (मेटाडेटा) आणि त्यानंतर प्रत्यक्ष माहिती ही डेटा वेअरहाऊसमध्ये घालणं (लोड) या त्या पायऱ्या. एकदा डेटा वेअरहाऊस तयार झालं की त्यानंतर त्याच्यावर आपण पूवीर्सारखी प्रश्नोत्तरं करू शकतोच. याला 'ऑनलाइन अॅनालिटीकल प्रोसेंसिंग (ओलॅप)' असं म्हणतात किंवा या डेटा वेअरहाऊसमधल्या माहितीचा वापर करून त्यांच्यातले संबंध (पॅर्टन्स) डेटा मायनिंंगच्या साहाय्याने शोधून काढून आपण भविष्यवेधही घेऊ शकतो.

डेटा वेअरहाऊसिंग, डेटा मायनिंग आणि ओलॅप वगैरे सगळ्या प्रकाराला 'बिझनेस इंटेलिजन्स' असं म्हणतात. या तंत्राचा वापर अर्थातच उद्योगात कस्टमर सव्हिर्स वाढवण्यासाठी आणि विक्री वाढवण्यासाठी होतोच पण याशिवाय तो विज्ञानातसुध्दा जनुकांची माहिती, रेणूंची रचना, जागतिक हवामानातील बदल, आकाशगंगेविषयी माहिती यांच्याही विश्लेषणासाठी होतो हे खूपच महत्त्वाचं !

कोणत्याही टिप्पण्‍या नाहीत: