मोठा डेटा कोण गोळा करतो आणि का?

2019 च्या शरद ऋतूत, ऍपल कार्ड सेवेसह एक घोटाळा उघड झाला: नोंदणी करताना, त्याने पुरुष आणि महिलांसाठी भिन्न क्रेडिट मर्यादा जारी केल्या. स्टीव्ह वोझ्नियाक देखील नशीबवान होते:

एक वर्षापूर्वी, हे उघड झाले होते की नेटफ्लिक्स प्लॅटफॉर्म वापरकर्त्यांना त्यांचे लिंग, वय आणि राष्ट्रीयत्वानुसार भिन्न पोस्टर्स आणि टीझर्स दाखवते. यासाठी सेवेवर वर्णद्वेषाचा आरोप करण्यात आला होता.

शेवटी, फेसबुकद्वारे त्याच्या वापरकर्त्यांचा डेटा गोळा करणे, विकणे आणि फेरफार केल्याबद्दल मार्क झुकरबर्गला नियमितपणे फटकारले जाते. वर्षानुवर्षे, त्याच्यावर अमेरिकन निवडणुकांदरम्यान फेरफार करण्याचा, रशियन विशेष सेवांना मदत करणे, द्वेष आणि कट्टरपंथी विचारांना भडकावणे, अयोग्य जाहिराती, वापरकर्त्यांचा डेटा लीक करणे, पीडोफाइल्सच्या विरोधात तपासात अडथळा आणणे असे आरोप केले गेले आणि प्रयत्न केले गेले.

zuck द्वारे फेसबुक पोस्ट

त्याच वेळी, पॉर्नहब ऑनलाइन सेवा दरवर्षी विविध राष्ट्रीयत्व, लिंग आणि वयाचे लोक कोणत्या प्रकारचे पॉर्न शोधत आहेत याचे अहवाल प्रकाशित करते. आणि काही कारणास्तव हे कोणालाही त्रास देत नाही. जरी या सर्व कथा समान आहेत: त्या प्रत्येकामध्ये आम्ही मोठ्या डेटासह व्यवहार करीत आहोत, ज्याला XNUMX व्या शतकात "नवीन तेल" म्हटले जाते.

मोठा डेटा म्हणजे काय

बिग डेटा – ते बिग डेटा (इंज. बिग डेटा) किंवा मेटाडेटा देखील आहेत – हा डेटाचा एक अॅरे आहे जो नियमितपणे आणि मोठ्या प्रमाणात येतो. ते संकलित, प्रक्रिया आणि विश्लेषण केले जातात, परिणामी स्पष्ट मॉडेल आणि नमुने तयार होतात.

एक उल्लेखनीय उदाहरण म्हणजे लार्ज हॅड्रॉन कोलायडरचा डेटा, जो सतत आणि मोठ्या प्रमाणात येतो. त्यांच्या मदतीने शास्त्रज्ञ अनेक समस्या सोडवतात.

परंतु वेबवरील मोठा डेटा केवळ वैज्ञानिक संशोधनासाठी आकडेवारी नाही. विविध गट आणि राष्ट्रीयतेचे वापरकर्ते कसे वागतात, ते कशाकडे लक्ष देतात आणि ते सामग्रीशी कसा संवाद साधतात याचा मागोवा घेण्यासाठी त्यांचा वापर केला जाऊ शकतो. काहीवेळा, यासाठी, डेटा एका स्त्रोताकडून नाही तर अनेकांकडून गोळा केला जातो, विशिष्ट नमुन्यांची तुलना आणि ओळख करून.

नेटवर्कवर मोठा डेटा किती महत्त्वाचा आहे याबद्दल, जेव्हा ते खरोखर भरपूर होते तेव्हा ते बोलू लागले. 2020 च्या सुरूवातीस, जगात 4,5 अब्ज इंटरनेट वापरकर्ते होते, त्यापैकी 3,8 अब्ज सोशल नेटवर्क्समध्ये नोंदणीकृत होते.

ज्यांना बिग डेटामध्ये प्रवेश आहे

सर्वेक्षणांनुसार, आमच्या अर्ध्याहून अधिक देशांचा असा विश्वास आहे की नेटवर्कवरील त्यांचा डेटा तृतीय पक्षांद्वारे वापरला जातो. त्याच वेळी, बरेच लोक सोशल नेटवर्क्स आणि अॅप्लिकेशन्सवर वैयक्तिक माहिती, फोटो आणि फोन नंबर देखील पोस्ट करतात.

मोठा डेटा कोण गोळा करतो आणि का?
मोठा डेटा कोण गोळा करतो आणि का?
मोठा डेटा कोण गोळा करतो आणि का?
मोठा डेटा कोण गोळा करतो आणि का?

हे येथे स्पष्ट करणे आवश्यक आहे: पहिली व्यक्ती स्वतः वापरकर्ता आहे, जे त्याचा डेटा कोणत्याही संसाधनावर किंवा अनुप्रयोगावर ठेवते. त्याच वेळी, तो या डेटाच्या प्रक्रियेस सहमत आहे (करारात एक टिक ठेवतो). दुसरा पक्ष - म्हणजे, संसाधनाचे मालक. तृतीय पक्ष म्हणजे ज्यांना संसाधनाचे मालक वापरकर्ता डेटा हस्तांतरित किंवा विकू शकतात. बर्याचदा हे वापरकर्ता करारामध्ये लिहिलेले असते, परंतु नेहमीच नाही.

तृतीय पक्ष म्हणजे सरकारी एजन्सी, हॅकर्स किंवा कंपन्या ज्या व्यावसायिक हेतूंसाठी डेटा विकत घेतात. न्यायालय किंवा उच्च अधिकार्‍यांच्या निर्णयाने पूर्वीचा डेटा मिळवू शकतो. हॅकर्स, अर्थातच, कोणत्याही परवानग्या वापरत नाहीत - ते फक्त सर्व्हरवर संग्रहित डेटाबेस हॅक करतात. कंपन्या (कायद्यानुसार) केवळ तुम्ही त्यांना परवानगी दिली असेल तरच - कराराच्या अंतर्गत बॉक्स चेक करून डेटामध्ये प्रवेश करू शकतात. अन्यथा, ते बेकायदेशीर आहे.

कंपन्या बिग डेटा का वापरतात?

व्यावसायिक क्षेत्रातील मोठा डेटा अनेक दशकांपासून वापरला जात आहे, तो आता इतका तीव्र नव्हता. हे, उदाहरणार्थ, पाळत ठेवलेल्या कॅमेर्‍यांचे रेकॉर्ड, GPS नॅव्हिगेटरचे डेटा किंवा ऑनलाइन पेमेंट. आता, सोशल नेटवर्क्स, ऑनलाइन सेवा आणि अनुप्रयोगांच्या विकासासह, हे सर्व कनेक्ट केले जाऊ शकते आणि सर्वात संपूर्ण चित्र मिळवू शकते: संभाव्य ग्राहक कोठे राहतात, त्यांना काय पहायला आवडते, ते सुट्टीवर कुठे जातात आणि त्यांच्याकडे कोणत्या ब्रँडची कार आहे.

वरील उदाहरणांवरून, हे स्पष्ट आहे की मोठ्या डेटाच्या मदतीने, कंपन्या, सर्व प्रथम, जाहिरातींना लक्ष्य करू इच्छितात. म्हणजेच, उत्पादने, सेवा किंवा वैयक्तिक पर्याय केवळ योग्य प्रेक्षकांना ऑफर करणे आणि विशिष्ट वापरकर्त्यासाठी उत्पादन सानुकूलित करणे. याव्यतिरिक्त, Facebook आणि इतर मोठ्या प्लॅटफॉर्मवर जाहिरात करणे अधिकाधिक महाग होत चालले आहे आणि ते एकापाठोपाठ प्रत्येकाला दाखवणे अजिबात फायदेशीर नाही.

विमा कंपन्या, खाजगी दवाखाने आणि नियोक्त्यांद्वारे मुक्त स्त्रोतांकडील संभाव्य ग्राहकांबद्दलची माहिती सक्रियपणे वापरली जाते. उदाहरणार्थ, पूर्वीचे, जर तुम्ही काही विशिष्ट आजार किंवा औषधांबद्दल माहिती शोधत आहात असे त्यांना दिसले तर ते विम्याच्या अटी बदलू शकतात आणि तुम्हाला संघर्ष आणि असामाजिक वर्तनाची शक्यता आहे की नाही हे नियोक्ते मूल्यांकन करू शकतात.

परंतु आणखी एक महत्त्वाचे कार्य आहे जे अलिकडच्या वर्षांत संघर्ष करत आहे: सर्वात सॉल्व्हेंट प्रेक्षकांच्या जवळ जाण्यासाठी. हे करणे इतके सोपे नाही, जरी पेमेंट सेवा आणि एकाच OFD (फिस्कल डेटा ऑपरेटर) द्वारे इलेक्ट्रॉनिक चेकद्वारे कार्य लक्षणीयरीत्या सुलभ केले जाते. शक्य तितक्या जवळ जाण्यासाठी, कंपन्या अगदी लहानपणापासून संभाव्य ग्राहकांचा मागोवा घेण्याचा आणि "पोषण" करण्याचा प्रयत्न करतात.: ऑनलाइन गेम, परस्पर खेळणी आणि शैक्षणिक सेवांद्वारे.

हे कस काम करत?

एकाच वेळी अनेक सेवांच्या मालकीच्या जागतिक कॉर्पोरेशनकडून डेटा संकलनाच्या सर्वात मोठ्या संधी आहेत. फेसबुकचे आता २.५ अब्जाहून अधिक सक्रिय वापरकर्ते आहेत. त्याच वेळी, कंपनीकडे इतर सेवा देखील आहेत: Instagram - 2,5 अब्ज पेक्षा जास्त, WhatsApp - 1 अब्ज पेक्षा जास्त आणि इतर.

परंतु Google चा आणखी प्रभाव आहे: Gmail जगातील 1,5 अब्ज लोक वापरतात, आणखी 2,5 अब्ज Android मोबाइल OS द्वारे, 2 अब्जांपेक्षा जास्त YouTube वापरतात. आणि ते Google शोध आणि Google नकाशे अॅप्स, Google Play Store आणि Chrome ब्राउझरची गणना करत नाही. तुमची ऑनलाइन बँक बांधणे बाकी आहे - आणि Google तुमच्याबद्दल अक्षरशः सर्वकाही जाणून घेण्यास सक्षम असेल. तसे, यांडेक्स या बाबतीत आधीच एक पाऊल पुढे आहे, परंतु ते केवळ रशियन-भाषिक प्रेक्षकांना कव्हर करते.



👍 सर्वप्रथम, आम्ही सोशल नेटवर्क्सवर काय पोस्ट करतो आणि लाईक करतो त्यामध्ये कंपन्यांना स्वारस्य असते. उदाहरणार्थ, तुम्ही विवाहित आहात आणि तुम्ही इन्स्टाग्राम किंवा टिंडरवर मुलींना सक्रियपणे पसंत करत आहात असे बँकेने पाहिल्यास, तुम्ही ग्राहक कर्ज मंजूर करण्याची अधिक शक्यता आहे. आणि कुटुंबावरील गहाण निघून गेले.

तुम्ही कोणत्या जाहिरातींवर क्लिक करता, किती वेळा आणि काय परिणाम होतो हे देखील महत्त्वाचे आहे.

(म्हणजे पुढील पायरी म्हणजे खाजगी संदेश: त्यात बरीच माहिती असते. VKontakte, Facebook, WhatsApp आणि इतर इन्स्टंट मेसेंजर्सवर मेसेज लीक झाले होते. त्यांच्या मते, संदेश पाठवताना भौगोलिक स्थान ट्रॅक करणे सोपे आहे. तुमच्या लक्षात आले असेल: जेव्हा तुम्ही एखादी गोष्ट विकत घेण्याबद्दल किंवा एखाद्याशी पिझ्झा ऑर्डर करण्याबद्दल चर्चा करता तेव्हा संबंधित जाहिरात फीडमध्ये लगेच दिसून येते.

🚕 वितरण आणि टॅक्सी सेवांद्वारे बिग डेटा सक्रियपणे वापरला जातो आणि "लीक" केला जातो. तुम्ही कुठे राहता आणि काम करता, तुम्हाला काय आवडते, तुमचे अंदाजे उत्पन्न काय आहे हे त्यांना माहीत असते. उबेर, उदाहरणार्थ, जर तुम्ही बारमधून घरी जात असाल आणि स्पष्टपणे ओव्हरडोन करत असाल तर किंमत जास्त दाखवते. आणि जेव्हा तुमच्या फोनवर इतर एग्रीगेटर्सचा समूह असतो, त्याउलट, ते स्वस्त ऑफर करतील.

(म्हणजे अशा सेवा आहेत ज्या शक्य तितकी माहिती गोळा करण्यासाठी फोटो आणि व्हिडिओ वापरतात. उदाहरणार्थ, संगणक दृष्टी लायब्ररी – Google कडे एक आहे. तुम्ही कोणता आकार किंवा उंची आहात, तुम्ही कोणत्या ब्रँडचे कपडे घालता, तुम्ही कोणती कार चालवता, तुमच्याकडे लहान मुले किंवा पाळीव प्राणी आहेत हे पाहण्यासाठी ते तुम्हाला आणि तुमच्या सभोवतालचे स्कॅन करतात.

(म्हणजे जे बँकांना त्यांच्या मेलिंगसाठी एसएमएस गेटवे देतात ते कार्डवरील तुमच्या खरेदीचा मागोवा घेऊ शकतात - शेवटचे 4 अंक आणि फोन नंबर जाणून घेणे - आणि नंतर हा डेटा दुसर्‍याला विकणे. म्हणून भेट म्हणून सवलत आणि पिझ्झासह हे सर्व स्पॅम.

🤷️️ शेवटी, आम्ही स्वतः आमचा डेटा डाव्या सेवा आणि अनुप्रयोगांवर लीक करतो. गेटकॉन्टॅक्टच्या आसपासचा हा प्रचार लक्षात ठेवा, जेव्हा प्रत्येकजण इतरांनी कसा लिहिला आहे हे शोधण्यासाठी त्यांचा फोन नंबर भरण्यात आनंद झाला. आणि आता त्यांचा करार शोधा आणि तुमच्या डेटाच्या हस्तांतरणाविषयी काय म्हणते ते वाचा (स्पॉयलर: मालक त्यांना त्यांच्या विवेकबुद्धीनुसार तृतीय पक्षांकडे हस्तांतरित करू शकतात):

मोठा डेटा कोण गोळा करतो आणि का?

कॉर्पोरेशन यशस्वीरित्या वापरकर्त्याचा डेटा संकलित करू शकतात आणि वर्षानुवर्षे विकू शकतात, जोपर्यंत तो खटला येईपर्यंत - त्याच Facebook च्या बाबतीत घडले. आणि मग निर्णायक भूमिका कंपनीने जीडीपीआरच्या उल्लंघनाद्वारे खेळली - EU मधील एक कायदा जो डेटाच्या वापरास अमेरिकन कायद्यापेक्षा अधिक कठोरपणे प्रतिबंधित करतो. आणखी एक अलीकडील उदाहरण म्हणजे अवास्ट अँटीव्हायरस घोटाळा: कंपनीच्या उपकंपनी सेवांपैकी एकाने 100 ते 400 दशलक्ष वापरकर्त्यांकडून डेटा गोळा केला आणि विकला.

पण या सगळ्याचा आपल्यासाठी काही फायदा आहे का?

मोठा डेटा आपल्या सर्वांना किती मदत करतो?

होय, एक उज्ज्वल बाजू देखील आहे.

बिग डेटा गुन्हेगारांना पकडण्यात आणि दहशतवादी हल्ले रोखण्यास, हरवलेली मुले शोधण्यात आणि धोक्यापासून त्यांचे संरक्षण करण्यात मदत करतो.

त्यांच्या मदतीने आम्ही आम्हाला बँकांकडून छान ऑफर आणि वैयक्तिक सूट मिळतात. त्यांचे आम्ही आभार मानतो आम्ही अनेक सेवा आणि सामाजिक नेटवर्कसाठी पैसे देत नाही जे केवळ जाहिरातींवर कमावतात. अन्यथा, एकट्या इंस्टाग्रामवर महिन्याला अनेक हजार डॉलर्स खर्च होतील.

एकट्या फेसबुकचे २.४ अब्ज सक्रिय वापरकर्ते आहेत. त्याच वेळी, 2,4 साठी त्यांचा नफा $2019 अब्ज इतका होता. असे दिसून आले की कंपनी जाहिरातीद्वारे प्रत्येक वापरकर्त्याकडून वर्षाला $18,5 पर्यंत कमावते.

शेवटी, काहीवेळा ते फक्त सोयीचे असते: जेव्हा सेवांना आधीच माहित असते की तुम्ही कुठे आहात आणि तुम्हाला काय हवे आहे आणि तुम्हाला स्वतःला आवश्यक असलेली माहिती शोधण्याची गरज नाही.

बिग डेटाच्या वापरासाठी आणखी एक आशादायक क्षेत्र म्हणजे शिक्षण.

व्हर्जिनियामधील एका अमेरिकन विद्यापीठात, तथाकथित जोखीम गटातील विद्यार्थ्यांवरील डेटा गोळा करण्यासाठी अभ्यास केला गेला. हे असे लोक आहेत जे कमी अभ्यास करतात, वर्ग चुकवतात आणि बाहेर पडतात. वस्तुस्थिती अशी आहे की राज्यांमध्ये दरवर्षी सुमारे 400 लोक कापले जातात. हे दोन्ही विद्यापीठांसाठी वाईट आहे, ज्यांनी त्यांचे रेटिंग कमी केले आहे आणि त्यांच्या निधीत कपात केली आहे आणि स्वतः विद्यार्थ्यांसाठी: बरेच जण शिक्षणासाठी कर्ज घेतात, ज्याची कपात केल्यानंतरही परतफेड करावी लागेल. गमावलेला वेळ आणि करिअरच्या शक्यतांचा उल्लेख नाही. मोठ्या डेटाच्या सहाय्याने, वेळेत मागे पडलेल्यांना ओळखणे आणि त्यांना शिक्षक, अतिरिक्त वर्ग आणि इतर लक्ष्यित मदत देणे शक्य आहे.

हे, तसे, शाळांसाठी देखील योग्य आहे: नंतर सिस्टम शिक्षक आणि पालकांना सूचित करेल - ते म्हणतात, मुलाला समस्या आहे, चला त्याला एकत्र मदत करूया. कोणती पाठ्यपुस्तके चांगली काम करतात आणि कोणते शिक्षक सामग्री अधिक सहजतेने स्पष्ट करतात हे समजून घेण्यासाठी बिग डेटा देखील मदत करेल.

आणखी एक सकारात्मक उदाहरण म्हणजे करिअर प्रोफाइलिंग.: जेव्हा किशोरवयीन मुलांना त्यांच्या भविष्यातील व्यवसायावर निर्णय घेण्यास मदत केली जाते. येथे, मोठा डेटा तुम्हाला पारंपारिक चाचण्या वापरून मिळवता येणार नाही अशी माहिती संकलित करण्याची परवानगी देतो: वापरकर्ता कसा वागतो, तो कशाकडे लक्ष देतो, तो सामग्रीशी कसा संवाद साधतो.

त्याच USA मध्ये, करिअर मार्गदर्शन कार्यक्रम आहे - SC ACCELERATE. हे, इतर गोष्टींबरोबरच, करियर चॉईस GPS तंत्रज्ञान वापरते: ते विद्यार्थ्यांचे स्वरूप, विषयांकडे त्यांचा कल, सामर्थ्य आणि कमकुवतता याबद्दलच्या डेटाचे विश्लेषण करतात. त्यानंतर डेटा किशोरांना त्यांच्यासाठी योग्य महाविद्यालये निवडण्यात मदत करण्यासाठी वापरला जातो.


Yandex.Zen — तंत्रज्ञान, नवकल्पना, अर्थशास्त्र, शिक्षण आणि एकाच चॅनेलमध्ये सामायिकरण वर सदस्यता घ्या आणि आमचे अनुसरण करा.

प्रत्युत्तर द्या