डेटा एक संवेदनशील विषय है, और एक डेटा वैज्ञानिक के रूप में आप स्वाभाविक रूप से इसके बहुत करीब होंगे। यहां कुछ नियम दिए गए हैं जिनका आपको हमेशा पालन करना चाहिए।
डेटा अत्यंत मूल्यवान है, और इसका उपयोग करना आज अधिकांश संगठनों के लिए आसानी से सर्वोत्तम प्रथाओं में से एक है। लेकिन इसके बारे में उद्योग के मानकों को जानना डेटा वैज्ञानिकों के लिए आवश्यक है कि वे डेटा के साथ गलती न करें क्योंकि लोग इसके मूल्य के बारे में अधिक सीखते हैं।
जैसे, डेटा वैज्ञानिकों को सुरक्षित और नैतिक प्रथाओं को अपनाना चाहिए और मानकीकृत लोगों को अपनाना चाहिए। डेटा केवल कितना मूल्यवान है, इस पर विचार करने के बजाय, किसी भी उद्देश्य के लिए डेटा प्राप्त करने और संसाधित करने के तरीकों पर सवाल उठाना बुद्धिमानी है। इस प्रकार, यहां नौ आचार संहिताएं हैं जिनका प्रत्येक डेटा वैज्ञानिक को पालन करना चाहिए।
1. विनियमों का निरीक्षण करें
डेटा वैज्ञानिकों को कुछ नौकरियों पर लागू होने वाले डेटा सुरक्षा नियमों की जानकारी होनी चाहिए। अन्यथा, आप अनजाने में कानून तोड़ सकते हैं और खुद को और दूसरों को खतरे में डाल सकते हैं। इसलिए, नैतिक कार्य सुनिश्चित करने और अनपेक्षित नुकसान को रोकने के लिए यह ज्ञान महत्वपूर्ण है।
इसलिए, किसी भी गतिविधि में शामिल होने से पहले प्रासंगिक कानूनों की जांच करें। इसके अलावा, नियमों का पालन करने के लिए केवल नियमों का पालन न करें; साथ ही उन्हें गहराई से समझने की कोशिश करें। नियमों का ठीक से पालन करने के लिए, आपको पता होना चाहिए कि उन्हें क्यों रखा गया था और वे किससे रक्षा करते हैं।
कुछ उल्लेखनीय गोपनीयता कानून यूरोपीय संघ के सामान्य डेटा संरक्षण विनियम हैं (जीडीपीआर) और कैलिफोर्निया उपभोक्ता गोपनीयता अधिनियम (सीसीपीए). अन्य में HIIPA, DPA, PIPEDA, LGPD, और कई उद्योग-विशिष्ट नियम शामिल हैं।
2. निजता का सम्मान करें
पते, ईमेल और आईडी पहचानकर्ता हैं जो सार्वजनिक नहीं होने चाहिए क्योंकि वे लोगों के लिए वास्तविक जोखिम पैदा करते हैं। इसलिए, सुनिश्चित करें कि आप इन विवरणों को यथासंभव निजी बनाते हैं।
उजागर होने पर, पीड़ित पहचान की चोरी या धोखाधड़ी का शिकार हो सकते हैं। लोगों द्वारा उनकी गोपनीय जानकारी सार्वजनिक करने की धमकी देकर उन्हें ब्लैकमेल भी किया जा सकता है। इसके अलावा, पेशेवरों को एक बार उनकी व्यक्तिगत प्राथमिकताओं को सार्वजनिक किए जाने के बाद प्रतिष्ठा की क्षति और ऑनलाइन उत्पीड़न का सामना करना पड़ सकता है। ये उनके रिश्तों, करियर के अवसरों और सामाजिक प्रतिष्ठा को प्रभावित कर सकते हैं।
इसलिए इसे ध्यान में रखते हुए, शोध करें और बेहतर करने के प्रभावी तरीके चुनें सुरक्षित ऑनलाइन पहचान और डेटा की पहचान रद्द करें। उदाहरण के लिए, आप वर्णों को बदल सकते हैं, प्रत्यक्ष पहचानकर्ताओं को हटा सकते हैं या सामान्य बना सकते हैं। ऐसा करने से आपके निष्कर्षों के साथ संगठनों की मदद करते हुए संवेदनशील डेटा को साइबर अपराधियों से बचाया जाता है।
3. पक्षपात को दूर करें
डेटा वैज्ञानिक यथासंभव वस्तुनिष्ठ होने के लिए आँकड़ों पर भरोसा करते हैं। फिर भी, इन प्रयासों के बावजूद, पूर्वाग्रह बना रहता है क्योंकि यह धारणा कि बड़ा डेटा अधिक सटीक होता है, सबसे अधिक में से एक है सामान्य डेटा विज्ञान मिथक.
इसमें कुछ सच्चाई है, लेकिन दुर्भाग्य से, बड़े डेटा में कभी-कभी अनावश्यक या फर्जी तत्व और आंकड़े होते हैं। इसलिए, केवल संख्याओं पर ध्यान केंद्रित करने के बजाय, सुनिश्चित करें कि आपका डेटा स्वच्छ और प्रतिनिधि है।
उपयोग से पहले डेटा को साफ करना या फ़िल्टर करना पक्षपात का मुकाबला करने का उत्कृष्ट तरीका है। उदाहरण के लिए, आप प्रतिनिधि डेटा सुनिश्चित करने के लिए त्रुटियों की जांच कर सकते हैं या स्तरीकृत नमूने का उपयोग कर सकते हैं।
4. मनगढ़ंत या आविष्कार परिणाम न करें
फैब्रिकेशन डेटा कदाचार और अनुसंधान धोखाधड़ी का एक रूप है जिसमें निष्कर्ष निकालना और उन्हें सच बताना शामिल है।
उदाहरण के लिए, एक डेटा वैज्ञानिक रिपोर्ट कर सकता है कि एक निश्चित आयु वर्ग के अधिकांश सदस्यों के लिए एक दवा का कोई दुष्प्रभाव नहीं पाया गया है। ये निष्कर्ष मनगढ़ंत होंगे यदि कोई प्रारंभिक चिकित्सा प्रयोग नहीं थे और उन्हें वापस करने के लिए डेटा एकत्र किया गया था।
डेटा वैज्ञानिकों और उनके काम पर भरोसा करने वालों के लिए निर्माण के गंभीर और नकारात्मक परिणाम हैं। यह आपकी विश्वसनीयता को नष्ट कर सकता है, आपके संगठन की प्रतिष्ठा को दागदार कर सकता है, जनता को नुकसान पहुँचा सकता है, या आपको कानूनी जोखिमों में डाल सकता है।
5. साक्ष्य को मिथ्या या हेर-फेर न करें
मिथ्याकरण एक एजेंडे के अनुरूप वास्तविकता, एकत्रित डेटा का हेरफेर है। जबकि फैब्रिकेटर अपने दावों का समर्थन करने के लिए गैर-मौजूद डेटा से परिणाम बनाते हैं, नकली व्यक्तिगत कारणों से वास्तविक और मौजूदा डेटा को खारिज करने का काम करते हैं। इसे प्राप्त करने के लिए, वे अनुसंधान उपकरण के साथ छेड़छाड़ कर सकते हैं, डेटा को पूरी तरह बदल सकते हैं या हटा सकते हैं।
विभिन्न क्षेत्रों में निर्णय लेने को प्रभावित करने वाली झूठी सूचना प्रदान करके मिथ्याकरण जनता को नुकसान पहुँचा सकता है। उदाहरण के लिए, एक गलत दवा अध्ययन लोगों को अनावश्यक जोखिमों, अप्रभावी उपचारों या हानिकारक दुष्प्रभावों के बारे में बता सकता है। इससे धन, समय, या सामग्री का नुकसान भी हो सकता है जिसका उपयोग अन्य उद्देश्यों के लिए किया जा सकता था।
निर्माण और मिथ्याकरण प्रतिकूल प्रभाव और कई प्रतिबंधों के साथ बेईमानी प्रथाएं हैं। इनमें जुर्माना, साख निरसन, अनुसंधान निधि हानि, या क़ैद शामिल हो सकते हैं।
6. पारदर्शिता दिखाएं
डेटा वैज्ञानिकों के लिए पारदर्शिता का अर्थ डेटा एकत्र करने, विश्लेषण करने और प्रस्तुत करने के तरीकों के बारे में ईमानदार होना है। डेटा वैज्ञानिकों को अन्य डेटा वैज्ञानिकों और अध्ययन प्रतिभागियों के साथ अपनी प्रथाओं को साझा करने के लिए खुला और तैयार होना चाहिए।
इसके अलावा, आपको अध्ययन प्रतिभागियों की सहमति प्राप्त करनी होगी क्योंकि सूचित सहमति के बिना परिणाम प्रकाशित करने से प्रतिभागियों का विभिन्न तरीकों से अनादर या नुकसान हो सकता है। वे उनकी गरिमा, निजता और स्वायत्तता का उल्लंघन कर सकते हैं या उन्हें अध्ययन के परिणामस्वरूप हानिकारक, अनावश्यक जोखिमों के लिए उजागर कर सकते हैं।
पारदर्शिता उन लोगों के साथ विश्वास पैदा करती है जो अंतर्दृष्टि के लिए आपके डेटा पर भरोसा करते हैं। यह दूसरों को आपके परिणामों की समीक्षा करने की अनुमति देकर डेटा गुणवत्ता भी सुनिश्चित करता है।
इसके अतिरिक्त, डेटा वैज्ञानिकों के बीच खुलापन सहयोग और सीखने को बढ़ावा देता है। आप अपनी प्रक्रिया को साझा करके और संचार को संप्रेषित करके नवाचार को बढ़ावा देने में मदद कर सकते हैं सर्वोत्तम डेटा विज़ुअलाइज़ेशन विधियाँ और उनसे सीखते समय साथियों को डेटा साइंस तकनीक।
7. डेटा को सुरक्षित रूप से एकत्रित करें
डेटा वैज्ञानिकों को डेटा एकत्र करने, विश्लेषण करने और संग्रहीत करने के लिए उपयोग की जाने वाली विधियों की सुरक्षा की पुष्टि करनी चाहिए। ऐसा करने से संभावित डेटा उल्लंघनों को रोका जा सकता है जो डेटा वैज्ञानिकों और अध्ययन प्रतिभागियों को प्रभावित कर सकते हैं।
डेटा का उल्लंघन व्यक्तिगत सुरक्षा को खतरे में डालता है, सार्वजनिक विश्वास को कमजोर करता है, और संगठनात्मक अक्षमता को उजागर करता है जिसके परिणामस्वरूप कंपनी को भारी वित्तीय नुकसान होता है। ये नुकसान डेटा ब्रीच पीड़ितों, कम ग्राहकों, और अधिक से मुकदमे हो सकते हैं।
इसके प्रकाश में, आपको खोजने के लिए अनुसंधान करना चाहिए सबसे प्रभावी डेटा सुरक्षा समाधान और उन्हें लागू करें। उदाहरण के लिए, आप टीएलएस/एसएसएल एन्क्रिप्शन के साथ कनेक्शन सुरक्षित कर सकते हैं या रोटेटिंग प्रॉक्सी का उपयोग कर सकते हैं। साथ ही, आप अभिगम नियंत्रण उपायों को लागू कर सकते हैं और हमले के मामले में बैकअप बना सकते हैं। जब आपको समाधान मिल जाए, तो अधिकतम सुरक्षा सुनिश्चित करने के लिए उन्हें दूसरों के साथ साझा करना न भूलें।
8. जिम्मेदारी से एल्गोरिदम का प्रयोग करें
एल्गोरिदम केवल डेटा विश्लेषण के उपकरण नहीं हैं। वे लोगों के जीवन, व्यवहार और अवसरों पर शक्तिशाली प्रभाव डालते हैं। हालाँकि, हालाँकि वे समस्याओं को हल करने में मदद करते हैं और नवीन भविष्यवाणियाँ करते हैं, वे अपूर्ण भी हैं।
यदि सावधानी से डिजाइन, परीक्षण या परिनियोजित नहीं किया जाता है, तो एल्गोरिदम के सामाजिक और नैतिक प्रभाव होते हैं जो लोगों के कुछ समूहों को नुकसान पहुंचा सकते हैं। यदि डेटा पर प्रशिक्षित किया जाता है जो मौजूदा पूर्वाग्रहों को दर्शाता है और अप्रत्याशित हो सकता है, तो वे पूर्वाग्रह भी पेश करते हैं। इस प्रकार, डेटा वैज्ञानिकों को उन्हें जिम्मेदारी से डिजाइन और उपयोग करना चाहिए।
हमेशा उपयुक्त एल्गोरिदम चुनें, उनके प्रदर्शन का परीक्षण करें और समझाएं कि वे कैसे काम करते हैं। इसके अलावा, सुनिश्चित करें कि आप पूर्वाग्रह के संभावित स्रोतों की पहचान करते हैं और उन तंत्रों को लागू करते हैं जो आवश्यक होने पर अपडेट या सही करते हैं।
9. अपने काम के दीर्घकालिक प्रभावों पर विचार करें
डेटा वैज्ञानिक के रूप में आपका काम समाज के कई पहलुओं पर महत्वपूर्ण प्रभाव डालेगा। इसलिए, हमेशा विचार करें कि आपके मॉडल लोगों को कैसे प्रभावित करते हैं।
उदाहरण के लिए, यह सवाल करने का प्रयास करें कि क्या आपका काम पूर्वाग्रह और असमानता को कायम रख सकता है या भविष्य में गोपनीयता को ख़तरे में डाल सकता है। अगला, इन चिंताओं को पर्याप्त रूप से संबोधित करें।
ध्यान दें कि भविष्योन्मुखी दृष्टिकोण किसी भी सुधारात्मक पद्धति से अधिक महत्वपूर्ण है, और आने वाले दिनों के बारे में सोचना नैतिक रूप से सही निर्णय लेने के सबसे प्रभावी तरीकों में से एक है।
आपको डेटा साइंटिस्ट के रूप में नैतिक होना चाहिए
एक डेटा वैज्ञानिक के रूप में, आपको एक शक्ति प्राप्त होती है जो आनुपातिक जिम्मेदारी के साथ आती है। आपके कौशल दुर्लभ हैं, इसलिए आप संगठनात्मक निर्णय लेने में सबसे आगे बैठते हैं।
आपके निर्णय कंपनी की व्यवसाय योजनाओं से लेकर आपराधिक न्याय प्रणाली तक सब कुछ प्रभावित करते हैं। तो, आपको उन्हें हल्का नहीं बनाना चाहिए। अपने उद्योग और अन्य तकनीकी क्षेत्रों में मौजूदा नैतिक दुविधाओं से लोगों को बचाने के लिए अपने काम में हमेशा ईमानदार, नैतिक और सावधानीपूर्वक रहें।