دادهها موضوع حساسی است و شما بهعنوان یک دانشمند داده، طبیعتاً با آنها آشنا خواهید شد. در اینجا قوانینی وجود دارد که همیشه باید از آنها پیروی کنید.
داده ها بسیار ارزشمند هستند و استفاده از آنها به راحتی یکی از بهترین روش ها برای اکثر سازمان های امروزی است. اما دانستن استانداردهای صنعت در این زمینه برای دانشمندان داده ضروری است تا با داده ها اشتباه نکنند زیرا مردم بیشتر در مورد ارزش آن می آموزند.
به این ترتیب، دانشمندان داده باید شیوه های ایمن و اخلاقی را بپذیرند و روش های استاندارد شده را اتخاذ کنند. به جای در نظر گرفتن اینکه داده ها چقدر ارزشمند هستند، عاقلانه است که روش های به دست آوردن و پردازش داده ها برای هر هدفی را زیر سوال ببریم. بنابراین، در اینجا 9 کد رفتاری وجود دارد که هر دانشمند داده باید از آن پیروی کند.
1. مقررات را رعایت کنید
دانشمندان داده باید مقررات حفاظت از داده ها را که برای مشاغل خاص اعمال می شود، بدانند. در غیر این صورت ممکن است ناآگاهانه قانون را زیر پا بگذارید و خود و دیگران را در معرض خطر قرار دهید. بنابراین، این دانش برای اطمینان از کار اخلاقی و جلوگیری از آسیب ناخواسته بسیار مهم است.
به این ترتیب، قبل از هر گونه فعالیتی، قوانین مربوطه را بررسی کنید. علاوه بر این، برای پیروی از قوانین فقط مقررات را رعایت نکنید. همچنین به دنبال درک عمیق تری از آنها باشید. برای رعایت صحیح مقررات، باید بدانید که چرا آنها قرار داده شده اند و در برابر چه چیزی محافظت می کنند.
چند قانون قابل توجه حفظ حریم خصوصی عبارتند از: مقررات عمومی حفاظت از داده اتحادیه اروپا (GDPR) و قانون حفظ حریم خصوصی مصرف کنندگان کالیفرنیا (CCPA). سایر موارد عبارتند از HIIPA، DPA، PIPEDA، LGPD، و بسیاری از مقررات خاص صنعت.
2. به حریم خصوصی احترام بگذارید
آدرسها، ایمیلها و شناسهها، شناسههایی هستند که نباید عمومی باشند، زیرا خطرات واقعی برای مردم به همراه دارند. بنابراین، اطمینان حاصل کنید که این جزئیات را تا حد امکان خصوصی می کنید.
در صورت افشا شدن، قربانیان ممکن است از سرقت هویت یا کلاهبرداری رنج ببرند. همچنین ممکن است توسط افرادی که تهدید به انتشار اطلاعات محرمانه خود می کنند، باج گیری شوند. علاوه بر این، حرفهایها ممکن است پس از اینکه ترجیحات شخصی آنها به صورت عمومی منتشر شود، به اعتبار و آزار و اذیت آنلاین آسیب ببینند. اینها می تواند بر روابط، فرصت های شغلی و موقعیت اجتماعی آنها تأثیر بگذارد.
بنابراین با در نظر گرفتن این موضوع، تحقیق کنید و راههای مؤثری را برای ایمنسازی بهتر هویتهای آنلاین و حذف هویت دادهها انتخاب کنید. به عنوان مثال، می توانید کاراکترها را جایگزین کنید، شناسه های مستقیم را حذف کنید یا تعمیم دهید. انجام این کار از داده های حساس در برابر مجرمان سایبری محافظت می کند و در عین حال به سازمان ها در یافته های شما کمک می کند.
3. تعصب را از بین ببرید
دانشمندان داده برای عینی بودن تا حد امکان بر آمار تکیه می کنند. با این حال، علیرغم این تلاشها، تعصب همچنان ادامه دارد، زیرا این تصور که دادههای بزرگتر دقیقتر هستند، یکی از رایجترین افسانههای علم داده است.
حقیقتی در این مورد نهفته است، اما متأسفانه، داده های بزرگ گاهی اوقات حاوی عناصر و آمار غیر ضروری یا جعلی هستند. بنابراین، به جای تمرکز بر روی اعداد، اطمینان حاصل کنید که داده های شما تمیز و نماینده هستند.
تمیز کردن یا فیلتر کردن دادهها قبل از استفاده، روشهای عالی برای مبارزه با سوگیری هستند. برای مثال، میتوانید خطاها را بررسی کنید یا از نمونهگیری طبقهای برای اطمینان از دادههای نماینده استفاده کنید.
4. نتایج را ساختگی یا اختراع نکنید
ساختگی نوعی سوء رفتار در داده ها و تقلب تحقیقاتی است که شامل ساختن یافته ها و گزارش آنها به عنوان واقعی است.
به عنوان مثال، یک دانشمند داده ممکن است گزارش دهد که یک دارو برای اکثر اعضای یک گروه سنی خاص هیچ عوارض جانبی ندارد. اگر آزمایشهای پزشکی اولیه و جمعآوری دادهها برای پشتیبانگیری از آنها وجود نداشته باشد، این یافتهها ساخته میشوند.
ساخت عواقب جدی و منفی برای دانشمندان داده و کسانی که بر کار آنها تکیه می کنند دارد. این می تواند اعتبار شما را از بین ببرد، اعتبار سازمان شما را لکه دار کند، به مردم آسیب برساند یا شما را در معرض خطرات قانونی قرار دهد.
5. شواهد را جعل یا دستکاری نکنید
جعل دستکاری واقعیت است، داده های جمع آوری شده برای مطابقت با یک دستور کار. در حالی که سازندگان نتایج را از دادههای موجود برای حمایت از ادعاهای خود میسازند، جعلکنندگان برای رد دادههای واقعی و موجود به دلایل شخصی تلاش میکنند. برای رسیدن به این هدف، آنها ممکن است تجهیزات تحقیقاتی را دستکاری کنند، داده ها را تغییر دهند یا به طور کامل حذف کنند.
جعل میتواند با ارائه اطلاعات نادرست بر تصمیمگیری در بخشهای مختلف به مردم آسیب برساند. برای مثال، یک مطالعه دارویی تقلبی میتواند افراد را در معرض خطرات بیضروری، درمانهای ناکارآمد یا عوارض جانبی مضر قرار دهد. همچنین ممکن است باعث از دست رفتن پول، زمان یا موادی شود که میتوانستند برای مقاصد دیگری استفاده شوند.
جعل و جعل، اعمال ناشایست با اثرات نامطلوب و تحریم های متعدد است. اینها ممکن است شامل جریمه، ابطال اعتبار، از دست دادن بودجه تحقیقاتی یا حبس باشد.
6. شفافیت را نشان دهید
شفافیت برای دانشمندان داده به معنای صادق بودن در مورد روش های به کار رفته برای جمع آوری، تجزیه و تحلیل و ارائه داده ها است. دانشمندان داده باید باز و آماده باشند تا شیوه های خود را با سایر دانشمندان داده و شرکت کنندگان در مطالعه به اشتراک بگذارند.
علاوه بر این، باید رضایت شرکت کنندگان در مطالعه را کسب کنید زیرا انتشار نتایج بدون رضایت آگاهانه می تواند به طرق مختلف به شرکت کنندگان بی احترامی یا آسیب برساند. آنها ممکن است حیثیت، حریم خصوصی و استقلال خود را نقض کنند یا آنها را در معرض خطرات مضر و غیرضروری ناشی از مطالعه قرار دهند.
شفافیت با کسانی که برای بینش به داده های شما متکی هستند اعتماد ایجاد می کند. همچنین کیفیت داده ها را با اجازه دادن به دیگران برای بررسی نتایج شما تضمین می کند.
علاوه بر این، باز بودن در میان دانشمندان داده، همکاری و یادگیری را ارتقا میدهد. شما میتوانید با به اشتراک گذاشتن فرآیند خود و برقراری ارتباط بهترین روشهای تجسم دادهها و تکنیکهای علم داده به همتایان خود در حین یادگیری از آنها، به تقویت نوآوری کمک کنید.
7. داده ها را ایمن جمع آوری کنید
دانشمندان داده باید ایمنی روش های مورد استفاده برای جمع آوری، تجزیه و تحلیل و ذخیره داده ها را تأیید کنند. انجام این کار از نقض احتمالی داده ها که می تواند بر دانشمندان داده و شرکت کنندگان در مطالعه تأثیر بگذارد، جلوگیری می کند.
نقض داده ها ایمنی شخصی را به خطر می اندازد، اعتماد عمومی را تضعیف می کند، و بی کفایتی سازمانی را آشکار می کند که منجر به ضررهای مالی سرسام آور برای شرکت می شود. این ضررها می تواند شکایت قربانیان نقض داده ها، مشتریان کمتر و موارد دیگر باشد.
با توجه به این موضوع، شما باید تحقیقاتی را برای یافتن موثرترین راه حل های امنیت داده و اعمال آنها انجام دهید. به عنوان مثال، می توانید اتصالات را با رمزگذاری TLS/SSL ایمن کنید یا از پراکسی های چرخشی استفاده کنید. همچنین، می توانید اقدامات کنترل دسترسی را اعمال کنید و در صورت حمله، نسخه پشتیبان تهیه کنید. وقتی راه حل هایی پیدا کردید، فراموش نکنید که آنها را با دیگران به اشتراک بگذارید تا حداکثر امنیت را تضمین کنید.
8. از الگوریتم ها به طور مسئولانه استفاده کنید
الگوریتم ها فقط ابزاری برای تجزیه و تحلیل داده ها نیستند. آنها تأثیرات قدرتمندی بر زندگی، رفتار و فرصت های افراد دارند. با این حال، اگرچه آنها به حل مشکلات و پیش بینی های بدیع کمک می کنند، اما ناقص هستند.
اگر الگوریتمها به دقت طراحی، آزمایش یا به کار نرود، تأثیرات اجتماعی و اخلاقی دارند که ممکن است به گروههای خاصی از افراد آسیب برساند. آنها همچنین اگر بر روی داده هایی آموزش داده شوند که منعکس کننده تعصبات موجود باشد و غیرقابل پیش بینی باشد، تعصب را معرفی می کنند. بنابراین، دانشمندان داده باید آنها را به طور مسئولانه طراحی و استفاده کنند.
همیشه الگوریتم های مناسب را انتخاب کنید، عملکرد آنها را آزمایش کنید و نحوه عملکرد آنها را توضیح دهید. همچنین، مطمئن شوید که منابع بالقوه سوگیری را شناسایی کردهاید و مکانیسمهایی را اجرا کنید که در صورت لزوم بهروزرسانی یا اصلاح میشوند.
9. پیامدهای بلند مدت کار خود را در نظر بگیرید
کار شما به عنوان یک دانشمند داده به طور قابل توجهی بر بسیاری از جنبه های جامعه تأثیر می گذارد. بنابراین، همیشه در نظر داشته باشید که مدل های شما چگونه بر افراد تأثیر می گذارد.
به عنوان مثال، سعی کنید این سوال را مطرح کنید که آیا کار شما می تواند تعصب و نابرابری را تداوم بخشد یا حریم خصوصی را در آینده به خطر بیندازد. در مرحله بعد، به این نگرانی ها رسیدگی کنید.
توجه داشته باشید که چشم انداز آینده نگر از هر روش اصلاحی مهم تر است و فکر کردن به روزهای آینده یکی از موثرترین راه ها برای تصمیم گیری صحیح اخلاقی است.
شما باید به عنوان یک دانشمند داده اخلاقی باشید
به عنوان یک دانشمند داده، شما قدرتی دریافت می کنید که با مسئولیتی متناسب همراه است. مهارتهای شما نادر است، بنابراین در خط مقدم تصمیمگیری سازمانی مینشینید.
تصمیمات شما بر همه چیز از برنامه های تجاری شرکت گرفته تا سیستم های عدالت کیفری تأثیر می گذارد. بنابراین، شما نباید آنها را ساده بسازید. همیشه در کار خود صادق، اخلاقی و دقیق باشید تا از مردم در برابر معضلات اخلاقی موجود در صنعت و سایر زمینه های فناوری محافظت کنید.