اخیرا جمعآوری دادههای آماری و انتشار آنها باعث ایجاد برنامکهای جدید و کاربردی شدهاند. برنامک تحلیل و بررسی آنی ترافیک میتواند یکی از شاخصترین آنها باشد. جمعآوری دادهها در این برنامکها به صورت مستقیم از کاربر به سرپرست داده معتمد است. این در حالی است که سرور (سرپرستداده) مذکور ممکن است مورد نفوذ قرار گیرد یا دیگر معتمد نباشد. این در حالی است که راهکارهای پیشین همگی برای سرپرستهای داده معتمد ارائه شدهاند. در این مقاله راهکاری تحت عنوان DADP ارائه شده است، که حریم خصوصی تفاضلی دادههای آماری جمعآوری شده توسط سرپرستداده نامعتمد را تامین و تضمین میکند.
این راهکار برای دادههای جمعآوری شده حریم خصوصی سطح رویداد را تامین میکند. در این راهکار از چند عامل (Agent) بهره بده شده است که میان کاربران و سرپرستداده نامعتمد قرار میگیرد. ارتباط بین کاربر و این عاملها با استفاده از تلکنولوژیهای اتصال گمنام انجام میشود. برای جلوگیری از شناسایی کاربر در ارسال مکرر دادهها، در هر بار ارسال داده، کاربر یک عامل را به صورت تصادفی انتخاب و دادههای آماری خود را از روش مطرح شده ارسال میکند. آزمایشات نشان میدهد هر چه تعداد این عاملها بیشتر باشد، کاربرد دادهها بیشتر است. (قابل ذکر است که افزایش عامل از یک آستانهای به بعد، تاثیر چشمگیری در بهبود کاربرد داده ندارد)
پس از دریافت دادهها توسط هر عامل، دادهها گروهبندی میشوند و سپس آشفتگی و نوفه لازم به آنها افزوده میشود. دادههای حاوی نویز برای سرپرستداده نامعتمد ارسال میشوند و در آنجا جمع میشوند و با اعمال فیلتر Kalman برای انتشار عمومی آماده میشوند. شماتیک مراحل جمعآوری و انتشار دادهها در تصویر زیر قابل مشاهده است.
الگوریتم این راهکار به بخشهای اصلی زیر تقسیم میشوند:
۱. آپلود ایمن دادهها روی عامل
۲. تخصیص بودجه حریم خصوصی
۳. گروهبندی پویا کاربران در عاملها
۴. آشفتهسازی گروههای ایجاد شده
۵. جمعآوری و تجمیع دادهها در سرپرستداده
این نوشتار از سازوکار لاپلاس بهره میبرد. شباهت زیادی به راهکار RescueDP دارد و میتوان مهمترین تفاوت میان این دو راهکار را در نوع سرپرستداده دانست. RescueDP برای سرپرستداده معتمد و راهکار این مقاله برای سرپرستداده نامعتمد ارائه شده است.
Wang, Zhibo, et al. “Privacy-preserving crowd-sourced statistical data publishing with an untrusted server.” IEEE Transactions on Mobile Computing 18.6 (2018): 1356-1367.