جمعآوری دادههای مکانی، اطلاعات پایهای را در اختیار ما قرار میدهند تا پدیدههای جدید را کشف کنیم. به عنوان مثال نقاط مورد توجه و همچنین الگوهای حرکتی را میتوانیم از این اطلاعات مکانی استخراج کنیم. از این رو جمعآوری دادههای مکانی بدون اعمال حریم خصوصی، خطرناک است. اخیرا برای اعمال حریم خصوصی روی دادهها از حریم خصوصی تفاضلی استفاده میشود. این راهکار با جمعآوری دادهها در یک سرپرست و اعمال نویز روی آنها، دادههای حافظ حریم خصوصی را منتشر میکند. این راهکار مستعد نقض حریم خصوصی میباشد که نامعتمد بودن سرپرست داده و یا نفوذ به آن از جمله چالشهای راهکار هستند. با استفاده از حریم خصوصی تفاضلی محلی میتوان از چالشهای بالا گذر کرد، اما همچنان در این راهکار نیز با چالشهایی همچون کاهش حریم خصوصی داده در جمعآوری طولانی مدت داده مواجه هستیم. در این نوشتار یک راهکار برای مدیریت بودجه حریم خصوصی با استفاده از پنجره لغزان ارائه شده که چالش و مسئله مطرح شده را مرتفع میسازد.
در این مقاله به دنبال معرفی یک الگوریتم حریم خصوصی تفاضلی محلی برای انتشار دادههای مکانی، با کاربرد قابل مقایسه با الگوریتم حریم خصوصی تفاضلی سراسری میباشند.
این نوشتار راهکار پنجره لغزان خود را در سه گام اصلی زیر معرفی میکند:
۱. تصمیمگیری:
در این مرحله بررسی میشود مقدار داده در زمان i و l با هم مشابه هستند یا خیر؟ برای بررسی میزان شباهت، یک حد T تعریف میشود.
۲. آشفتهسازی:
در صورتی که مقدار داده در زمان i و l شبیه هم نباشند، دادهها با اختصاص بودجه مناسب و با استفاده از سازوکارهای لاپلاس و staircase، آشفتهسازی میشوند.
۳. تقریب:
در صورتی که مقدار داده در زمان i و l شبیه هم باشند، با استفاده از سازوکار نمایی، بهترین خروجی (که بیشترین کاربرد را ایجاد کند) که قبلا آشفته سازی شده را انتخاب میکند.
کدهای تست و بررسی عملکرد توسعهداده و استفاده شده در این مقاله، به زبان پایتون در آدرس زیر در دسترس است:
https://github.com/FatimaErrounda/CollectiveLocalDifferentialPrivacy
Errounda, Fatima Zahra, and Yan Liu. “Collective location statistics release with local differential privacy.” Future Generation Computer Systems (2021).