اخیرا از حریم خصوصی تفاضلی برای حفاظت از حریم خصوصی دادهها استقبال زیادی شده و پژوهشهای بسیاری در این زمینه در حال انجام است. تمرکز این پژوهشها روی یک سرپرست داده با یکم حجم داده زیاد و ایستا میباشد. در حقیقت هر پردازشی روی دادههای بدون تغییر انجام میشود و دادهها مانند یک شات تصویر دیده میشوند. این در حالی است که بسیاری از برنامکهای تحلیل داده نیاز به پردازشهای تکراری روی دادهها را دارند. مثلا برنامکهای مربوط به مانیتورینگ، وضعیت ترافیک و… که نیاز دارند به صورت مداوم دادهها را تحت نظارت داشته باشند.
در این مقاله از مفهومی به نام pan-privacy استفاده شده است. فرض کنید که شما دادههایی را برای اهداف خاص علمی جمعآوری کردهاید، ولی به هر دلیلی وضعیت داخلی سیستم برای مهاجمین یا با فشار بیرونی قابل مشاهده خواهد بود. این مفهوم بیان میکند که وضعیت داخلی سیستم نیز حافظ حریم خصوصی میباشد. مثلا اگر دادههای مربوط به تست اعتیاد ورزشکاران در یک لیگ برای امور تحلیل داده جمع آوری شده است و با فشار بیرونی نیاز هست شما وضعیت فعلی دادههای سیستم را در اختیار دیگران قرار بدهید. اگر دادههای جمع آوری شده pan-privacy داشته باشند، حریم خصوصی هیچکس نقض نمیشود، در غیر اینصورت از دادههایی که با هدف دیگری جمعآوری شده است، استفاده دیگری میشود و حریم خصوصی افراد نقض میشود.
این نوشتار با ترکیب مفهوم pan-privacy و شرایط مشاهده و نظارت مداوم رویدادهها، مدلی برای یک شمارنده ارائه کرده است که این شمارنده ساده حریم خصوصی pan-privacy را دارد. این در حالی است که این شمارنده میتواند تحت مشاهده یا نظارت مداوم عوامل بیرونی روی محتوا خود باشد. برای شروع یک شمارنده ساده با ویژگیهای بالا و یکبار نفوذ فرض شده و حافظ حریم خصوصی بودن آن اثبات میشود و سپس ثابت میکند که این شمارنده قابل توسعه است که بتواند در برابر چندین نفوذ یا دسترسی بیرونی قرار بگیرد.
راهکار ارائه شده قابلیت اعمال روی توابع یکنواخت و نزدیک به یکنواخت را دارد. همچنین این راهکار برای اعمال حریم خصوصی تفاضلی، از سازوکار پاسخ تصادفی بهره میبرد.
Dwork, Cynthia, et al. “Differential privacy under continual observation.” Proceedings of the forty-second ACM symposium on Theory of computing. 2010.