Dependent Differential Privacy for Correlated Data

براساس تعریف اولیه ارائه شده از حریم خصوصی تفاضلی توسط خانم Dwork، فارغ از اینکه مهاجم چه اطلاعاتی در اختیار دارد، ‌دسترسی او به نتایج پرس و جو از پایگاه داده نباید اطلاعات بیشتری را از یک فرد به خصوص در اختیارش قرار دهد. در مقاله حاضر بیان شده است که این تعریف برای داده‌های هم‌بسته همواره کارایی لازم را نداشته و هرچند اطلاعاتی از یک فرد در اختیار مهاجم قرار داده نمی‌شود، اما ممکن است به دلیل هم‌بستگی میان داده‌ها، اطلاعاتی درباره آن فرد به خصوص در اختیار مهاجم قرار گیرد. بدین منظور تعریفی تحت عنوان حریم خصوصی تفاضلی وابسته یا DDP معرفی شده که در آن علاوه بر مکانیزم تصادفی اضافه کردن نویز،‌ از دانش هم‌بستگی تصادفی نیز استفاده شده است. به عبارت دیگر در این تعریف، مهاجم با هر دانش تصادفی مدنظر قرار گرفته است، برخلاف برخی روش‌های پیش از این مقاله که صرفا دانش مشخصی از مهاجم در خصوص هم‌بستگی میان داده‌ها را می‌تواند پوشش دهد. براساس تعریف بیان شده، 𝜖-DDP می‌تواند تعریف 𝜖-DP را در هر شرایطی ارضا کند در حالی که عکس این قضیه صادق نخواهد بود.

همچنین در این مقاله مکانیزمی برای تحقق این تعریف پیشنهاد شده است. برای پیاده‌سازی این مکانیزم و به منظور مدل‌سازی هم‌بستگی میان داده‌ها، از probability graphical model و مفهوم Markov blanket استفاده شده است.این مدل میزان هم‌بستگی میان داده‌ها و به عبارتی دیگر، میزان تغییراتی که یک داده می‌تواند روی بقیه داده‌ها داشته باشد را تعیین می‌کند. بر این اساس دو تئوری که پایه مکانیزم ارائه شده در این مقاله را تشکیل می‌دهند پیشنهاد شده است. هردوی این تئوری‌ها،‌ مقدار 𝜖 را به گونه‌ای تعریف کرده‌اند که با اعمال آن در تعریف اولیه حریم خصوصی تفاضلی، می‌توان به حریم خصوصی تفاضلی وابسته دست یافت. به عبارتی دیگر خواهیم داشت: 𝜖-DDP ⇐ 𝜖′-DP که در این مقاله نحوه محاسبه 𝜖′ به تفکیک داده‌های هم‌بسته تصادفی و داده‌های هم‌بسته مدل شده بر اساس مدل مارکوف بیان شده است.

لازم به ذکر است که این مکانیزم قابل پیاده‌سازی برای انواع پرس و جوی آماری و غیرآماری(فرآیند اضافه کردن نویز بر اساس لاپلاس و یا نمایی) می‌باشد. همچنین از ویژگی‌های مکانیزم پیشنهادی این است که با افزایش تعداد رکوردهای پایگاه داده، نویز اضافه شده افزایش نیافته و برخلاف روش‌های پیشین پیشنهادی، ‌میزان نویز کمتری برای داده‌های کلان اضافه خواهد شد که خود منجر به افزایش بهره‌وری این روش خواهد شد.

J. Zhao, J. Zhang and H. V. Poor, “Dependent Differential Privacy for Correlated Data,” 2017 IEEE Globecom Workshops (GC Wkshps), 2017, pp. 1-7

دیدگاهتان را بنویسید لغو پاسخ