مقاله حاضر یک راه حل برای حفظ حریم خصوصی تفاضلی برای دادههای همبسته از طریق تعریف حساسیت همبستگی و طراحی یک فرأیند انتشار داده همبسته معرفی کرده است. حساسیت همبستگی تعریف شده در این مقاله در مقایسه با حساسیت سراسری(Global Sensitivity) که در مقالههای پیشین تعریف شده بود میتواند به میزان قابل توجهی نویز اضافه شده به نتیجه پرسوجو را کاهش دهد. فرآیند طراحی شده نیز مبتنی بر روش تکرار دورهای است که میتواند با کنترل بودجه مصرفی حریم خصوصی، به حجم زیادی از پرس و جوها پاسخ دهد.
مهمترین چالشی که در حفظ حریم خصوصی تفاضلی برای دادههای همبسته با آن مواجه هستیم، اطلاعاتی است که این دادهها میتوانند در اختیار مهاجم قرار دهند که حل این چالش با روشهای پیشین و اصلی حفظ حریم خصوصی تفاضلی قابل حل نیست. در همین راستا راه حلهای متعددی پیشنهاد شده است اما همچنان با سه چالش اصلی در این حوزه مواجه هستیم: اولین چالش این است که چگونه میبایست دادههای همبسته را شناسایی کرده و آنها را نشان داد. دومین چالش این است که چنانچه بخواهیم میزان حسایت را از طریق ضرب آن در تعداد دادههای همبسته افزایش دهیم، این امر منجر به افزایش نویز در پاسخ به پرس و جوها شده و میزان صحت و کارایی سیستم را بسیار کاهش میدهد. سومین چالش نیز زمانی پدید میآید که با تعداد زیادی پرسوجو مواجه باشیم بهطوریکه منجر به تقسیم بودجه حریم خصوصی شده و در نتیجه افزایش نویز را به همراه خواهد داشت.
در مقاله حاضر از طریق معرفی حساسیت همبستگی و همچنین با معرفی فرآیند تکرار دورهای، بودجه حریم خصوصی تفاضی صرفا در برخی دورها مصرف شده و در نهایت میزان نوفه(نویز) کاهش مییابد. همچنین دادهها توسط هیستوگرام نمایش داده شدهاند و با تعریف درجه همبستگی، ماتریس درجه همبستگی برای نمایش میزان همبستگی رکوردهای مجموعه داده مورد استفاده قرار گرفته است.
T. Zhu, P. Xiong, G. Li and W. Zhou, “Correlated Differential Privacy: Hiding Information in Non-IID Data Set,” in IEEE Transactions on Information Forensics and Security, vol. 10, no. 2, pp. 229-242, Feb. 2015, doi: 10.1109/TIFS.2014.2368363.