Collecting High-Dimensional and Correlation-Constrained Data with Local Differential Privacy

داده‌های با ابعاد بالا حاوی اطلاعات ارزشمندی هستند كه می‌توانند به تصميم‌گيری و ارائه هرچه بهتر خدمات كمک كنند. به همين منظور در سازوكارهای حريم خصوصی تفاضلی محلی، جمع‌كننده داده، داده‌های نوفه‌دار را از كاربران جمع‌آوری كرده و تخمين‌های آماری همچون فراوانی داده‌ها را محاسبه می‌كند. اما بيشتر روش‌های موجود برای داده‌های ساده مناسب هستند و برای داده‌های پزشكی كه داده‌هایی با ابعاد بالا هستند و ميان ويژگی‌های آن هم‌بستگی زیادی وجود دارد، مناسب نيستند.

برای حل مساله گفته شده، روش CBP که شامل مراحل زیر است، پیشنهاد شده است:

  • محاسبه احتمال آشفته‌سازی: دی این مرحله ويژگی‌ها به خوشه‌هایی مستقل تقسيم و كران هم‌بستگی و احتمال آشفته‌سازی مربوط به هر خوشه محاسبه می‌شود.
  • آشفته‌سازی: در این مرحله هر یک از كاربران، داده‌های خود را به كمک سازوكار پاسخ تصادفی نوفه‌دار كرده و آنها را برای جمع‌كننده داده ارسال می‌كنند.
  • کالیبراسیون: در مرحله آخر، جمع‌كننده داده، داده‌های جمع‌آوری شده را كاليبره كرده و فراوانی ويژگی‌ها را تخمين می‌زند.

روش پیشنهادی ديگر، روش CBPS می‌باشد كه تركيبی از روش CBP و نمونه‌برداری است. در اين روش كاربران به گروه‌هایی تقسيم شده و همه كاربران يک گروه، يک ويژگی مشخص را برای جمع‌كننده داده ارسال می‌كنند. اين روش هزينه كمتر و سودمندی داده بيشتری نسبت به روش CBP دارد.

Du R. , Ye Q. , Fu Y. , and Hu H. , “Collecting high-dimensional and correlation-constrained data with local differential privacy,” in 2021 18th Annual IEEE International Conference on Sensing, Communication, and Networking (SECON), pp.1–9, IEEE, 2021.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

هرگونه استفاده از محتوای این وب سایت، با ذکر منبع و نام نویسنده بلامانع است.