دادههای با ابعاد بالا حاوی اطلاعات ارزشمندی هستند كه میتوانند به تصميمگيری و ارائه هرچه بهتر خدمات كمک كنند. به همين منظور در سازوكارهای حريم خصوصی تفاضلی محلی، جمعكننده داده، دادههای نوفهدار را از كاربران جمعآوری كرده و تخمينهای آماری همچون فراوانی دادهها را محاسبه میكند. اما بيشتر روشهای موجود برای دادههای ساده مناسب هستند و برای دادههای پزشكی كه دادههایی با ابعاد بالا هستند و ميان ويژگیهای آن همبستگی زیادی وجود دارد، مناسب نيستند.
برای حل مساله گفته شده، روش CBP که شامل مراحل زیر است، پیشنهاد شده است:
- محاسبه احتمال آشفتهسازی: دی این مرحله ويژگیها به خوشههایی مستقل تقسيم و كران همبستگی و احتمال آشفتهسازی مربوط به هر خوشه محاسبه میشود.
- آشفتهسازی: در این مرحله هر یک از كاربران، دادههای خود را به كمک سازوكار پاسخ تصادفی نوفهدار كرده و آنها را برای جمعكننده داده ارسال میكنند.
- کالیبراسیون: در مرحله آخر، جمعكننده داده، دادههای جمعآوری شده را كاليبره كرده و فراوانی ويژگیها را تخمين میزند.
روش پیشنهادی ديگر، روش CBPS میباشد كه تركيبی از روش CBP و نمونهبرداری است. در اين روش كاربران به گروههایی تقسيم شده و همه كاربران يک گروه، يک ويژگی مشخص را برای جمعكننده داده ارسال میكنند. اين روش هزينه كمتر و سودمندی داده بيشتری نسبت به روش CBP دارد.
Du R. , Ye Q. , Fu Y. , and Hu H. , “Collecting high-dimensional and correlation-constrained data with local differential privacy,” in 2021 18th Annual IEEE International Conference on Sensing, Communication, and Networking (SECON), pp.1–9, IEEE, 2021.