آمار نحوه استفاده از اپلیکیشن یا سیستم که هر ثانیه گزارش میشود از مصادیق دادههای Telemetry هستند. Telemetry به معنی دورسنجی (سنجش از راه دور) میباشد.
در این مقاله که توسط شرکت مایکروسافت ارائه شده است، بیان شده است که حریم خصوصی تفاضلی محلی، حریم خصوصی بسیار قوی ایجاد میکند. در شرایطی که تعداد پرسمانها زیاد شود، سطح حریم خصوصی خیلی سریع کاهش پیدا میکند. بنابراین باید راهکاری ارائه شود که حریم خصوصی در وجود پرسمانهای مکرر نیز حفظ شود و منجر به نقض حریم خصوصی نشود. این راهکار از سازوکارهای 1-Bit و d-Bit بهره میبرد. برای دادههای عادی از سازوکار 1-Bit و برای دادههایی که روی نمودار قرار میگیرند و در یک دستهبندی هستند از سازوکار d-Bit استفاده میشود.
راهکار مایکروسافت برای جلوگیری از مصرف بی رویه بودجه حریم خصوصی تفاضلی، از تکنیک Memoization استفاده میکند. در حالی که این تکنیک به مصرف درست بودجه حریم خصوصی کمک میکند، به جمعآوری کننده دادهها این امکان را میدهد که تشخیص دهد دادههای یک کاربر ثابت هستند یا متغیر. البته این نکته را در نظر داشته باشید که صرفا ثابت یا متغیر بودن را تشخیص میدهد و توان تشخیص دادههای قبلی و دادههای جدید را ندارد.
برای حل مشکل مرحله قبلی از گسسته سازی دادهها استفاده میکنیم تا در صورت داشتن تغییرات داخل یک بازه خاص، خروجی پاسخ پرسمان همچنان یکسان باشد. با توجه به اینکه بازه دادههای موجود بسیار زیاد هست و بین کاربران اختلاف زیادی وجود دارد، گسستهسازی دادهها، کاهش دقت آنها را به همراه خواهد داشت.
این راهکار برای حل مشکل گسسته سازی، استفاده از بازههای مستقل هر کاربر برای گسسته سازی دادهها را پیشنهاد میدهد. به این صورت که به ازای هر کاربر گسسته سازی در بازههای متفاوتی و متناسب با میزان استفاده کاربر از سیستم مشخص میشود و در نتیجه هم حریم خصوصی داده حفظ میشود و هم دقت دادهها. مایکروسافت این راهکار را با نام آلفا-نقطه (a-point) ارائه کرده است.
Ding, Bolin, Janardhan Kulkarni, and Sergey Yekhanin. “Collecting telemetry data privately.” arXiv preprint arXiv:1712.01524 (2017).