Collecting Telemetry Data Privately

آمار نحوه استفاده از اپلیکیشن یا سیستم که هر ثانیه گزارش می‌شود از مصادیق داده‌های Telemetry هستند. Telemetry به معنی دورسنجی (سنجش از راه دور) می‌باشد.

در این مقاله که توسط شرکت مایکروسافت ارائه شده است، بیان شده است که حریم خصوصی تفاضلی محلی، حریم خصوصی بسیار قوی ایجاد می‌کند. در شرایطی که تعداد پرسمان‌ها زیاد شود، سطح حریم خصوصی خیلی سریع کاهش پیدا می‌کند. بنابراین باید راهکاری ارائه شود که حریم خصوصی در وجود پرسمان‌های مکرر نیز حفظ شود و منجر به نقض حریم خصوصی نشود. این راهکار از سازوکارهای 1-Bit و d-Bit بهره می‌برد. برای داده‌های عادی از سازوکار 1-Bit و برای داده‌هایی که روی نمودار قرار می‌گیرند و در یک دسته‌بندی هستند از سازوکار d-Bit استفاده می‌شود.

راهکار مایکروسافت برای جلوگیری از مصرف بی رویه بودجه حریم خصوصی تفاضلی، از تکنیک Memoization استفاده می‌کند. در حالی که این تکنیک به مصرف درست بودجه حریم خصوصی کمک می‌کند، به جمع‌آوری کننده داده‌ها این امکان را می‌دهد که تشخیص دهد داده‌های یک کاربر ثابت هستند یا متغیر. البته این نکته را در نظر داشته باشید که صرفا ثابت یا متغیر بودن را تشخیص می‌دهد و توان تشخیص داده‌های قبلی و داده‌های جدید را ندارد.

برای حل مشکل مرحله قبلی از گسسته سازی داده‌ها استفاده می‌کنیم تا در صورت داشتن تغییرات داخل یک بازه خاص، خروجی پاسخ پرسمان همچنان یکسان باشد. با توجه به اینکه بازه داده‌های موجود بسیار زیاد هست و بین کاربران اختلاف زیادی وجود دارد، گسسته‌سازی داده‌ها، کاهش دقت آن‌ها را به همراه خواهد داشت.

این راهکار برای حل مشکل گسسته سازی، استفاده از بازه‌های مستقل هر کاربر برای گسسته سازی داده‌ها را پیشنهاد می‌دهد. به این صورت که به ازای هر کاربر گسسته سازی در بازه‌های متفاوتی و متناسب با میزان استفاده کاربر از سیستم مشخص می‌شود و در نتیجه هم حریم خصوصی داده حفظ می‌شود و هم دقت داده‌ها. مایکروسافت این راهکار را با نام آلفا-نقطه (a-point) ارائه کرده است.

Ding, Bolin, Janardhan Kulkarni, and Sergey Yekhanin. “Collecting telemetry data privately.” arXiv preprint arXiv:1712.01524 (2017).

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

هرگونه استفاده از محتوای این وب سایت، با ذکر منبع و نام نویسنده بلامانع است.