日本語タイトル#
強力なプライバシー保証を持つウィキペディア使用データの公開
英文タイトル#
Publishing Wikipedia usage data with strong privacy guarantees
日本語要約#
過去 20 年間、ウィキメディア財団は毎日各ウィキペディアページにどれだけの人が訪れたかに関する統計データを公開してきました。これらのデータは、ウィキペディアの編集者がオンライン百科事典を改善するためにどこに努力を集中すべきかを判断するのに役立ち、学術研究を促進します。2023 年 6 月、ウィキメディア財団は、Tumult Labs の助けを借りて、ウィキペディアの編集者や学術研究者からの長年の要望に応え、これらの統計データをより細かい粒度で公開し始めました。これには、日々のページビュー数に出身国を含めることが含まれます。この新しいデータ公開は、ウィキペディアを閲覧または編集する人々に強力な保証を提供するために差分プライバシーを使用しています。本論文では、このデータ公開について、その目標、開始から展開までのプロセス、データ生成に使用されるアルゴリズム、およびデータ公開の成果を説明します。
英文要約#
For almost 20 years, the Wikimedia Foundation has been publishing statistics about how many people visited each Wikipedia page on each day. This data helps Wikipedia editors determine where to focus their efforts to improve the online encyclopedia, and enables academic research. In June 2023, the Wikimedia Foundation, helped by Tumult Labs, addressed a long-standing request from Wikipedia editors and academic researchers: it started publishing these statistics with finer granularity, including the country of origin in the daily counts of page views. This new data publication uses differential privacy to provide robust guarantees to people browsing or editing Wikipedia. This paper describes this data publication: its goals, the process followed from its inception to its deployment, the algorithms used to produce the data, and the outcomes of the data release.
PDF 取得#
抖音でスキャンしてさらに素晴らしいコンテンツを見る