zikele

zikele

人生如此自可乐

以強大的隱私保證發布維基百科使用數據

2308.16298v3

中文标题#

以強大的隱私保證發布維基百科使用數據

英文标题#

Publishing Wikipedia usage data with strong privacy guarantees

中文摘要#

近 20 年來,維基媒體基金會一直在發布關於每天每個維基百科頁面有多少人訪問的統計數據。 這些數據幫助維基百科編輯確定他們應該將精力集中在哪些地方以改進在線百科全書,並促進了學術研究。 2023 年 6 月,維基媒體基金會,在 Tumult Labs 的幫助下,回應了維基百科編輯和學術研究人員長期以來的請求:它開始以更細粒度的方式發布這些統計數據,包括在每日頁面瀏覽次數中加入來源國家。 這項新的數據發布使用差分隱私來為瀏覽或編輯維基百科的人提供強大的保障。 本文描述了這一數據發布:其目標,從開始到部署的過程,用於生成數據的算法,以及數據發布的成果。

英文摘要#

For almost 20 years, the Wikimedia Foundation has been publishing statistics about how many people visited each Wikipedia page on each day. This data helps Wikipedia editors determine where to focus their efforts to improve the online encyclopedia, and enables academic research. In June 2023, the Wikimedia Foundation, helped by Tumult Labs, addressed a long-standing request from Wikipedia editors and academic researchers: it started publishing these statistics with finer granularity, including the country of origin in the daily counts of page views. This new data publication uses differential privacy to provide robust guarantees to people browsing or editing Wikipedia. This paper describes this data publication: its goals, the process followed from its inception to its deployment, the algorithms used to produce the data, and the outcomes of the data release.

PDF 获取#

查看中文 PDF - 2308.16298v3

智能達人抖店二維碼

抖音掃碼查看更多精彩內容

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。