在大数据时代背景下,频繁项集挖掘(FIM)技术被广泛应用于发现和提取大规模数据集中的有价值信息。然而,数据集中往往包含敏感的私人信息,直接挖掘或共享挖掘结果可能会引发隐私泄露的风险。因此,如何有效地保护数据隐私,同时又能从数据中挖掘出有价值的信息,成为了一个亟待解决的问题。
差分隐私作为一种先进的隐私保护技术,通过引入噪声机制来保护个人信息,与传统隐私保护手段相比,它具有更高的安全标准和更强的防护能力,同时还能保持数据的可用性。在以往的研究中,基于差分隐私的频繁项集挖掘常采用长事务截断策略以降低算法的敏感度,但这可能会引入截断误差,影响隐私预算的有效利用。
DP-PartFIM算法的提出,为隐私保护下的数据挖掘提供了一种新的解决方案。它不仅提高了数据挖掘的效率,同时也有效地保护了数据隐私,对于促进数据挖掘技术的发展和应用具有重要意义。
论文信息
论文已被期刊IEEE Transactions on Emerging Topics in Computing录用,DOI: 10.1109/TETC.2024.3443060,作者为硕士生刘鑫宇、博士生余乐乐、导师刘忆宁教授(通讯作者),以及暨南大学的甘文生副教授。