方向选择

从几篇文章中选一下研究方向,简单看下三篇文章的摘要

1、A Survey on Multi-Label Data Stream Classification

题目:多标签数据流分类研究

摘要:如今,我们日常生活中的许多现实应用都产生了大量的流数据,产生数据的速度比以往任何时候都高,仅举几个例子,即 Web 点击数据流,感知网络数据和信用交易流。与使用静态数据集的传统数据挖掘相反,数据流挖掘有几个挑战,例如有限的内存,一站式及时响应。在这项调查中,我们对现有的多标签流挖掘算法进行了全面的回顾,并根据不同的角度对这些方法进行分类,主要集中在多标签数据流分类。我们首先简要概述现有的多标签和数据流分类算法,以及讨论他们的优点和缺点。其次,我们确定了多标签流数据分类的挖掘约束,并提出了对多标签数据流分类算法的全面研究。最后,讨论了多标签数据流分类中的一些挑战和未解决的问题,这些都是值得今后研究人员继续探索的。

关键字:数据流挖掘;多标签数据;多标签分类

流数据:流数据是由不同来源连续生成的数据

2、Information Security in Big Data: Privacy and Data Mining

题目:大数据中的信息安全:隐私和数据挖掘

摘要:数据挖掘技术的日益普及和发展对个人敏感信息的安全性构成了严重威胁。数据挖掘中的一个新兴研究主题,即隐私保护数据挖掘(PPDM),近年来已经得到了广泛的研究。PPDM的基本思想是修改数据,以便有效地执行数据挖掘算法,而不会损害数据中包含的敏感信息的安全性。PPDM的当前研究主要集中在如何减少数据挖掘操作带来的隐私风险上,而实际上,在数据收集,数据发布和信息(即:数据挖掘的结果)传递过程中也可能发生不希望的敏感信息泄露。在本文中,我们从更广阔的角度看待与数据挖掘相关的隐私问题,并研究可以帮助保护敏感信息的各种方法。特别是,我们确定了四种不同类型的用户,它们是数据挖掘应用程序,即数据提供者,数据收集者,数据挖掘者和决策者。对于每种类型的用户,我们讨论他的隐私问题以及可以用来保护敏感信息的方法。我们简要介绍了相关研究主题的基础知识,回顾了最先进的方法,并对未来的研究方向提出了一些初步的想法。
除了探讨每种类型用户的隐私保护方法外,我们还回顾了博弈论方法,该方法旨在分析数据挖掘场景中不同用户之间的交互,每个人对敏感信息都有自己的评估。通过区分不同用户关于敏感信息安全方面的职责,我们希望提供一些对于PPDM研究有用见解。

关键字:数据挖掘;敏感信息;隐私保护数据挖掘;匿名化;追踪;博弈论;隐私拍卖;反追踪

3、Mining Conditional Functional Dependency Rules on Big Data

题目:在大数据上挖掘条件功能依赖规则

摘要:当前的条件功能依赖(CFD)发现算法始终需要准备充分的训练数据集。这种情况使它们难以应用于大型和低质量的数据集。为了处理大数据的体积问题,我们开发了采样算法来获得一个小的有代表性的训练集。我们设计了容错规则发现和冲突解决算法,以解决大数据的低质量问题。我们还提出了参数选择策略,以确保CFD发现算法的有效性。实验结果表明,我们的方法可以在合理的时间内发现数十亿元数据的有效CFD规则。

关键字:数据挖掘;条件功能依赖;大数据;数据质量

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!

请我喝杯咖啡吧~

支付宝
微信