葡京娱乐场官方网站
新闻
College News
数据库与智能信息检索实验室荣垂田及合作者的论文最近被IEEE TKDE接受为长文。该文讨论字符串间相似性连接的有效算法。类似于连接操作在关系数据库中的地位,相似连接(Similarity Join)在非结构化数据管理中的作用越来越凸显。作为一种基本的操作已经广泛被应用于数据集成、重复辨识、文档聚类等领域,已成为数据库等相关领域的目前的研究热点之一。本文在对已有工作进行了详细的分析和论证的基础上,创新性的提出了一种基于多重排序规则的相似连接方法。为了验证方法的实用性和可扩展性,本文在集中式环境下和分布式环境下分别进行了详尽的实验。实验结果表明,文中提出的方法与已有的方法相比在执行效率和可扩展性方面都有明显的优势。 附:论文信息 Chuitian Rong, Wei Lu, Xiaoli Wang, Xiaoyong Du, Yueguo Chen, Anthony K.H. Tung. Efficient and Scalable Processing of String Similarity Join. IEEE Transactions on Knowledge and Data Engineering (Accepted)