一本道最新高清无码


基于机器学习的论文作者名消歧方法研究

作者:邓可君;华凯;邓昌明;姜宁;袁玲;彭一明;张治坤; 刊名:四川大学学报(自然科学版) 上传者:潘平

一本道最新高清无码【摘要】本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.

全文阅读

2019年3月 四川大学学报(自然科学版) Mar.2019第56卷 第2期 Journal of Sichuan University(Natural Science Edition) Vol.56 No.2 doi:10.3969/ ji.ssn.0490-6756.2019.02.010 基于机器学习的论文作者名消歧方法研究 邓可君,华 凯,邓昌明,姜 宁,袁 玲,彭一明,张治坤 (北京大学计算中心,北京100871) 摘 要:本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明 K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.关键词:作者名消歧;机器学习;文本特征提取 中图分类号:TP391.1   文献标识码:A   文章编号:0490-6756(2019)02-0241-05 收稿日期:2018-06-28 作者简介:邓可君(1986-),女,湖南长沙人,博士生,工程师,研究方向为信息处理.E-mail:kejund@pku.edu.cn通讯作者:张治坤.E-mail:zhangzhikun@pku.edu.cn Research on author name disambiguation method based on machine learning DENG Ke - Jun , HUA Kai , DENG Chang - Ming , JIANG Ning , YUAN Ling , PENG Yi - Ming , ZHANG Zhi - Kun ( Computer Center,Peking University,Beijing 100871,China) Abstract:This paper proposes an automatic article author name disambiguation method based on rule matching and machine learning.For each article,the candidate authors are determined based on artificialconstructed name matching rules firstly.For the cases of multiple candidates,features are extractedfrom the attribute information of the article,such as collaborators,title,abstract,key words and publi-cation name,and then selected machine learning models are applied to author name disambiguating.The experimental results show that the K-nearest neighbor and Softmax classifier are more suitable for theauthor name disambiguation task than other mod

参考文献

引证文献

问答

我要提问