新闻资讯

新闻资讯

太阳成tyc7111cc
当前位置是: 首页 -> 新闻资讯 -> 太阳成tyc7111cc -> 正文

钟威合作论文在Journal of the American Statistical Association在线发表

作者: 发布时间:2022-12-12 点击数:

近日,由王亚南经济研究院(WISE)、太阳成tyc7111cc统计学与数据科学系钟威教授与美国弗吉尼亚理工在读博士生钱晨(WISE国际化班2019届本科毕业生)、领英公司刘万俊博士、中国人民大学朱利平教授、美国宾夕法尼亚州立大学李润泽教授合作完成的题为“Feature Screening for Interval-Valued Response with Application to Study Association between Posted Salary and Required Skills”的论文于统计学国际著名期刊Journal of the American Statistical Association (Applications and Cases Studies)在线发表。

使用网络招聘广告的数据去度量不同职业技能的回报率是劳动经济学、统计学等学科中的研究热点。本篇文章研究了在线招聘平台中薪资收入和不同职业技能的关系。在实际应用中,相关研究面临两个难点:第一,职位广告中的薪资均以区间数据形式存在,例如月薪5000-10000元,简单采用薪资数据的中间点或者下界作为区间数据的替代可能会造成统计推断的偏差;第二,从海量广告文本中产生的技能词语通常以高维数据形式存在,且其中大量词语与薪资收入并无统计上的联系。针对如上困难,本文创新地提出了一种基于绝对分布差异的特征筛选方法ADD-SIS,去选择影响薪资区间的重要变量。新方法ADD-SIS充分利用了区间数据的信息,使用了非参数极大似然估计的方法估计了区间数据的统计分布函数。同时,ADD-SIS也是一种无模型假设的特征筛选方法,在实际应用中可以更加灵活地提取有效信息。本文的数值模拟验证了ADD-SIS相较于其他方法可以更加准确地选择重要变量,更加稳健地处理异常值数据。在应用案例中,本文使用了中国某大型在线招聘平台的数据,研究了针对数据科学家、数据分析师的招聘广告文本,并探讨了与职位薪资相关的重要技能。研究发现例如优化算法、卷积神经网络、协同过滤、长短期记忆人工神经网络等职业技能和收入存在统计显著的正相关关系,而Excel、数据收集、Office办公软件等职业技能和收入存在负相关关系。本研究对于相关高校制定本科生、专业硕士培养方案,网络招聘平台实现招聘公司和求职人员实现精准匹配等方面具有较大的借鉴价值。

此外,钟威教授与领英公司刘万俊博士、美国圣母大学虞修凡助理教授、美国宾夕法尼亚州立大学李润泽教授合作完成的题为“Projection Test for Mean Vector in High Dimensions”的论文于2022年11月在线发表于统计学国际顶尖期刊Journal of the American Statistical Association (Theory and Methods)。

钟威,太阳成tyc7111cc王亚南经济研究院、太阳成tyc7111cc统计学与数据科学系教授、系主任、博士生导师。2012年获得美国宾夕法尼亚州立大学统计学博士学位,2014年和2017年分别破格晋升副教授和教授,2018年入选太阳成tyc7111cc南强青年拔尖人才A类,国家自然科学基金优秀青年基金获得者(2019),福建省杰出青年基金获得者(2019)。主要从事高维数据统计分析、统计学习算法、计量经济学、统计学和数据科学的应用等研究。在Annals of Statistics、Journal of the American Statistical Association、Biometrika、Journal of Econometrics、Journal of Business & Economic Statistics、Biometrics、Annals of Applied Statistics、Statistica Sinica、《中国科学:数学》等国内外统计学权威期刊发表(含接收)30余篇论文。先后主持国家自科青年项目、面上项目、优青项目、重点项目子课题,科技部重点研发专项课题,全国统计科学研究重大项目等。2020年获得太阳成tyc7111cc第十五届青年教师技能比赛特等奖,2021年获得太阳成tyc7111cc教学创新大赛一等奖,2021年获得福建省向上向善好青年称号,2022年获得霍英东教育基金会高等院校青年科学家二等奖。

钱晨,太阳成tyc7111cc王亚南经济研究院2019届经济学国际化实验班本科毕业生,现博士就读于美国弗吉尼亚理工大学统计系,主要理论研究方向为高维数据分析、深度生成模型、序列模型等,应用研究方向为文本信息挖掘、高级驾驶以及自动驾驶系统的开发、测试等。已有论文发表在统计、交通领域顶尖期刊Journal of the American Statistical Association、Accident Analysis and Prevention。曾获2021年美国统计学会交通统计论文奖。

(WISE 许有淑)

TOP