[ 导读 ] 2017机器智能前沿论坛今日在中国工程院讲演厅胜利举行。清华大学计算机系副教授唐杰发表主题演讲,并为大家引见了数据科学研讨院AMiner团队自主研发的研讨者社会网络发掘与搜索系统——AMiner及近期研讨成果。 提到AMiner能够做什么,他举例:阿里巴巴不时关注AI范畴,包含今年树立达摩院,十分需求引进相关人才,针对这一方面阿里巴巴与AMiner达成协作。AMiner系统能够经过对AI做范畴梳理划分,再剖析各细分范畴的专家信息,最终完成精准学术画像,为阿里提供人才信息。唐杰教员还提到了包含亿级学术信息,并自动剖析关联的开放学问图谱,可供大家用于研讨。 开放学问图谱地址:https://aminer.org/open-academic-graph
随后,唐杰教员为大家展示了AMiner团队发布的半个世纪以来顶级学者迁移视频,这是AMiner在对全球 1.3亿研讨者进行精准画像的基础上做出来的研讨者生活职业变更图。这个视频包含了全球10,000名顶级研讨者(依据发表论文援用计算的个人h-index最高的研讨者)的职业天文位置迁移图。 从MS-DOS发明、第一个个人数字助理,到第一台iPhone,用基因措施修正人类胚胎,随同人才的活动,展示科技延展图景。从图中能够明晰的看到在过去50年,人才从欧洲到美国、从美国东海岸到西海岸、从美国到中国的活动,以及愈加全球化的变更。 认真查看,还能够看出上世纪70年代整个亚洲的顶级人才都相对较少,少数集中在以色列、日本,印度和澳大利亚也有一些;到80年代中叶,中国开端有吸收了少量顶级学者(大多是顶级华裔学者回归),但全球这个时分的顶尖人才大多散布在美国(特别是东海岸)、英国和西欧,回归国内的学者主要集中在北京、上海和南京;到90年的时分,中国顶尖人才数量在亚洲曾经超越印度,而且散布也更广,不再仅仅局限于北上广,但数量上总体还不迭日本;到2000年以后中国和欧美的交流大大增强,回归国内的全球顶尖学者也大大增加,而且很多顶尖学者开端回到内地,这个时期香港的延展抵达高峰;最近几年这个趋向得到进一步增强。从到目前为止的散布来看,全球顶尖学者更多的还是在美国和欧洲,但中国乃至亚洲都得到极大的延展。 另外,该视频还展示了每年最严重的科技理论,包含从计算机的呈现和延展、互联网的萌芽、全球信息化的开端、互联网的提高、移动互联网的兴起等科技大事情。 这个工作的难点包含两个,一个是数据缺失,很多研讨者的信息缺失,很难拿到一切学者每年的职业变更信息,我们运用机器学习算法自动对缺失数据进行补全。另一个难点是很多人的名字存在重名现象,我们设计了一个高效的命名排歧算法,并对辨认出来的职业信息进行平滑化,自动纠正了大量辨认错误,经过这两个方面的优化,目前自动辨认精度抵达90%以上。 除此之外,AMiner团队得到了几个有意义的结果。一是欧美之间坚持着十分生动的学术交流。“我们直觉上以为,进入21世纪后,中美两国在学术上愈加生动,特别是在计算机科学范畴,”唐杰说:“从文章发表数量上看,欧洲相对来说没有那么多。”但实践上,依据这次半世纪人才迁移调查,团队发现欧美之间学术交流依旧坚持在一个十分高的水平。 其次,中国依旧处于顶级学术起步阶段。“最近中国的强势表示让我们有一种‘中国曾经成为学术中心’的错觉,”唐杰说,实践上我们才刚刚起步,仍有很长的路要走。 再来是在计算机科学范畴,很多人可能会以为谷歌、Facebook等大公司所在的硅谷是CS生动地域,但实践上美国东部,有CMU、MIT所在的学术重镇,其实力和影响力都十分惊人。 唐杰通知新智元,这次的数据只是一个初步的展示,包含了各个学科及范畴的人才活动状况。接下来AMiner团队将会发布的版本计划添加新的功用,包含让用户能够指定学科和范畴(好比AI),搜索该分类的人才活动状况。 来自AMiner的最新更新,唐杰教授4日在微博上发音讯说:给大家分享一个AMiner自动生成的技术趋向预测“人工智能”,能够自动发现子范畴;剖析近期热度、全局热度;能够追溯技术源头;能够发现每个子范畴历史来重要人物。 AMiner团队将不时的推出更多科技大数据的深度洞察讲演和情报剖析结果,让您“洞察科技,掌握趋向”。 这还只是预览版,不久后将有更完善版本发布:
此前,AMiner曾经绘制过一副AI历史图,标出了AI历史节点上的关键概念和人物: (点击图片查看高清大图)
以下就是AMiner团队“半世纪全球顶级学者迁移图”的调查结果。每张图中的蓝色线条表示顶级人才的迁移状况(视频中能够看到活动方向)。 每一年,团队都选择了代表性的人物和/或事情。这个选择的规范是依据当年论文的援用状况、著名的学术获奖(好比诺贝尔奖)等多项指标进行的排名。
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
文章选自数据派THU,2017年11月4日 |