第13届全国计算机支持的协同工作与社会计算学术会议-z6尊龙旗舰厅

青年论坛一

面向知识图谱的自然语言问答研究

邹磊

(排名不分先后)

摘要：自然语言问答(qa)是指利用各种技术和数据对用户提出的自然语言问题直接给出问题答案。qa任务根据所依赖的数据形态可以分成三类，分别是基于知识库的问答(kb-qa)、基于文档的问答(db-qa)和社区问答(c-qa)。本次报告主要关注面向知识图谱的问答系统。知识图谱是目前知识库的一种常见的表达形式，是以图形（graph）的方式来展现“实体”、实体“属性”，以及实体之间的“关系”。近年来随着大数据，人工智能等概念与技术的兴起，知识图谱和kb-qa相关的研究工作和工业应用逐渐引起重视。例如由amazon收购的evi系统（原名为trueknowledge），就是一种面向开放领域的结构化知识的问答系统。facebook定义的facebook social graph，用于连接社交网络的用户，用户分享的照片，电影，评论；在所构建的social graph基础上，facebook推出了graph search（图搜索）功能，即将用户的自然语言问题，转化为面向social graph上的图搜索问题，从而回答用户的自然语言问题。另外越来越多的chatbot（聊天机器人）产品中也引入了面向知识图谱的问答功能，使得chatbot和人交互时用户可以获得更多知识方面的回答。 ibm的watson系统在参加智力问答节目《危险边缘》(jeopardy)的比赛时，也同样采用dbpedia和yago知识图谱数据来回答某些自然语言问题。本次报告主要介绍目前学术界和工业界面向知识图谱问答的主要关键技术和我们组在面向知识图谱的自然语言问答系统方面的工作ganswer。

报告人简介：邹磊，北京大学计算机科学技术研究所教授、国家自然科学基金委优秀青年基金项目获得者，北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库，rdf知识图谱，尤其是基于图的rdf数据管理。邹磊及其团队构建了面向海量rdf知识图谱数据（超过100亿三元组规模）的开源图数据库系统。邹磊已经发表了30余篇国内外学术论文，包括数据库领域国际顶级期刊/会议论文（sigmod，vldb等）近20余篇；其论文被引用超过1200多次（根据google scholar的统计），单篇最高被引用298余次。邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖（排名第一）。

青年论坛二

推荐算法的泛化能力研究

李东胜

(排名不分先后)

摘要：推荐系统目前广泛应用于各类与人们日常生活息息相关的信息系统中，如电子商务、社交网络、内容服务、生活服务等。近年来，基于矩阵分解方法的协同过滤算法成为当前推荐系统中最流行的推荐算法之一。在真实的推荐系统中，由于训练数据异构、稀疏并且噪声大，矩阵分解方法难以训练出具有较强泛化能力的模型，导致模型在测试数据上的准确性较差。针对上述问题，本报告重点介绍下述三个工作：1）一种稳定的矩阵分解算法来降低矩阵分解算法的uniform stability bound，能够提升推荐算法的泛化能力和准确性（相关成果发表在icml 2016）； 2）可降低矩阵分解算法期望误差的推荐方法，通过动态调节样本的权重来降低矩阵分解算法的期望误差界（相关成果发表在aaai 2017）； 3）一种混合秩矩阵分解算法，用不同低秩矩阵近似的混合模型来刻画用户-物品评分矩阵，实现了目前在movielens和netflix这两大公开数据集上迄今为止最高的推荐准确性（相关成果发表在nips 2017）。

报告人简介：李东胜，男，ibm中国研究院高级研究员。2012年毕业于复旦大学，获得计算机软件与理论专业博士学位。2016-2018年连续3年获得ibm杰出技术成就奖（ibm outstanding achievement award），并3次获得ibm发明成就奖 (ibm invention achievement award)。担任aaai 2017和aaai 2018的pc member，担任nips, aaai, ijcai, neurocomp等知名会议和期刊的审稿人。一直从事推荐算法的研究，近年来在信息推荐的知名国际会议和期刊发表论文20余篇（其中在icml、nips、sigir、www、aaai、ijcai等ccf a类会议上发表论文7篇），获得发明专利2项，软件著作权1项，申请国际专利10余项。

青年论坛三

面向软件bug的群智软件工程

江贺

(排名不分先后)

摘要：基于互联网的软件开发支持工具产生了海量的具备大数据特征的软件开发数据，为群智软件工程带来了新的挑战和机遇。围绕软件bug仓库数据，本报告重点介绍bug仓库知识化和bug仓库智能化两大主题。在bug仓库知识化中，介绍bug报告自动生成技术、bug冗余数据处理、基准实例构建与求解。在bug仓库智能化方面，重点分析bug报告智能分派技术、新需求bug推荐参考代码技术等。

报告人简介：江贺，1980年生，男，汉族，大连理工大学教授、北京理工大学兼职教授、国家优秀青年科学基金获得者。目前主要研究兴趣为智能软件工程。先后在ieee系列汇刊（tse, tkde, tsmcb, tcyb,tsc）, ecj,中国科学等期刊及icse,saner等国际会议发表论文70余篇，在科学出版社出版专著一部。 2013年获得大连市五一特等奖章。2013年入选教育部新世纪优秀人才计划。2014年指导博士生获得中国计算机学会优秀博士学位论文奖（ccf优博）。 2016年获得东软-nasac青年软件创新奖。2017年获得国家自然科学基金优秀青年科学基金资助。

青年论坛四

data-assisted evolutionary algorithms

陈伟能

(排名不分先后)

摘要：演化计算和群体智能方法，是通过模拟自然界中群体的智能现象和行为来求解问题的一类方法。由于它不依赖于待解问题的数学模型特性，在解决复杂的优化问题时具有独特的优势，为解决大数据环境下的复杂搜索和优化问题提供了一条新的可行途径。本报告将阐述演化计算和群体智能方法在大数据环境中面临的主要挑战，介绍数据驱动的演化计算方法的发展，着重从算法设计的角度介绍我们在相关领域的探索，并讨论这些方法的在实际工程领域的应用。

报告人简介：陈伟能，华南理工大学计算机科学与工程学院教授，博士生导师，国家优秀青年科学基金获得者、广东省自然科学杰出青年基金获得者、首批“广东特支计划”科技创新青年拔尖人才、广州市珠江科技新星、英国皇家学会newton fund基金获得者，获第十六届霍英东青年教师奖二等奖，ieee cis（计算智能学会）2016年度杰出博士学位论文奖（全球评选1篇），2012年度中国计算机学会（ccf）优秀博士学位论文奖。现任中国计算机学会人工智能与模式识别专业委员会委员，ieee广州分会副主席，多次获邀出任ieee wcci等领域内重要国际会议的程序委员会委员。主要研究方向是计算智能、运筹优化与云计算，已发表国际期刊和国际会议论文80余篇，其中ieee transactions长文20余篇，主持国家自然科学基金等国家、省部级科研项目8项，是科技部重点领域（机器智能）创新团队的核心成员。

青年论坛五

取之于民，用之于民：一次群智感知实践

刘亮

(排名不分先后)

摘要：本报告将介绍一种城市中利用手机拍照实现的细粒度空气质量监测方法。依据摄像头的成像原理，我们发现照片能见度与空气中尘霾浓度之间存在相关性，并利用机器学习方法建立起量化模型。具体来说，我们采用群智感知的方式，激励手机用户在空气质量站点附近收集了50000多张照片作为训练集。对于每张照片，在非天空部分提取dark channel特征，然后使用cnn进行模型训练，进而利用lstm对天气数据进行训练，联合两个模型，实现pm2.5的准确估计。基于此，我们开发了一款手机app，可通过多个用户使用形成的无意识协作，实现城市空气质量的细粒度监测。

报告人简介：刘亮，北京邮电大学计算机学院教授、博士生导师、副院长，国家自然科学基金优秀青年基金获得者。2009年在北京邮电大学获博士学位，曾在美国tamu进行访问研究。研究方向为物联网、智能感知网络。主持和参与多项国家自然科学基金、国家973/863项目和企业研发项目。在ieee trans./journal、infocom、icc、globecom等刊物和会议上发表论文100多篇。担任期刊frontiers of computer science、china communication编委、international journal of distributed sensor networks客座编辑；infocom、icc、globecom等著名学术会议程序委员；10多个重要国际学术刊物的评阅人。曾获中国计算机学会优秀博士学位论文奖、acm beijing rising star award。

青年论坛六

在线社交媒体分析与挖掘

沈华伟

(排名不分先后)

摘要：近年来，以微博、微信等为代表的在线社交媒体逐渐成为人们发布、传播和获取信息的主要媒介。社交媒体汇聚了大量的用户关系数据和信息传播数据，为分析和研究人类社会活动提供了弥足珍贵的数据资源。社交媒体中数据多源异构、个体间关系繁杂、信息传播突发等特点给社交媒体分析提出了科学技术挑战。分析社交网络的结构规律、挖掘用户行为的固有模式、探索网络信息传播的内在机理、研究高效的社交网络分析与网络信息传播预测方法，有利于提升对在线社交媒体的科学认知水平和有