2018年8月6日,由中科院自动化所承担的国家863计划“海量语言常识知识库建设与构建关键技术及系统” 课题在北京通过了高技术中心组织的技术验收。
“海量语言常识知识库建设与构建关键技术及系统”是“十二五”国家863计划信息技术领域的“基于大数据的类人智能关键技术与系统”主题项目中的课题。该课题主要研究内容包括:面向多源异构数据的学科知识获取,具体包括基于结构化、半结构化数据的知识体系构建、面向非结构化文本的三元组抽取;多种方式结合的语言知识获取,具体包括基于众包的语言知识获取新模式和形成名词、动词、形容词等多种语言知识库;基于RDF的知识管理与知识服务,具体包括高效率的海量知识检索和多功能的知识服务设计与应用。
课题系统性的研究并提出了面向非结构化文本的串联、关联、混合神经网络、融合注意力机制等基于深度学习的知识获取方法,部分成果发表在领域顶级会议ACL上,并被评选为outstanding paper。课题还针对海量分布式图知识库快速检索问题,提出了基于部分执行加归并、查询日志分析以及有效RDF源选择等分布式图知识库快速检索方法,大幅度提升图知识库性能。