-
重新认识语言文字研究的价值,助力人工智能技术的发展
演讲人:许嘉璐
Al离不开自然语言的自动化处理。自然语言处理离不开传统“小学”,尤其是其中的音韵、训诂之学。民族的语言和文字不仅是表达思想和人际交流的工具,而且是人(该民族)的思维方式、把握主客观及其关系的内心实在。HNC(概念层次网络)理论的创建、实践、发展在相当程度上闪烁着中华民族的智慧之光,与西方主流计算语言学学派有着巨大的区别。现代汉语是华夏古代语言的延续和发展,语言、文字和文化的DNA就蕴涵于现代人人在说、在写的语言和文字之中,察觉之,体认之,运用之,虽然不同学者、不同团队会有视角。方法、技术之异,但却不能无视它,回避它,否认它,否则将捕捉不到中国语言文字的脉搏、神经和感情,难以适合本民族对“人工智能”的需求。例如“劦”“協”“恊”“昶”四字皆“因音而得义”,字形虽孳多,义则未离“同和”之基因。而“协”字在有其组成的“协作”“协同”“协奏”“协定”“妥协”等现代双音词中表义偏重,亦折射出其义贳穿于今。仅仅依靠现代字词典的解释,难以窥其义所来之源与脉。
-
语言智能技术未来发展及应用若干思
演讲人:李启虎
语言是思维的物质外壳,也是人们传递信息、思想、情感最自然最直接、最方便的工具。计算机为处理语言信息提供了技术基础,推动了语言智能技术形成和发展。在人工智能概念提出时,自然语言理解也是核心研究内容之一。语言智能技术期望让计算机拥有人类的语言智能涉及从表屋的语音到深层的内容处理。自然语言自身的特占决定了语言智能技术面蓝巨大的排战,需要寻找有效方法以获取言语和文本中的真实内容,建立口语、书面语和有效的语义表达之间精确映射的机制,并形成具有学习能力的知识系统,支撑各种语言信息处理的需要。近十年来,随着信息技术的发展,社会信息化水平不断提高,特别是大数据、云计算以及各种智能终端的普及,为语言智能技术提供了良好的应用环境,机器学习、深度学习为语言智能技术带来了新的活力,推进技术不断走向实用。语言智能技术的相关产品也得到市场的积极反馈,根据Gartner发布的《2018世界人工智能产业发展蓝皮书》,到2021年,全球自然语言处理市场的价值预计会达到160亿美元。
-
丝绸之路经济带多语言互译平台
演讲人:吾守尔·斯拉木
介绍共同把握数字化、网络化、智能化发展机谓,建设数字丝绸之路、创新丝绸之路的必要性和研究意义,阐述丝绸之路多语言互译平台对商贸、旅游、文化传播的促进作用。介绍丝绸之路经济带多语言互译平台的的关键核心技术:多语言智能理解技术机器翻译方法和模型构建。多语言语音识别和合成技术多语言语料库构建技术-技术路线:基于汉语与维语之间的互译,实现汉语与其他语言的直接信息交换展示实验室的研究基础、正在开展的工作,展示智能语音翻译、机器翻译等研究成果展示互译平台在传统和新兴领域的应用及研究方向,需要突破的技术难点,呼吁各机构、学者共同努力,突破认知计算、混合智能的许多关键技术,构建新的混合智能平台和智能机器,为推进国家和“一带一路”战略提供有力支撑。
-
语义表示与解码
演讲人:宗成庆
近年来,神经网络方法在自然语言处理中得到了成功应用,自然语言处理系统的性能得到了大幅度提高,但是如何准确地表示和计算语义,实现从“处理”到“理解”的跨越,建立真正基于理解的高水平自然语言处理系统,是当然该领域面临的核心问题。本报告将介绍自然语言表示和解码相关的几项研究成果,对自然语言认知计算的基本方法进行初步的探讨。
-
机器推理:综合知识和预训练模型更好地理解语言
演讲人:周明
自然语言处理进入了以深度学习为主流的时代。其主要的技术包括词的表示、句子的表示、编码解码机制、Transformer。以及最近流行的预训练模型。形成了基千预训练模型加微调的新的框架。但是深度学习仍然面临过分依赖大规模标注数据、不可解释、处理知识和常识的能力薄弱,推理能力欠缺等缺陷。这些领域都期待着更多的研究。本讲座重点讲述推理问题,陈述如何利用知识和预训练模型进行推理,并利用几个典型的推理任务,比如语义分析、FEVER、CommonsenseQA、GQA等说明推理的机制。本讲座的工作虽然还在初级阶段,但是我希望引起大家对推理的研究的重视。