淘优惠

淘优惠

思辨与言说|ChatGPT使日常语言视角的人类学更加重要

热门文章 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

思辨与言说,思辨说理,思辨语言,《思辨与立场》
最近几年探讨日常语言视角的人类学,我有时也会对人工智能语言翻译的搞法了解一下。最近ChatGPT火大了,人文社会科学领域也坐不住。人类学中有人用它来做专业题,向它提问,然后通过朋友圈发ChatGPT的作文,惊呼了得。也有很多同行用业内话题逗弄ChatGDP,或去调侃,让它的输出结果荒谬和好笑。例如,有人出题:“中国人类学如何能成为一级学科”。结果当然是全网笑声。 2022年末,上海复兴公园,来到这里活动的人,相互打着招呼。澎湃新闻记者 周平浪 图 多年来不时被新技术概念及其资本忽悠过的人,会本能认为这不过是资本的概念炒作。我完全认同这种“不过资本玩概念”的看法。但 人类学人之中,确实少有人从专业的看家本领,即跨文化语言翻译和民族志写作的角度做讨论。 我前些日子看过几篇有关自然语言处理(NLP)的文章,心里倒是有些看法。我感到,人类学确实有人工智能无法取代的部分,这些部分与我们平时说的人类语言的真值性和差异性有关。就此而言,ChatGPT等人工智能,包括谷歌翻译等工具,很大程度上取代非创造性和工具语言性的工作后, 人类学在日常语言视角下的民族志写作,更显出不可取代的价值。或者说,ChatGPT使日常语言视角的人类学更加重要。我以为,在AI技术进步的映照下,日常语言视角的方向,更应当成为人类学的重要着力点和支点。 道理不太复杂,对自然语言处理有所了解就知道。AI都称作“以自然语言处理为基础”,一般的读者读到此,就会放过所有更基本的问题,不再质疑 所谓“自然语言处理”与人类语言表达之间的差别。 实际上,正是这个所谓“自然语言处理”显出AI不可能取代人类的心智-语言。AI的自然语言处理,实际是用算法派给人类语言的一些“语法”或规则。例如,将自然语言按照词向量派给词汇,如“猫”和“狗”的相似度(余弦相似度和距离相似度等)会大于“猫”和“人”的相似度。自然语言处理依赖于海量数据,或“大型语言模型被输入由数十亿单词组成的数据集,并基于统计概率,建立一个通常跟随前一段文本的单词和句子的模型”。这些文字集合的模型,就是翻译的语言和各种说明文或论说等。就当下的教育科研中,很多作文或论文是言之无物的“好词好句”或互相抄来抄去的文字而言,ChatGPT确实是能替代这些工作的一个好工具。甚至也能很好地胜过不少诗人的“作品”。 而在人类学领域,我们会认为,语言并不只是“话赶话”1这种跟随前一段文字的句子模型, 语言的本质是它有关于现实世界的真或假的一面,写出“真”和辨识“假”正是社会科学的任务2。从日常语言视角人类学看, 人类语言有“真”。这种“真”是与话说出的“土地”和生活形式等有关;这种“真”往往就近与“方言”和地方世界相连3。日常语言视角人类学的以上预设,使它与AI的自然语言处理虽然看上去只有毫厘之差,实际上却谬之千里。 总之,用AI的自然语言处理,你无法去建立话与世界之间的真关系。因为 语言的真,是人的心智-言语-世界之间的关系,计算机对语言的真内容是不懂的。发现语言之真或实,是人类学田野调查的目标,将这种真以文本或其他媒介(如音像)呈现则是民族志的任务。 认识清楚AI的自然语言处理的基础,就知道它确实无法取代心智-语言。特别是,能从人类学角度认识到, 差异的语言不仅是世界观差异,而是话语说出的那个世界的差异。这会使我们更坚定认为,在ChatGPT喧嚣之下,人类学的方向和能取得的成就是AI无法改变的。 写到这里,想起过去的一篇小文,其中有几段如下: “十年前访问法国时,曾经在那里的乡下听一个修复古琴的师傅和制古竖琴者谈音乐时,说过一番与这里有关联的话。后来我写了一篇小文提到此事: 忘了是在谈到什么话题的时候,我听到他们讲出这样的话,‘(电子) 键盘的出现就是人类的末日’,我问他们这话如何理解。他们说了一堆,大概意思是:五音是要由乐师的耳朵来分辨的,乐师如同巫师,他在定五音的时候,是在与神交流,是从神那里听到五音。键盘则用算法将人与神的联系终止了,人再也听不到神的声音。”4 于是乎,可以联想到人类语言有AI算法不可替代的“通神”话音和话说。是否通神姑且不谈,人类说话中有真内容,它们是“自然语言处理”的结果不具有的。 注 1、此处的“话赶话”是指这个词的一种表面的、形式的意思。而在日常语言中,“话赶话”也是有“真”的,并非这种形式上的意思。比如说两个人因小事吵架,结果因为话赶话,越吵越凶。(来自林叶博士建议) 2、牛津大学(University of Oxford)计算机科学教授迈克尔·伍尔德里奇(Michael Wooldridge)说:“网络对什么是‘真’或‘假’没有任何概念。他们只是尽可能地写出最有可能的文本来回答所给的问题或提示。因此,大型语言模型经常出错。”ChatGPT太火,这些人却给它泼冷水,澎湃新闻记者 吴天一,2023-02-10 18:49 来源:澎湃新闻 3、方言的真理性,可举海德格尔晚期对德国方言诗人的研究为例。(海德格尔:《语言与家乡》,《思的经验》,陈春文 译,商务印书馆,2018,第146页)。海德格尔:《在通往语言的途中》,孙周兴 译,商务印书馆,2004,第210-211页。海德格尔:《黑贝尔的语言》,《黑贝尔――乡愁之魂》,《语言与家乡》,见《思的经验》,商务印书馆,2018。 4、朱晓阳,《法国的水泊梁山》,《金融博览》,2013年第3期。

打不过就拉拢!ChatGPT和MidJourney已经成我小秘书!太爽了

打不过就耍赖,打不过就加入出处,打不过就躲怎么说,打不过就下一句是什么
游戏腾讯云开发者社区API自然语言自然语言处理张晓衡 34分钟前2023-02-23 13:26:31这两周,我战斗力爆棚了!每天大概睡了四~五个小时,而且中午也没有休息过,但精神却还很亢奋。2自然语言处理腾讯云测试服务腾讯云开发者社区lyhue1991 51分钟前2023-02-23 13:09:27这节只列举问题,思路放下一章。这里是给大家去定位问题的思路,通过这些渠道能发现一些问题,而不是对问题束手无策了。1自然语言处理编程算法腾讯云开发者社区lyhue1991 51分钟前2023-02-23 13:08:58老系列分为NLP.TM、R&S和ML&DEV三个系列。由于规划问题,很多文章可能会属于这里的多个系列,不好整理,所以目前已停止更新,但已写的文章不会重新改系列。2编程算法网站自然语言处理深度学习lyhue1991 1小时前2023-02-23 12:01:57今天给大家推荐一位我的好友:圆圆,国内Top互联网大厂的算法工程师,同时也是公众号【圆圆的算法笔记】的主理人。8自然语言处理开源GitHubpytorch脑机接口社区 3小时前2023-02-23 10:26:03近日,火爆全网的 ChatGPT,仿佛开启了第四次工业革命,将微软、谷歌等全球科技巨头打得昏天黑地,引得各路玩家纷纷入局,抢占赛道。12腾讯云测试服务自然语言处理网络安全脑机接口社区 3小时前2023-02-23 10:23:33“原本认为是人类独有的心智理论(Theory of Mind,ToM),已经出现在ChatGPT背后的AI模型上。”这是来自斯坦福大学的最新研究结论,一经发出就...8人工智能神经网络深度学习自然语言处理gemron的空间 3小时前2023-02-23 10:15:46上周是聊天机器人驱动的搜索引擎应该到来的一周。最重要的想法是,这些人工智能机器人将通过生成对我们问题的闲聊答案来颠覆我们搜索网络的体验,而不是像现在的搜索那样只...4搜索引擎自然语言处理人工智能汐语 4小时前2023-02-23 09:40:48关注互联网新闻的可能知道,有个重磅新闻那便是微软在近期推出了首款 ChatGPT 版搜索引擎,我听到这个消息刚开始还是很震撼的(因为我之前玩过Chatgpt,感...3自然语言处理内容安全应用安全绿盟科技研究通讯 16小时前2023-02-22 21:01:34依据Wiki百科的介绍,ChatGPT是一种尚处于原型阶段的人工智能聊天机器人。ChatGPT由OpenAI公司在2022年11月30日发布。在同样由OpenA...141机器学习深度学习神经网络人工智能自然语言处理合合技术团队 2天前2023-02-21 10:37:49是信息高度精炼集中,方便信息的检索和比较。表格被广泛用于表示结构和功能信息,它们出现在不同种类的文献中,包括报纸、研究论文和科学文件等。表格使读者能够快速地比较...633自然语言处理游戏编程算法用户10371657 2天前2023-02-20 16:16:57OpenAI 新上线的 ChatGPT 可谓是火爆出圈,这个对话模型可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug……1373自然语言处理网络安全神经网络强化学习腾讯技术工程官方号腾讯 ・ 产品经理 (已认证) 5天前2023-02-17 18:40:11本节的主要目的是介绍自然语言处理中语言模型的一些基础知识,理解语言模型到底在做什么。1402网站自然语言自然语言处理搜索引擎Maynor 6天前2023-02-17 11:32:32这款新的必应功能允许用户通过自然语言方式与chatgpt进行交流,以获得快速、准确的信息。chatgpt使用了先进的自然语言处理技术,能够理解用户的询问并回答相...3304自然语言处理监督学习数据库SQLDrugAI 6天前2023-02-17 10:42:55今天给大家介绍的是南开大学王文恺博士发表在nature computational science上的文章《Single-sequence protein st...763APIPython自然语言处理红目香薰 6天前2023-02-17 09:52:15看着问题不大,有核心的代码交换,递归都能看到。字符格式化起来好麻烦,看着对就不测试了。1063自然语言处理自然语言图像处理机器学习神经网络腾讯高校合作 6天前2023-02-16 17:10:30腾讯AI Lab犀牛鸟专项研究计划侧重原创性引领性科技攻关,2023年度开放机器学习、计算机视觉与图形学、自然语言处理、语音技术、机器人等五大研究主题,立项20...1593自然语言处理网络安全强化学习人工智能日报 6天前2023-02-16 15:56:22ChatGPT是OpenAI最新的语言模型,较其前身GPT-3有大幅提高。与其他大型语言模型一样,ChatGPT能够以不同的样式和目的生成文本,并且在准确度、叙...1363自然语言处理联邦学习机器学习监督学习迁移学习液冷服务器 6天前2023-02-16 14:20:34当今社会是科技的社会,是算力快速发展的时代。随着数据中心、东数西算、高性能计算、数据分析、数据挖掘的快速发展,大模型得到了快速地发展。大模型是“大算力+强算法”...961API自然语言处理人工智能神经网络深度学习测试开发技术 7天前2023-02-16 09:32:40最近一段时间chatGPT火爆出圈!无论是在互联网行业,还是其他各行业都赚足了话题。964机器学习神经网络深度学习人工智能自然语言处理智药邦 7天前2023-02-15 17:37:20最近,在大型未标记语料库上预处理的基于无监督Transformer的语言模型在许多下游自然语言处理任务中产生了最先进的结果。受这一发展的启发,作者提出了通过训练...893

nlpt技术是什么 nlp技术突破


机器之心原创 机器之心编辑部 ChatGPT 军备赛开幕,哪些国内机构具备打造下一个 ChatGPT 的实力? 自从 2022 年底 ChatGPT 发布以来,海内外就掀起了一阵狂潮。推出仅两个月,ChatGPT 月活用户突破 1 亿,成为了史上用户增长速度最快的消费级应用程序。 ChatGPT 成为了搅动人工智能领域风云的新势力,其背后的 OpenAI 也因此成为了当下最热门的 AI 公司,甚至引发了科技巨头们的深度焦虑。 谷歌和微软两家科技巨头正在 ChatGPT 搜索上进行激烈竞争,先后宣布了将大型语言模型(LLM)整合到 Google 和 Bing 搜索中的计划。更有众多互联网公司迅速跟进,掀起了科技领域的又一场「军备竞赛」。有些机构开始着手研究同类型产品,有些机构从零开始布局对话式 AI 背后的一系列相关技术。 中国版 ChatGPT 将诞生于何处,也成为了大众最关心的问题之一。 鉴于 ChatGPT 是多项 AI 技术的集大成者,远非「一日之功」。这背后离不开算力、数据、人才等资源的支持。环顾国内群雄,谁最有可能造出下一个 ChatGPT? 在这篇文章中,机器之心将盘点国内最具实力的一批学术型机构和 NLP 研究领域带头人,共分为高校、大厂、非营利研究机构、初创公司四个部分,供大家参考、讨论。 如有盘点错误的地方,欢迎指正。 高校 清华大学自然语言处理与社会人文计算实验室 清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于 20 世纪 70 年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位。实验室围绕以中文为核心的自然语言处理,在大规模预训练模型、中文信息处理、机器翻译、社会计算、智慧教育和知识图谱等方面开展了系统深入的研究。 实验室学科带头人是孙茂松教授,教师团队包括刘洋教授和刘知远副教授。近年来,该实验室承担了一系列国家重点研发项目、国家社会科学基金重大项目等重要研究任务,并与腾讯、华为、阿里、美团等企业建立了密切的学术合作关系。相关成果产生的 Github 开源工具包共获数万星标。 代表成员: 孙茂松,THUNLP 实验室学术带头人,清华大学计算机与科学技术系长聘教授,清华大学人工智能研究院常务副院长,欧洲科学院外籍院士,中国人工智能学会、中国中文信息处理学会会士。研究方向为自然语言理解、中文信息处理、Web 智能、社会计算和计算教育学等。近几年在人工智能和自然语言处理领域顶级国际期刊或会议发表论文 200 余篇,获得国家授权发明专利 50 余项。作为首席科学家主持完成国家重点基础研究发展计划(973 计划)项目,国家社会科学基金重大项目。领衔研发中文诗歌自动生成系统「九歌」,累计为用户创作 3000 万首诗词。 刘洋,清华大学计算机科学与技术系长聘教授,清华大学智能产业研究院副院长,国家杰出青年基金获得者。担任中国人工智能学会组织工作委员会副秘书长、中国中文信息学会计算语言学专委会常务副主任。研究方向是自然语言处理、机器翻译,获得国家科技进步二等奖 1 项、省部级科技奖励 4 项、重要国际会议优秀论文奖 2 项。 刘知远,清华大学计算机科学与技术系长聘副教授。主要研究方向为表示学习、知识图谱和社会计算。已在 ACL、EMNLP、AAAI、IJCAI 等人工智能领域的著名国际期刊和会议发表相关论文 100 余篇,Google Scholar 统计引用 2.3 万次。曾获教育部自然科学一等奖(第 2 完成人)、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖(第 2 完成人)、中国中文信息学会汉王青年创新奖,入选国家级青年人才、北京智源研究院青年科学家、2020 年 Elsevier 中国高被引学者、中国科学青年人才托举工程。 代表成果: 清华大学知识工程实验室 清华大学知识工程实验室隶属于清华大学计算机系,同时承担了清华大学人工智能研究院知识智能中心、清华大学 - 中国工程院知识智能联合研究中心、互联网教育智能技术及应用国家工程实验室知识建模与分析中心的研究工作。实验室成立于 1996 年,致力于网络环境下知识工程理论、方法和应用研究,主要研究内容包括:知识图谱、社会网络、新闻挖掘等。研究成果在相关领域的 ACM/IEEE Transaction 以及计算机学会指定的 A 类国际期刊、会议上发表百余篇高水平论文,Google Scholar 统计论文引用次数 1 万余次。发表在顶级国际会议(KDD)和权威期刊(TKDE)的论文引用次数排列前茅。 实验室在理论与应用研究结合方面成绩显著,构建了国内大规模跨语言知识图谱(http://XLore.org)、国内第一个全学科基础教育知识图谱(http://eduKG.cn)、科技情报大数据分析挖掘系统(http://AMiner.cn)、新闻挖掘分析系统(http://NewsMiner.net)。研究成果服务于华为、阿里、腾讯、搜狗等互联网公司以及中国科协、科技部、国家基金委、中国工程院等政府部门与研究机构,先后获得中国人工智能学会科技进步一等奖和北京市科技进步一等奖等多项奖励。 代表成员: 李涓子,清华大学计算机科学与技术系长聘教授,清华大学人工智能研究院知识智能中心主任,中国中文信息学会语言与知识计算专委会主任。2000 年在清华大学获得博士学位,研究领域为知识图谱、新闻与社会网络挖掘。主持研发了基于语义链接的跨语言知识图谱 XLORE,参与研发了研究者社会网络挖掘和服务系统 AMiner,曾获北京市科技进步一等奖、人工智能学会科技创新一等奖、王选新闻科学技术进步一等奖等多个奖项。 唐杰,清华大学计算机系教授,曾入选 ACM Fellow、IEEE Fellow。主要研究领域包括人工智能、认知图谱、数据挖掘、社交网络和机器学习。2006 年毕业于清华大学,获博士学位。唐杰曾主持研发了参数规模超过 1.75 万亿的超大规模预训练模型「悟道」,以及研究者社会网络挖掘系统 AMiner,吸引了全球 220 个国家和地区的 2000 多万用户。 代表成果: 开源双语千亿预训练模型 GLM-130B 项目原作解读转载 清华大学交互式人工智能(CoAI)课题组 清华大学交互式人工智能课题组 (Conversational AI, CoAI) 隶属于清华大学计算机系、清华大学人工智能研究院。交互式人工智能是指通过对话、问答等语言交互方式体现出来的智能行为,是人工智能最具挑战性、最综合性的技术,涵盖了语义理解、知识表示、逻辑与推理、语言生成等各个方面。 课题组由朱小燕教授、黄民烈副教授指导,与众多国内外知名企业建立了广泛合作,例如华为、谷歌、微软、惠普、三星、斯伦贝谢、腾讯、阿里巴巴、搜狗、美团、好未来等。 代表成员: 朱小燕,清华大学计算机系教授、博士生导师。曾任智能技术与系统国家重点实验室主任、北京市计算机学会副理事长、清华大学计算机系副主任、加拿大国际开发研究中心(DIRC)首席科学家。1982 年获北京科技大学学士学位,1987 年获日本神户大学硕士学位,1990 年获日本名古屋工业大学博士学位,1993 年到清华大学任教。长期在智能信息处理领域开展深入研究,在人工神经元网络、机器学习、自然语言处理、信息获取、智能问答系统、交互智能和人机交互等方面取得显著成果。 黄民烈,清华大学计算机系长聘副教授,2000 年毕业于清华大学工程物理系,2006 年获清华大学计算机科学与技术博士学位。研究兴趣主要集中在人工智能与机器学习方法包括深度学习、强化学习等,自然语言处理方法与应用,包括自动问答、阅读理解、对话系统、情感分析等。主要研究语言理解、语言生成、语言匹配与推理中的科学问题,致力于解决对话系统、自动问答、阅读理解中具有挑战性的人工智能问题。曾获得汉王青年创新奖、微软合作研究奖(Microsoft Collaborative Research Award)、IJCAI-ECAI 2018 杰出论文奖、CCL 2018 最佳系统展示奖、NLPCC 2015 最佳论文奖。 代表成果: 清华大学交互式人工智能课题组(CoAI)长期以来一直致力于构建开源的中文开放领域对话预训练基座模型,已有成果包括 CDial-GPT 、 EVA1.0、 EVA2.0、OPD 等。 推荐阅读: 大规模、高性能,清华、聆心智能推出中文开放域对话预训练开源模型 OPD 北京大学人工智能研究院自然语言处理研究中心 北京大学人工智能研究院自然语言处理研究中心将以研发通用自然语言处理技术为目标,探索通用自然语言处理理论、方法和技术体系,研究通用性鲁棒性强且支持跨模态的自然语言理解与生成方法,为通用人工智能平台和领域 AI 大任务系统的提供技术支撑。主要研究方向有:语义分析与理解、文本推理、问答与对话、文本生成、跨模态语言智能、认知与知识计算等。 代表成员: 赵东岩,北京大学王选计算机研究所研究员,博士生导师。长期从事自然语言处理和大规模语义数据管理的前沿研究工作。主要研究方向为自然语言处理、大规模语义数据管理、基于知识的智能服务技术。主持科技部 2030 新一代人工智能重大项目(基础研究类)「面向自然语言的语义分析研究」等国家级项目 8 项,发表学术论文 100 余篇(包括 ACL、AAAI、IJCAI、SIGKDD、SIGIR、SIGMOD、VLDB,AI Journal、TKDE、VLDB Journal 等 CCF A 类会议和期刊 70 余篇),授权发明专利 23 项,先后七次获得国家和省部级奖励。近五年来牵头研制了具有自动扩展和质量控制功能的开放域语义知识库构建技术、基于知识库的语义理解与自然语言问答、语义搜索引擎等一系列自然语言理解与认知智能的前沿技术,并开展了面向智能知识服务的行业应用。采用上述技术构建的 PKUBase 是国内科研单位建设最早且规模最大的语义知识库之一。基于知识库的语义理解和自然语言问答系统在欧盟组织的国际权威评测 QALD 上连续三年取得了第一名的成绩,在美国 NIST 组织的 TREC 微博检索任务上连续两年取得第一名。 万小军,北京大学王选计算机研究所研究员、博士生导师,语言计算与互联网挖掘研究室负责人,在北京大学获得学士、硕士与博士学位。研究方向为自然语言处理与文本挖掘,研究兴趣包括自动文摘、文本生成、情感分析、语义分析、多模态与多语言 NLP 等。曾担任计算语言学顶级国际期刊 Computational Linguistics 编委、国际会议 EMNLP-IJCNLP 2019 程序委员会主席,现任 CCF-NLP 专委会秘书长、TACL 执行编辑、NLE 编委、JCST 编委,10 多次担任相关领域重要国际会议领域主席,包括 ACL、NAACL、EMNLP、EACL,AACL 等。荣获 ACL2017 杰出论文奖、IJCAI 2018 杰出论文奖、2017 年吴文俊人工智能技术发明奖、CCF NLPCC 青年新锐奖等奖励。研制推出了多款 AI 写作机器人,如小明、小南、小柯等,应用于多家媒体单位。 冯岩松,北京大学王选计算机研究所副教授。2011 年毕业于英国爱丁堡大学,获得信息科学博士学位。主要研究方向包括自然语言处理;连续多年在面向结构化知识库的智能问答评测中获得第一名;相关工作发表在 ACL、EMNLP、TPAMI、AIJ 等自然语言处理领域顶级会议及期刊上。多次担任 ACL、EMNLP、NAACL、IJCAI 等领域重要国际会议的领域主席或高级程序委员会委员;作为项目负责人或课题骨干承担多项国家自然科学基金、科技部 863 计划和重点研发项目;分别在 2014、2015 年获得 IBM Faculty Award,2016 年 IBM Shared University Research Award。 复旦大学自然语言处理实验室 复旦大学自然语言处理实验室由复旦大学首席教授吴立德先生创建,是我国最早开展自然语言处理和信息检索研究的实验室之一。经过 40 余年发展,在自然语言处理底层分析、文本检索、自动问答、社会媒体分析等方面取得了一系列的研究成果。实验室多年在国家自然科学基金、国家 863/973 / 重点研发计划、省部委基金的支持下,发表了大量高水平国际期刊和会议论文,其中包括中国计算机学会推荐的 A/B 类国际会议和期刊论文(ACL,SIGIR,IJCAI,AAAI,NIPS,ICML 等)论文 150 余篇;参加多项国内外评测,如在自动问答国际评测 TREC/QA 中获得第 3 名,在文本蕴涵评测 RITE 和阅读理解评测 SQUAD 都位居前列;发布了国内首家中文自然语言开源系统 FudanNLP,被包括联合国教科文组织在内的国内外多家研发机构采用。 代表成员: 黄萱菁,复旦大学计算机科学技术学院教授、博士生导师,主要从事自然语言处理、信息检索和社会媒体分析研究,人工智能、自然语言处理学科方向带头人。兼任中国中文信息学会理事、社会媒体专委会副主任,中国计算机学会自然语言处理专委会副主任、学术工作委员会委员、中国人工智能学会女科技工作者委员会副主任、AACL 执委,EMNLP 2021 程序委员会主席。在高水平国际学术期刊和会议上发表了百余篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。获 2021 年上海市育才奖,并入选「人工智能全球女性」、「AI 2000 人工智能全球最具影响力提名学者」及「福布斯中国 2020 科技女性榜」。 邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师。国家优青获得者,于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,发表 CCF A/B 类论文 70 余篇,获得 ACL 2017 杰出论文奖(CCF A 类)、CCL 2019 最佳论文奖、《中国科学:技术科学》2021 年度高影响力论文奖,有 5 篇论文入选 PaperDigest 发布的 IJCAI/ACL/EMNLP 的最有影响力论文(被引用数进入前当届会议的 20 名)。出版开源专著《神经网络与深度学习》,Github 关注数 1.5 万,豆瓣评分 9.4 分。主持开发了开源框架 FudanNLP 和 FastNLP,已被国内外数百家单位使用。2015 年入选首届中国科协青年人才托举工程项目,2018 年获钱伟长中文信息处理科学技术奖青年创新奖一等奖,2020 获第四届上海高校青年教师教学竞赛优等奖,2021 年获首届上海市计算机学会教学成果奖一等奖(第一完成人)等。培养学生多次获得一级学会优博、微软学者、百度奖学金等。? 代表成果: 2 月 20 日晚,复旦大学自然语言处理实验室发布了具备 ChatGPT 能力的语言模型 ―― MOSS ,并面向大众公开邀请内测。MOSS 可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。 推荐阅读: Transformer 模型有多少种变体?复旦邱锡鹏教授团队做了全面综述 复旦邱锡鹏团队最新成果 fastHan:基于 BERT 的中文 NLP 集成工具 有没有什么高效「炼丹」神器可以推荐?复旦 fastNLP 团队祭出内部调参利器 fitlog 复旦邱锡鹏超全 NLP 预训练模型综述论文:两张图带你梳理完整脉络 西湖大学自然语言处理实验室 西湖大学 NLP 实验室由张岳博士带领,长期开展自然语言处理方面的研究,实验室研究方向包括自然语言处理、背后的机器学习算法以及相关的应用,在 ACL、EMNLP 等自然语言处理顶级会议发表过多篇高水平论文。 代表成员: 张岳,2003 年毕业于清华大学计算机科学专业,获得学士学位;2006 年毕业于牛津大学计算机科学专业,获得硕士学位;2009 年毕业于牛津大学计算机科学专业,获得博士学位。2010 年 3 月 - 2012 年 6 月在剑桥大学计算机科学专业从事博士后研究,2012 年 7 月 - 2018 年 8 月在新加坡科技与设计大学担任助理教授。2018 年 9 月全职加入西湖大学,担任终身副教授。主要研究领域为自然语言处理、文本挖掘、机器学习和人工智能,具体研究方向包括:1. 中英文基础自然语言处理中的词法、句法及语义表示,分析。2. 信息抽取中的实体、关系、事件以及情感抽取。3. 金融领域、生物医药领域以及文学领域的文本挖掘。4. 自然语言生成及其在文本总结与机器翻译中的应用。 张岳博士是近几年全球 NLP 相关顶会最高产的学者之一。根据相关统计,在 2012 年 - 2020 年期间,张岳博士在 NLP 领域的顶会发表的论文数量是全球第三,仅次于周明和 Yoshua Bengio。 蓝振忠,西湖大学助理教授、博士生导师,西湖心辰(杭州)科技有限公司创始人。蓝振忠博士毕业于卡耐基梅隆大学计算机学院,是 NLP 自然语言处理领域预训练语言模型「 ALBERT 」第一作者。 蓝振忠长期致力于研究自然语言处理,计算机视觉及深度学习的结合与应用。此前在谷歌 AI 研究所工作,研发成果被应用于谷歌新闻、谷歌助手等多个拥有亿级以上用户的产品;2020 年受聘于西湖大学,创办深度学习实验室并担任博士生导师,而后迅速带领团队研发出了 AI 心理咨询师「小天」、智能写作平台 FRIDAY 以及 AI 绘画产品「盗梦师」;2021 年被麻省理工大学评选为亚太地区「 35 岁以下科技创新 35 人」之一。 哈尔滨工业大学 自然语言处理研究所 哈工大的自然语言处理研究开始于 1979 年俄汉题录翻译的研究,更加系统深入的研究开始于上世纪 80 年代,围绕中文信息处理这一核心,在机器翻译、中文输入法、自然语言处理平台、语言知识资源建设等方面相继展开研究,培养了一批以周明、王海峰、张民、荀恩东为代表的优秀校友,取得了一批以「语句输入」、「语言技术平台 LTP」为代表的标志性成果,成为我国在自然语言处理领域一支重要的力量。 2020 年 7 月 17 日,哈尔滨工业大学计算学部批准成立自然语言处理研究所。研究所隶属于哈工大计算学部,由本部的社会计算与信息检索研究中心、语言技术研究中心和深圳校区的智能计算研究中心组成。 代表成员: 赵铁军,教授,博士生导师,哈工大教育部 - 微软语言语音重点实验室主任,兼任中国中文信息学会常务理事,中国计算机学会自然语言处理专业委员会副主任,《中文信息学报》、《自动化学报》编委。1987 年开始从事中文信息处理领域相关研究,主要研究方向:自然语言理解、人工智能应用。近年来承担国家自然科学基金重点项目、面上项目、国家重点研发计划项目、国家高技术计划项目、科技部国际合作项目等 7 项,2018 年担任国家重点研发计划司法专题项目(2018YFC0830700)首席科学家;发表学术论文 60 余篇。先后获部级科技进步奖 6 项,出版专著、译著 3 部。 车万翔,教授,哈尔滨工业大学计算学部长聘教授、博士生导师,社会计算与信息检索研究中心副主任。教育部青年长江学者,黑龙江省「龙江学者」青年学者,斯坦福大学访问学者。在 ACL、EMNLP、AAAI、IJCAI 等国内外高水平期刊和会议上发表学术论文 50 余篇,其中 AAAI 2013 年的文章获得了最佳论文提名奖,论文累计被引用 4,600 余次(Google Scholar 数据),H-index 值为 37。负责研发的语言技术平台(LTP)已被 600 余家单位共享,并授权给百度、腾讯、华为等公司使用。2018、2019 连续两年获 CoNLL 国际评测第 1 名。2015、2016 连续两年获谷歌专注研究奖。2017 年,所主讲的 MOOC 课程《高级语言程序设计(Python)》获国家精品在线开放课程。 秦兵,教授,博士生导师,哈尔滨工业大学计算机学院社会计算与信息检索研究中心主任。担任中国中文信息学会理事、中国中文信息学会语言与知识计算专委会副主任,国家自然科学基金重点项目负责人。主要研究方向知识图谱构建、文本情感计算、文本理解与自动生成。连续主持多项国家自然科学基金面上项目及科技部重点研发计划课题。获黑龙江省科技进步一等奖、黑龙江省技术发明二等奖、钱伟长中文信息处理科学技术奖等奖项。在国内外重要会议和期刊发表论文 100 余篇,论文累计被引用 6234 余次(Google Scholar 数据),H-index 值为 31。持续与多家互联网企业开展合作,多项研究成果在企业应用落地。入选「2020 年度人工智能全球女性榜单」和「福布斯中国 2020 科技女性榜」 刘挺,博士生导师,哈工大计算学部主任兼计算机学院院长。多次担任国家 863 重点项目总体组专家、基金委会评专家。中国计算机学会理事,中国中文信息学会常务理事 / 社会媒体处理专委会(SMP)主任,曾任国际顶级会议 ACL、EMNLP 领域主席。主要研究方向为人工智能、自然语言处理和社会计算,是国家 973 课题、国家自然科学基金重点项目负责人。主持研制「语言技术平台 LTP」、「大词林」等科研成果被业界广泛使用。曾获国家科技进步二等奖、省科技进步一等奖、钱伟长中文信息处理科学技术一等奖等。 张伟男,哈尔滨工业大学计算机学院院长助理、副教授、博士生导师,黑龙江省中文信息处理重点实验室副主任。曾担任 ACL、EMNLP 领域主席、AAAI 高级程序委员会委员(SPC)及多个国际会议及期刊的程序委员会成员、审稿人及期刊编委。目前为中国中文信息学会青年工作委员会副主任,中国计算机学会(CCF)术语审定工作委员会执委、CCF 哈尔滨分部秘书长,中国人工智能学会教育工作委员会副秘书长,北京智源青源会会员。主要从事人机对话及自然语言处理等研究。在 ACL、AAAI、WWW、IJCAI、IEEE TKDE、ACM TOIS 等 CCF A 类国际会议及期刊发表学术论文多篇;主导研发了智能人机对话系统「笨笨」,2019 年 3 月「笨笨」中的开放域人机对话功能成功落地到科大讯飞 AIUI 智能交互平台;获黑龙江省科技进步一等奖、吴文俊人工智能科技进步二等奖及黑龙江省青年科技奖等。 中科院自动化所模式识别国家重点实验室自然语言处理团队 中科院自动化所模式识别国家重点实验室于 1984 年由国家计委批准筹建,1987 年通过国家验收并正式对外开放,依托于中国科学院自动化研究所。实验室目前的主要研究方向为模式识别、计算机视觉、图像处理与图形学,口语信息处理、自然语言处理以及模式识别应用与系统等。 代表成员: 宗成庆,中科院自动化所研究员、博士生导师、国际计算语言学委员会(ICCL)委员、中国人工智能学会会士和中国计算机学会会士。他于 1998 年 3 月在中科院计算所获得博士学位,主要研究兴趣包括自然语言处理、机器翻译、文本数据挖掘和语言认知计算等领域,曾获国家科学技术进步奖二等奖、中国电子学会科技进步奖一等奖等若干奖励和荣誉。 张家俊,中国科学院自动化研究所研究员、博士生导师,主要研究方向为机器翻译和自然语言处理,获得国家优秀青年科学基金资助,入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家。发表 CCF-A/B 类论文 80 余篇,出版学术专著 2 部、译著 1 部,获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和 2020 年北京市科学技术奖一等奖等。担任中国中文信息学会理事、青年工作委员会主任和机器翻译专委会副主任。担任 ACL/EMNLP/COLING 的 (资深) 领域主席,以及《自动化学报》等期刊的编委。 中科院计算所自然语言处理研究组 中国科学院计算技术研究所自然语言处理研究组隶属于中国科学院智能信息处理重点实验室,主要从事自然语言处理相关的研究工作,主要研究方向包括机器翻译、人机对话等。研究组在自然语言处理领域旗舰会议 ACL 和影响力最大的期刊 CL 上分别发表了国内首篇论文;获 ACL 2019 最佳长文奖,为 ACL 开办以来国内单位首次获得此奖项;获 ACL 2006 Meritorious Asian NLP Paper Award,为国内学者首次获得 ACL 论文奖;获 EMNLP 2008 最佳论文提名奖、2020 世界人工智能大会青年优秀论文奖等。多次在 IWSLT 国际机器翻译评测和 CWMT 机器翻译评测中获得第一名,并在由美国国防部 DARPA 资助的、NIST 组织的世界权威机器翻译评测中获国内研究机构最好成绩。部分研究成果获国家科技进步奖二等奖、北京市科技进步二等奖、钱伟长中文信息处理科学技术奖一等奖、中国电子学会科学技术奖科技进步一等奖等。 代表成员: 冯洋,研究员、博士生导师,中科院计算所「新百星人才引进计划」入选者、2019 年度「卓越之星」获得者、自然语言处理课题组负责人。研究方向为自然语言处理、机器翻译、人机对话。在中科院计算所获得博士学位后,先后在谢菲尔德大学和南加州大学信息科学研究所(USC/ISI)开展研究工作。曾获 ACL 2019 最佳长文奖,为 ACL 开办 50 多年以来国内首次获得该奖项。多次在 NIST、CWMT、DSTC 等国内外权威机器翻译评测和对话系统比赛中获得第一名,作为项目负责人主持国家重点研发计划、国家自然科学基金面上项目等,与华为、腾讯、百度、字节跳动等公司开展合作研究。 中科院软件研究所中文信息处理实验室 中科院软件研究所中文信息处理实验室始于 1996 年成立的「开放系统与中文信息处理中心」。实验室当前主要围绕互联网环境下的自然语言理解这一中文信息处理领域的核心问题,开展中文信息的认知和理解机理、大规模中文知识图谱、基于知识的中文分析以及面向大数据智能服务的中文问答等关键技术研究。 实验室成员 2000 年起参加 TREC、NTCIR、DUC、TAC 等信息检索和自然语言处理领域的权威国际评测,并多次取得优异成绩。实验室目前承担着国家重大研发计划、国家自然科学基金重点项目、新闻出版署重大专项、国家语委重点项目、大型互联网企业合作(华为、阿里、百度)等 10 多项研究和开发任务,近年来在 ACL、SIGIR、AAAI、EMNLP 等顶级国际会议发表论文 50 多篇。 代表成员: 韩先培,中科院软件所研究员,担任中文信息处理实验室副主任,入选国家优青、中国科协青年人才托举计划及北京智源青年科学家。主要研究方向为信息抽取、知识图谱及自然语言理解。承担中科院战略先导、科技创新 2030 课题、国家重点研发专项等十余项课题。在 ACL、