违规滥用chatgpt功能引发的风险 滥用chatgpt会带来哪些风险
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
能做题、写诗、编剧本、写代码,甚至代写论文、出评估报告&【【微信】】;&【【微信】】;境外先进人工智能应用“【【微信】】”作为当前互联网狂欢的“顶流”,虽揭示了人工智能技术发展应用的前景,满足了人们的好奇心,但其暗含的数据跨境等安全风险不容忽视。
数据时代,安全为基。2月16日,在2023年首期湖北省电信和互联网行业沙龙上,业内专家对数据全生命周期安全问题进行了研讨。
警惕违规使用VPN服务
近期,各大平台卷起了一股“【【微信】】”热潮。这款由美国人工智能工作室OpenAI推出的智能应用,相当于聊天机器人程序,可以通过机器学习和理解人类的语言进行智能对话,完成对话、翻译、撰写邮件等任务。
如,有单位通过“【【微信】】”为湖北赋诗——“长江,是湖北之心,更是湖北之魂。编钟,是湖北之情,更是湖北之声。黄鹤楼,是为湖北之名,更是湖北之灵”。
根据“【【微信】】”运作原理,用户在输入端提出问题后,会传输到位于美国的OpenAI服务器上进行运算,随后“【【微信】】”给出相应回答。
随着“【【微信】】”热度攀升,在手机APP应用商店,“Chat AI”“Chat Bot”“【【微信】】 Ai Assistant”等名称相似度极高的APP越来越多,可提供AI情感咨询、创作与论文助手等服务,有的甚至宣称“可转接【【微信】】”服务。
“聊天智能应用造成的数据跨境问题不容忽视。”在湖北省电信和互联网行业沙龙上,业内专家认为网民提出的问题可能涉及个人信息、敏感信息等重要数据,必须从法律和行业层面加以监管。
据了解,目前,我国无法直接注册“【【微信】】”账号,必须通过VPN(虚拟专用网络)等工具注册。业内专家表示,相关企业若获得主管部门批准,可依法依规使用VPN服务。广大消费者应当加强辨别能力,警惕炒作、扭曲、夸大AI技术的应用,以及相关注册充值活动,以免违规服务导致退费难、维权难问题。
稍不留意就会泄露个人信息
数据时代,盗取个人隐私信息的行为无孔不入。沙龙上,上海观安信息技术股份有限公司战略部高级专家黄建文分享了诸多案例,提醒大众要多留神——
朋友圈晒照片,条码和二维码一样可以泄露个人信息;手机充电宝尽量自用,避免交叉感染被植入病毒;用自己的手机流量上网,不要蹭公共WIFI贪便宜;手机输密码时建议关闭“按键音”,避免音频被恶意采集;下载微信“皮肤插件”需谨慎,“颜值”不一定代表“正义”&【【微信】】;&【【微信】】;
据省通信管理局统计,今年1月,我省依法处置各类涉诈电话号码209个;通过大数据分析要求进行二次实人认证的电话卡20.7万个;依法拦截省际诈骗电话4.75万次,其中拦截境内诈骗电话4.74万次,占比99.8%;依法封堵涉诈域名142.8万个,其中99%以上为境外注册、境外接入。
随着智能制造不断升级,企业愈来愈成为网络攻击的重点。据统计,2023年1月1日至2023年2月17日期间,我省制造业累计遭受恶意网络攻击超过12万次;24家企业被发现存在联网信息系统漏洞,3523个主机IP被恶意程序控制。
“信息技术飞速发展,网络安全意识、网络防护配套要及时跟上。”黄建文认为,通信运营商、互联网企业、设备硬件厂商除了要加快完善数据防窃取、防泄露等技术手段,还要系统建立隐患排查、监测发现、应急处置体制机制,提升数据安全支撑服务水平。
压实数据安全“第一责任”
提升企业数据安全治理水平,不是一朝一夕的事,与会企业分享了探索经验。
湖北电信集团级高级专家张岩玲认为,企业数据安全治理普遍存在4大问题——人员复杂(对数据安全的认知及知识技能差异巨大);业务复杂(业务场景多、业务流程长,涉及系统和人员众多);数据资产复杂(资产种类多、数量庞大、投建时间早、投资巨大);网络环境复杂(内网、互联网、层级多、节点多,机房分布到全省各地)。
对此,湖北电信建立了《数据安全管理办法》等规章制度和流程规范。如,在重点环节数据安全管理上,采取数据提取交付“金库模式”双人操作,并签订《数据安全承诺书》。
盛天网络数据治理负责人丁勤霞介绍,盛天网络将人工智能与数据治理融合,通过机器学习方式,增强数据的分析、清理、连接、识别、语义协调和重组,实现从“主动治理”到“自动治理”,实现“数据资产化、数据治理平台化、数据价值化”。
斗鱼直播数据安全相关负责人王攀说,目前,斗鱼已建立四级数据安全制度体系,全平台启动数据梳理及分类分级保护专项工作,并通过数据安全培训、海报宣传、试题考核等方式,提升员工数据安全意识。
省通信管理局副局长付景广表示,电信和互联网行业产生、汇聚、承载着海量重要数据和个人信息,要统筹发展和安全,扎实做好数据安全工作,保障数字经济高质量发展。要统筹推进数据安全、网络安全、个人信息保护等工作,强化重要和核心数据保护,严格规范数据处理活动,有效防范大规模数据泄露、数据窃取,压实数据安全“第一责任”。(记者 刘天纵 通讯员 康嘉辰 李承林)
编辑: 袁超伟
“中国版ChatGPT”落地金融场景 度小满探索提升风控效率
chatGPT,中国版Chatrandom,中国版chatGPT团队在无锡看守所,中国版chatGPT下载自ChatGPT于2022年11月底问世以来,仅在数月时间内便以“狂飙”模式席卷全球。度小满日前宣布成为百度文心一言(ERNIE Bot)首批生态合作伙伴,将基于自身金融场景积累的海量对话及解决方案数据,融合文心一言的能力,打造全新的智能客服、智能营销、智能风控服务。这是国内首批探索“生成式AI”在金融场景落地的公司。
据了解,ChatGPT、文心一言等生成式AI应用是基于大语言模型,其所依托的大模型的基底是语言生成模型和语义理解模型,它的语义生成空间非常大,如果将它的能力放在金融行业中去处理原有的任务,性能和效果将会有显著的提升。
金融科技的核心是风险管理,对于数据的挖掘和解读是解决风控问题的一大关键,而类ChatGPT的特点正是能够超越传统方法对数据拥有深入挖掘的能力。度小满此前已经在大模型领域持续实践,将大语言模型LLM应用于海量互联网文本数据、行为数据、征信报告的解读,将小微企业主的信贷风险降低了20%。
还有像ChatGPT所展现的语义理解能力,是度小满在自然语言处理领域重点投入的方向,2021年,在微软举办的【【微信】】 比赛中的文档排序任务中,度小满NLP团队排名第一并刷新纪录;团队研发的轩辕 (XuanYuan) 预训练模型也在CLUE分类任务中排名第一。
度小满CTO许冬亮表示“随着对数据的解读能力的提升,新技术可以帮助我们发现原来发现不了的风险,提升金融风控效率;更长远来看,生成数据也将弥补金融数据稀缺问题”。不仅如此,许冬亮还认为ChatGPT还开启了新一轮的大厂技术军备竞赛,因为“它正在成为大厂的底层设施,在基础设施上必然会有很多垂直应用生长出来”。
虽然ChatGPT已经成为全球科技的发展趋势,但金融行业是一个高度重视安全的领域,因此许冬亮也认为,“ChatGPT创作自由度高,但是它的自由度太大了,当解决真实场景中的任务时,会造成可控性不足;随着技术的突破,科技伦理治理上也要及时跟上才能规范技术的发展。”
最正宗的aigc概念 aigc浪潮迭起的背后蕴含哪些商机
最正宗的艾灸热敷包是什么牌子的,最正宗的艾草,最正宗的矮子馅饼,最正宗的阿拉伯语研究方向及背景
AIGC是AIGeneratedContent的缩写,指利用人工智能技术生成的内容。它也被认为是继PGC,UGC之后的新型内容生产方式,AI绘画、AI写作等都属于AIGC的具体形式。2022年AIGC发展速度惊人,迭代速度更是呈现指数级发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,都在助力AIGC的快速发展。去年人工智能绘画作品的夺冠、超级聊天机器人ChatGPT的出现,拉开了智能创作时代的序幕。
在人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。从机器学习到智能创造,从PGC,UGC到AIGC,我们即将见证一场深刻的生产力变革,而这份变革也会影响到我们工作与生活的方方面面。本书将结合生动的比喻和有趣的案例,向所有关注未来科技的从业者、创业者、投资人、政府部门科普AIGC的商业落地场景和行业应用案例。
趋势判断:人工智能产业经过多年发展,技术实现将从感知智能升级成认知智能,从而引发了机器理解、分析和决策事物的深层次需求。AIGC就是实现认知智能产品化的重要方式。未来几年内,AIGC技术将在多个领域落地。
切入形式:技术主体切入(以AIGC技术切入,研究基于此技术衍生出的各领域中的应用)
目标读者群体:AIGC行业应用企业
商业化对象:AIGC服务商
报告框架:
一、AIGC发展现状
1. AIGC概念界定
与之前的PGC与UGC不同的,AIGC是利用人工智能技术自动生成内容的新型生产方式。按照模态区分,AIGC又可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,其中跨模态生成值得重点关注。
自然语言处理(NLP)赋予了AI理解和生成能力,大规模预训练模型是NLP的发展趋势。NLP的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG),ChatGPT是NLP发展中具有里程碑式意义的模型之一。ChatGPT是OpenAI从GPT-3.5系列中的模型进行微调产生的聊天机器人模型,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
亿欧智库:自然语言处理(NLP)发展历程
来源:德邦证券,亿欧智库整理
2. AIGC发展历程
AIGC发展可分为三阶段,早期萌芽阶段(上世纪50年代至90年代中期),沉淀累积阶段(上世纪90年代至本世纪10年代中期),快速发展阶段 (本世纪10年代中期至今)。
2.1 早期萌芽阶段(1950s-1990s)
由于技术限制AIGC仅限于小范围实验与应用,1957年出现首支电脑创作的音乐作品,弦乐四重奏《依利亚克组曲(IlliacSuite)》,80年代末至90年代中由于高成本及难以商业化,因此资本投入有限导致AIGC无较多较大成绩。
2.2 沉淀累积阶段(1990s-2010s)
AIGC从实验性转向实用性,2006年深度学习算法取得进展,同时GPU,CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供海量数据进行训练。2007年首部人工智能装置完成的小说《IThe Road》(《在路上》)问世,2012年微软展示全自动同声传译系统,主要基于“深度神经网络”(DeepNeural Network,DNN)自动将英文讲话内容通过语音识别等技术生成中文。
2.3 快速发展阶段(2010s至今)
2014年深度学习算法“生成式对抗网络”(Generati【【微信】】,GAN)推出并迭代更新,助力AIGC新发展。2017年微软人工智能少年“小冰”推出世界首部由人工智能写作的诗集《阳光失了玻璃窗》,2018年NVIDIA(英伟达)发布StyleGAN模型可自动生成图片,2019年DeepMind发布DVD-GAN模型可生成连续视频。2021年OpenAI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内容。我国AIGC市场在2022年底引起较大关注,2023年开年企业端跃跃欲试。虽然行业仍处于起步阶段,距离大规模证明和体系化发展仍有距离,但从资本的加码到应用场景的探索,距离的缝隙有望逐步填补,同时,“模块分拆+个性化推荐”的“泛AIGC”形式有望持续发展。
二、AIGC技术基础
1. AI构建
1.1 图灵测试与AI的诞生
1950年,人工智能的先驱艾伦・图灵发表了一篇划时代的论文《计算机器与智能》,文中提出了著名的图灵测试:“如果一台机器能够与人类展开对话(通过电信设备)而保证其机器身份不被识破,那么就可以认为这台机器具有智能。”此外文章还预言了在未来可能创造出具有真正智能的机器。
亿欧智库:图灵测试最初版本的示意图
来源:公开资料,亿欧智库整理
虽然图灵测试从理论上验证了机器拥有智能的可能性,但AI正式发展成一门专业学科则是在1956年的达特茅斯会议,会议的组织者与参与者都是数一数二的科学家,包括约翰・麦卡锡,马文・闵斯基,纳撒尼尔・罗切斯特,克劳德・香农等。在这次会议上,“人工智能”的名称与概念正式确立,因此这次会议也被视为AI产业的起点。
1.2 人工智能发展的三种流派
1.2.1 符号主义
符号主义认为人类的一切活动(包括体力活动和智力活动)都是符合某种逻辑的,所有信息都可以用各种符号表示,人类的认知过程就可以视为基于逻辑规则的,操作这些符号的过程。根据这种理论,如果电脑能自动执行和人脑一样的规则和过程,那么就可以视为实现了人工智能。
1.2.2 联结主义
联结主义与符号主义几乎是同时提出的,人工智能的关键不在于让电脑等机器实现智力活动,而应该模仿人脑的结构。这派观点认为智能是人脑细胞与神经元彼此连接成网络共同处理信息的结果,如果能在电脑中模拟这种结构再实现人工智能自然也更轻松。早在电脑发明前的40年代,就有持这种观点的科学家进行了数学建模,奠定了后来人工神经网络和专家系统的雏形。
1.2.3 行为主义
与前两种流派不同的,行为主义于上世纪80年代提出,它倡导“感知+行动”。这种观点源于“控制论”,强调模拟人在控制过程中的智能行为和动作。但是限于时代和科技发展,行为主义直到上世纪末,随着智能控制与机器人逐渐兴起才引起重视。截至目前的AI发展,几乎都是三种流派的结合运用。
亿欧智库:专家系统结构示意图
来源:杜雨、张孜铭等《AIGC:智能创作时代》,亿欧智库整理
2. AI学习
2.1 机器学习的概念
在1950年,图灵的论文《计算机器与智能》中提出了“学习机器”的概念,现在已经发展成AI科学中的一个独立分支。机器学习主要是设计和分析一些让电脑可以“自动学习”的算法,是一类从数据中自动分析和获得规律,并利用规律对未知数据进行预测的算法。从技术角度说,这一理论关注可以实现的,行之有效的学习算法(要防止错误累积)。
亿欧智库:机器学习理论示意图
来源:公开资料,亿欧智库整理
2.2 机器学习算法的分类
2.2.1 感知器算法
机器学习中最容易理解与实现的是监督学习与无监督学习,前者就是感知器算法的典型案例之一,它也是人工神经网络的基础。简要说来,监督学习是从给定的训练数据集中学习出一个函数,再接收到新数据时就可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出,也可以说是特征和目标,训练集中的各项目标都是人为标注的。
与之原理类似的,无监督学习就是目标没有人为标注,但还保有训练集且同样要求输入和输出。
2.2.2 神经网络算法
这种算法可以视为多层感知器,除了输入输出层外,它还加入了若干隐藏层。隐藏层中的神经元节点可以与输入输出节点相连,每条链接上都有各自的权重系数,最终形成一个网络结构。之所以要加入隐藏层,是因为现实中很多情况都不是简单的二元对立,总有这样那样的变化需要考虑。
亿欧智库:单层人工神经网络示意图
来源:公开资料,亿欧智库整理
2.2.3 强化学习算法
与监督和无监督学习更重视学习数据不同,强化学习是在给定的数据环境下,让机器学习如何通过选择一系列行动来达成长期累计收益*化的目标。从本质上说,这种算法学习的是一套决策系统而非数据,它在很多游戏中都有运用。著名的阿尔法狗(AlphaGo)就结合了强化学习与专家系统,能连续击败多位人类围棋高手,名噪一时。
亿欧智库:强化学习构成元素及其关系
来源:杜雨、张孜铭等《AIGC:智能创作时代》,亿欧智库整理
通过前面的介绍可以发现,不论哪种机器学习算法,对特征的选取和处理在模型训练中是很重要的,但在很多情况下要直接提取合适且有效的特征是很困难的,如提取海量图片和句子的特征。此时的机器学习就不能只局限于图片或句子的某一特征,而是它们背后隐含的复杂关系。因此需要结合深度模型进行自动计算,而模型主要是深度神经网络,这是一种更复杂的神经网络。深度学习算法就是采用类似的深层次结构进行机器学习的算法,目前大火的ChatGPT就运用了这种算法。
亿欧智库:不同形态的机器学习关系示意图
来源:杜雨、张孜铭等《AIGC:智能创作时代》,亿欧智库整理
三、AIGC商业落地分析
1. AIGC市场规模
2022年9月的AI绘画作品《太空歌剧院》获得美国科罗拉多州博览会的艺术比赛的*名,当时有人预测若未来五年有10%-30%的图片在AI的帮助下诞生,那么AI绘画则将创造超过600亿元的市场空间,若考虑到下一代互联网对内容需求的迅速提升,则可能创造更大的市场规模。随后OpenAI的ChatGPT一问世就多次刷新之前APP注册用户数量突破的纪录,业内预测带动的市场规模将破万亿。
2. AIGC产业地图
2.1 产业上游:数据服务
不论AIGC产业如何发展,人工智能的分析、创作、决策能力都依赖海量数据。因此决定不同机器间能力差异的就是数据的数量与质量。
2.1.1 数据查询与处理
通常来说数据库有两种模型,一种像湖泊,汇聚来自各地的水源而不作区分;另一种像仓库,分门别类的存储数据。近几年在科技的推动下,现代数据库一般都是两种模型的结合,兼具二者的易用性、规范性等特征,还为用户带来降本增效、省时省力等特点。根据对其中数据的查询与处理等时效性,涉及其中业务的公司可分为异步处理型公司和实时处理型公司。
2.1.2 数据转换与编排
数据的处理主要涉及提取,加载和转换。根据海外市场研究企业Grand【【微信】】的数据,2021年全球数据集成工具市场的规模约105亿美元,在未来十年将以年复合增长率约12%的速度增长。根据处理方式的区别,这种公司可以分为本地部署型公司和云端原生型公司。
2.1.3 数据标注与管理
不论哪种机器学习模型,都可以简化为“老师教学生知识”,其中对知识点等数据就需要标注与管理,从而进行监督,最终形成各种不同的算法模型。根据Grand【【微信】】的数据,2021年全球数据标注市场规模约为16.7亿美元,在未来十年将以年复合增长率约25%的速度增长。根据公司业务拓展程度的差异,这种公司可以分为基础型公司和扩张型公司。
2.1.4 数据治理与合规
在数字经济时代,数据是和土地、人力、资本一样举足轻重的生产资料。因此就需要保证数据资产在管理时预先设置质量规范,在后期的访问和调取时也要做到合法合规,因此这项服务也就成为各大企业的必需品。根据海外市场研究企业ReporterLinker的数据,全球数据治理市场规模约18亿美元,预计未来几年将以年复合增长率约22%的速度增长.根据服务交付模式,这种公司可以分为工具型公司和定制型公司。
2.2 产业中游:算法模型
算法模型是AIGC最核心的环节,是机器学习的关键所在。它包含三类参与者:专门实验室、企业研究院、开源社区。
2.2.1 AI实验室
算法模型在AI系统中起决策作用,是它完成各种任务的基础,可以视为AI系统的灵魂所在。很多企业为了更好地研究算法并推动商业化落地,在内部都设立专门的实验室,因此这种实验室可以分为独立型实验室和附属型实验室。
2.2.2 企业研究院
一些集团型公司或企业往往会设立专注于前沿科技领域的大型研究院,下设不同领域的细分实验室,通过学术氛围更浓厚的管理方式为公司的科研发展添砖加瓦。
2.2.3 开源社区
开源社区对AIGC非常重要,它提供了一个共享成果、代码的平台,还可以与其他人相互合作,共同推动AIGC相关技术的进步。根据覆盖领域的宽度和深度,这种社区可以分为综合型开源社区和垂直型开源社区。
2.3 产业下游:应用拓展
任何优秀的科研成果都需要最终落地部署才能产生实际意义和价值,算法模型也不例外。在AIGC产业链的下游,可以将相关应用拓展到四个主要场景:文本处理、音频处理、图像处理、视频处理。
2.3.1 文本处理
目前,文本处理是AIGC相关技术距离普通消费者最近的场景,也是技术较为成熟的场景,许多应用公司都会从多个维度出发,辅助业务拓展与商业化过程中。一般说来文本处理可以细分为营销型、销售型、续写型、知识型、通用型、辅助型、交互型、代码型。
2.3.2 音频处理
此处主要介绍由语音合成技术来生成的相关应用,与视频相关的将放在视频部分说明。目前的音频处理主要分为三类:音乐型、讲话型、定制型,很多公司都专注于此。AI的应用将优化供给效率,改善整体利润水平。
2.3.3 图片处理
图片的创作门槛比文字高,传递信息也更直观,所以商业化的潜力自然也更高。随着AIGC应用的日益广泛,图片处理也就从广告、设计、编辑等角度带来更大更多的机遇。图片处理可细分为生成型、广告型、设计型、编辑型。
2.3.4 视频处理
随着时代的发展,人们在视频上的投入逐渐超出了在图片上的,视频也日益成为新时代最主流的内容消费形态。因此将AIGC引入视频将是全新的赛道,也是技术难度*的领域。视频处理可以细分为生成型、编辑型、定制型、数字虚拟人视频。
3. AIGC细分市场分析
3.1 AIGC+资讯行业
在信息化时代,社会中充斥着各种资讯,同时这些资讯也有高标准、需求大、时效强等特点。自2014年起,AIGC已开始用于新闻资讯领域,因此资讯行业是AIGC商业化相对成熟的赛道。
亿欧智库:新华社写稿机器人“快笔小新”
来源:公开资料,亿欧智库整理
3.1.1 AIGC辅助信息收集,打造坚实基础
优质的新闻产出必定需要全面、高效、准确的信息收集与整理的基础上。按照传统的作业模式,工作人员需要亲临现场,通过各种手段才能获得足够且扎实的信息。现在的AI已经能对该环节高效赋能,例如科大讯飞的AI转写工具可以帮助记者实时生成文稿,自动撰写提纲、精简语句等,进而提高工作效率,保证最终产出的时效性。
除帮助获取一手信息外,AI也可以帮助精确检索二手信息,收集素材。在高性能的AIGC工具如ChatGPT出现后,就可以像常人对话一样直接提问并获得答案。虽然难免还是会有这样那样的问题,但作为工具而言,AIGC的意义已经非常明显了。
3.1.2 AIGC支持资讯生成,实现高效产出
在资讯写作等生成环节,基于自然语言生成和自然语言处理技术,AIGC已经逐步得到从业者和消费者的认可,因此有不少企业积极参与其中。以产出数量为例,与美联社、雅虎等外媒合作的AutomatedInsights,其撰稿工具Wordsmith能在一分钟内生成两千条新闻,且单条质量可比拟人类半小时的作品质量。
除了速度惊人,AI在准确度方面同样优势明显,能够很好的避免人类的粗心或计算等错误,在保证质量的同时减轻人类工作压力。这方面国内企业颇多,如新华社自研的写稿AI“快笔小新”、腾讯公司开发的DreamWriter、百度公司和人民网合作开发的“人民网-百度・文心”大模型都是其中的佼佼者。
3.1.3 AIGC助力内容分发,缓解人类压力
在内容分发环节,AI除了常见的个性化内容推荐外,也在逐步开拓全新应用场景,如虚拟人主播,以视频或直播的形式发放内容,打造沉浸式体验。如新华社数字记者“小诤”、央视网虚拟主播“小C”、阿里巴巴数字人“冬冬”、百度智能云AI手语主播等等,在未来,AI虚拟主播可能发展成媒体行业的标配。