军工央企2023招聘 军工2023最有潜力的股
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
(报告出品方/作者:中泰证券,陈鼎如,方城林,马梦泽)
行情回顾:板块波动幅度较大,白马标的走势前强后弱
2022 年,国防军工在外部风险偏好变化和内部因素扰动中,行业逻辑 由需求大幅放量向利润持续兑现转变。2021 年国防军工指数受下游需 求大幅放量和板块基本面大幅改善催化,呈现大幅上涨,以行业内因 驱动为主,大致分为 4 个阶段:①1 月-4 月:“十四五”大额订单落地 不及预期;②5 月-8 月:沈飞、航发和洪都等主机厂大额订单落地, 中上游中报超预期;③9-10 月:中航工业集团集中减持对股价造成压 制;④11-12 月:对 22 年高景气度预期带来的估值切换。
2022 年国防 军工指数围绕市场风险偏好变化和基本面情况变化演绎,呈现较大波 动,受内外因双重驱动,截至 12 月初大致历经 7 个阶段:①1 月-2 月: 部分企业 21 年年报和 22 年一季报业绩预告不及预期,板块进入下行 通道;②3 月-4 月:俄乌关系、美元加息和疫情反复等宏观因素引起 市场风格向稳增长方向集中,板块内部面临原材料价格上涨和市场产 品纳入电子元器件名录等扰动;
③5 月-6 月:经济环比修复带来市场 风险偏好提升,中航工业集团集中增持注入信心,板块筑底;④7 月-8 月:中报面临高基数压力,中航西飞大额订单首次落地;⑤9 月:国企 改革进度不及预期;⑥10 月:国家安全、国防军队建设和航天强国等 议题在被强调,三季报整体增速下滑各赛道分化加剧,军品增值税改 革落地;⑦11 月至今:主机厂股权激励落地,首架 C919 交付东航, 政策预期向稳增长偏移,板块呈现弱势行情。
回顾 2022 年,个股基本面表现分化加剧,业绩预期持续兑现的个股表 现仍旧稳健,业绩持续低于预期的个股面临估值和业绩预期下修的风 险。展望 2023 年,军工板块投资仍应坚持以基本面为主要抓手。
截至 12 月 13 日,申万国防军工板块下跌 23.63%跑输大盘,航空和 军工电子子板块出现较大幅度回调。截至 2022 年 12 月 13 日,申万 国防军工板块较年初下跌 23.63%,同期上证综指下跌 12.73%,创业 板指下跌 28.49%,沪深 300 指数下跌 20.13%。在 31 个申万一级行 业中,国防军工板块涨跌幅排名第 28。航空装备、军工电子和航天等 高景气子板块较大幅度回调,截至 2022 年 12 月 13 日,军工子板块 航天装备较年初下跌 18.17%,航空 装备板块下跌 26.08%,地面兵装板 块下跌 21.76%,航海装备板块下跌 12.22%,军工电子板块下跌 25.04%。申万国防军工区间自最高价最大 回撤和涨幅分别为 42.64%和 50.63%,位列行业第 2 和第 3,相较其 他一级行业呈现较大波动。
年内中证国防成交量呈现区间内波动态势,较 2021年波动幅度更小。 整体来看,2022 年板块交易活跃度较 2021 年更为平稳。截至12月13日,2022 年中证国防指数成交量和成交额大致呈现月度的周期性波 动,即1-2 月、3-4 月、8-10 月和 11 月呈现成交缩量态势,2-3 月、 4-6 月呈现放量态势,6-8月在高位波动。其中 8 月 2 日中证国防的总 成交量达到年内最高水平,约为 8.07 亿股,同日军工板块的总成交金 额达到年内最高水平,约为 282.75 亿元。
业绩表现:个股表现分化加剧,业绩增速有所放缓
个股表现分化现象加剧,过去 6 个季度利润增速中枢下移。我们选取 军工行业 91 个标的观察行业三季报整体情况,首先简单按照利润同比 增速 100%以上、50%-100%、30%-50%、10%-30%、0-10%和负增长 6 个增速区间划分,从 21 年中报到 22 年三季报的 6 个季度中,利润 100% 以上增速区间标的数量分别为 27 - 18 - 9 - 10 - 5 - 4;利润 50%-100%增 速区间标的数量分别为 17 - 19 - 17 - 14 - 12 - 12;利润 30%-50%增速区 间标的数量分别为 11 - 10 - 13 - 7 - 14 - 13;利润 10%-30%增速区间标的 数量分别为 13 - 19 - 24 - 19 - 17 - 19;利润 0-10%增速区间标的数量分 别为 9 - 6 - 5 - 6 - 8 - 8;利润负增长增速区间标的数量分别为 11 - 17 - 25 - 21 - 35 - 34 - 35。
总体来看,利润同比增速 100%以上标的个数由 21H1的 27个减少至 22Q3 的 4 个,同时负增长标的个数由 21H1 的 11 个增加少至 22Q3 的 35 个, 军工板块利润增速中位数从 21H1 的 45.81%下移至 22Q3 的 12.12%,个 股基本面分化不断加剧。
业绩整体稳健增长,增速有所放缓。2022 年前三季度军工行业整体归 母净利润同比增长 11.42%。2022 年前三季度,在高基数以及疫情反 复对行业交付节奏的影响之下,业绩增速较去年同期有所放缓,行业 实现营业收入合计 3699.21 亿元,同比增长 11.54%;实现归母净利润 合计 287.07 亿元,同比增长 11.42%。在“十四五”练兵备战方针和保质量交付核心原则驱动下,军工行业强计划属性和需求刚性凸显, 行业已步入高质量发展和价值认知阶段,全年业绩有望持续兑现。
费用管控效果良好,盈利能力保持稳定。2022 年前三季度,军工行业 整体毛利率为 20.47%,同比下降 0.20pct。费用端,整体费用率控制 良好,研发投入不断加大,行业销售费用率为1.53%,同比下降0.10pct; 管理费用率为 6.05%,同比增加 0.10pct;财务费用率为-0.89%,同比 下降 0.45pct;研发费用率为 4.93%,同比增加 0.51pct,研发投入比 重持续提升为中长期业绩增长提供保障,提质增效和以效创利实践成 果凸显,实现净利率 8.06%,同比增长 0.01pct。受益于产能扩张下的 规模化效应体现、良性竞争机制下的经营质量与效率提升以及小核心 大协作下的专业化聚焦,行业盈利能力有望持续提升。
2022Q3 行业合同负债仍维持高位,订单需求饱满。合同负债+预收账 款是反映在手订单的重要前瞻指标,2022Q3,军工行业整体合同负债 金额为 1834.53 亿元,同比下降 0.22%,环比下降 5.09%,2021Q2 主机厂大额订单落地,步入收入扩充和利润兑现阶段,行业在手订单 充足需求旺盛,为行业中长期业绩增长奠定坚实基础。
向供应商采购情况良好,备产备货积极。2022Q3 军工行业应付票据及 应付账款金额为 3086.33 亿元,同比增长 14.56%,应付科目稳步增长 反映下游企业向上游原材料及零部件采购情况良好。2022Q3 军工行业 存货金额为 2814.40 亿元,同比增长 10.20%。存货延续增长态势,持 续维持高位,或预示行业在手订单充裕,后续收入增长有保障。行业 正处于加速备产备货和产品顺畅交付期,叠加行业整体的高确定性, 行业高景气得到持续验证。
基金持仓:三季度基金军工股持仓占比创新高
基金军工股持仓规模环比提升,超配比例提升明显。截止 2022 年三季 度末,A 股总市值中军工板块占比 2.13%,相比 2022 年二季度末增加 0.03pct;全部公募基金军工重仓市值 1250.87 亿元,环比增加 11.70%, 占所有重仓市值的 4.04%,相比 2022 年二季度末增加 0.87pct,创近 五年新高。相对于整体军工板块市值占比,全部公募基金超配军工 1.91pct,环比提升 0.84pct。
重仓股与业绩高增长个股匹配度较高。从申万 2021 子板块重仓来看, 航空装备和军工电子重仓市值占比最高,分别为 56.51%和 37.65%。 2022年三季度,全部公募基金重仓军工股排名前五的分别是振华科技、 中航光电、西部超导、中航沈飞和中航重机,前三季度业绩增速分别 为 95.00%、40.47%、59.57%、22.56%、50.46%;前二十家重仓军工股中,仅 3 家业绩增速为负,1 家业绩增速超 100%,3 家业绩增速 处于 60%到 100%的区间,9 家业绩增速处于 20%到 60%的区间。
前端列装:代差追补打开新型/改型列装空间,三代提速四代接力
近两财年美军对第四代发动机 F135 采购数量下滑,第五代发动机或于 2028 财年小批量生产。根据美国国防部 2023 财年空军和海军采购预 算,计划花费 9.71 亿美元用于采购 57 台 F-35 发动机,其中装配 F-35A 战斗机的 F135-PW-100 发动机 33 台(单机费用 1267.1 万美元),用 于空军;装配 F-35B 战斗机的 F135-PW-400 发动机 15 台(单机费用 2925.0 万美元),用于海军陆战队;装配 F-35C 战斗机的 F135-PW-600 发动机 9 台(单机费用 1267.1 万美元),用于海军。
2021-2023E 财年, 美军对 F135 采购数量由 96 台减少至 57 台,或系 F-35 性能问题、疫 情至供应链崩溃及资金用于其他优先采购事项等原因所致。美空军自 2016 年开启“自适应发动机过度计划”(AETP),旨在扩大飞机作战半 径,作为 F-35 换发方案。根据两机动力控制,2022 年 1 月 27 日美空 军宣布为联合攻击战斗机购买创新的新型自适应循环发动机,要求应 标公司在 2028 财年以小批量开始初始生产、在 2029 财年前做好生产 准备。
美俄第三四代军用战斗机发动机批产时间间隔在 15-25 年左右,目前 我国新机型处于三代批产提速、四代在研接力关键节点。①美国:第 四代发动机 F119(推重比>10)在第三代发动机 F110(推重比 7.07) 批产交付后的 15 年左右批产交付,美空军要求的第五代发动机 XA100 批产时间与于第四代发动机 F119(推重比 10.5)的批产时间间隔 20 年左右;②俄罗斯:第四代发动机 AL-41F-1S(推重比>10)在第三 代发动机 AL-31F(推重比 7.14)批产交付后的 25 年批产交付;③中 国:我国目前主要列装的第三代涡扇发动机 WS-10(推重比 8.1)于 2005 年推出。
根据航发动力 2021 年半年报,公司目前三代机工艺不 断趋于成熟;四代机关键技术能力大幅提升;五代机预研技术持续突 破瓶颈。对标欧美,我国第四代涡扇发动机 WS-15 或于 2025 年前后 实现批量生产,成熟型号批产提速叠加新型号接力,长期列装需求得 到保障。
先进军机列装加速,未来十年年均航发需求约 820.14 亿元。据 2020 年 11 月 26 日国防部例行记者会上就“如何确保 2027 年实现建军百年 奋斗目标”的问题,国防部新闻发言人任国强答道“我国经济实力、 科技实力、综合国力在“十三五”时期跃上了新的台阶,已成为世界第二 大经济体,但国防实力与之相比还不匹配,与我国国际地位和安全战 略需求还不相适应。这就需要同国家现代化发展相协调,充分利用全 社会优质资源,加快国防和军队现代化,确保强军征程行稳致远。”2020 年,我国 GDP 为 14.72 万亿美元,约为第一大经济体美国的 70.30%。
以 2030 年实现我国国防实力与现阶段经济实力相匹配的目标,我们首 先保守假设美军除四代机之外其余机型保有量不变,四代机每年按照 FY2022 财年 85 架的采购规模持续列装。再 保守假设到 2030 年我国各类飞机总量达到美军的 80%,则中国新增三 代机、四代机分别为 1090 架和 1055 架左右,各类直升机 3550 架,大 型运输机 490 架,特种飞机 1000 架左右,合计价值量在 2.62 万亿。按 军用飞机发动机价值占比 25%,军用飞机 125%的备发率估算,军用发动机的市场合计为 8201.41 亿元,年均市 场规模在 820.14 亿元左右。
后端维修:具备全周期现金流优势,成熟型号步入翻修增长期
航空发动机需定期或不定期进行返厂大修。发动机的每一次升空都要 经受严峻考验,短时间内发动机要承受从常温到上千摄氏度的温度变 化,再加上高速、高压、振动,战机发动机性能可能发生偏差,从而 使零件因疲劳、磨损、腐蚀、烧蚀、裂纹产生损坏、断裂和漏油等故 障。因此战机发动机达到一定的工作时间后,必须从飞机上拆下,送 往工厂大修。根据航发动力公告《航空发动机修理能力建设项目可行 性研究报告调整报告》,目前全球每年飞机维修费用大致为 310 亿美元, 而其中 60%用于发动机的维修上。
国外发动机制造厂家正逐步将其业 务延伸到发动机性能监控和维护维修领域。从提供“发动机”到提供 “发动机+服务”甚至只提供“服务”已经成为发动机制造企业延长价 值链,提高竞争力的重要手段和发展趋势。普惠公司、RR 公司和 GE 公司全球三大航空发动机制造企业都纷纷改变原有单一出售发动机的 经营模式,致力于扩展发动机维护、发动机租赁、发动机数据管理分 析等服务,通过服务合同绑定用户,扩大利润空间。
军机规模增加叠加实战化训练频率提升打开后端维修业务空间,三代 涡扇处于翻修增长期,四代有望未来实现接力。1)随着先进武器装备 需求上量带来的存量和增量飞机数量提升,航空发动机维修市场空间 将不断扩容;2)“十四五”期间将由过去的“强军目标稳步推进”转 变为“备战能力建设”,加强实战化训练是“十四五”时期国防和军队 建设的重要内容,强调通过实战化训练不断提升军队战斗素养,实战 化训练体系的巩固将大幅提升训练强度以致航空发动机的耗损增大, 从而增加航发维修保障需求,预计伴随“十四五”练兵备战背景下的 高频率演习任务的航空发动机耗损加大,后端维修市场将逐步起量。 国内军用航空发动机大修参与方主要以军方修理厂和航发动力旗下主机厂为主。
目前 大部分企业的航空发动机维修业务在企业内部属于批产的附属部分, 未能形成独立的维修能力。特别是航空发动机零部件的深度修理还处 于起步阶段,需要大力发展。目前国内在役航空发动机趋势为:一代 航空发动机数量逐步萎缩,新机交付数量少且逐年下降、二代航空发 动机为主流,新机交付数量基本稳定,三代航空发动机为新生力量, 新机交付数量逐年上升。随着航空发动机服役时间的增长,我国航空发动机维修需求总体呈逐步增加的趋势,1)其中涡喷发动机数量逐年 减少,预计 10 年后基本退出市场;2)涡扇发动机维修数量快速增加, 随着三代涡扇发动机首翻期到达,在 2015 年有一个数量飞跃式增加, 涡扇发动机部件维修总体呈快速增长趋势,并在十年后逐步稳定。
可 以遇见随着在研的四代航空发动机实现批产,涡扇发动机零部件维修 数量将在十几年后再次迎来飞跃增长期。
军用航发每年的维修市场约为 1025.18 亿元。据前瞻产业研究院发布的 《2013-2017 年中国航空发动机行业市场前瞻与投资战略规划分析报 告》,航空发动机全寿命周期要经历研发、采购、使用维护三个阶段。 研发阶段又分为设计、试验、发动机制造、管理等环节。在全寿命周 期中,研发、采购、维护的比例分别为 10%、40%、50%左右。使用维 护阶段的费用占比最高。该阶段又分为更新零部件、维修服务两部分。 按前述我国军用航发年均 820.14 亿元的采购规模,我们预计军用航发 每年的维修市场在 1025.18 亿元左右。
产业链表现:业绩持续兑现,新产能进入集中释放周期
航空发动机产业链自上游到下游可分为上游原材料(高温合金和钛合 金为主)、中游配套(控制系统、锻铸件、机加工和维修等)和下游主 机厂。
我们选取航空发动机产业链 17 家上市公司进行业绩分析(剔除抚顺特 钢 2018 年因实施重整豁免的债务及产生的净收益共计 28.26 亿元), 从回溯指标来看,十四五以来产业链整体进入高增长通道,2022 年业 绩有所分化:①上游原材料受原材料价格影响增速有所下滑,核心企 业长期受益于国产替代。2022 年前三季度实现收入 178.78 亿元 (+18.89%);实现归母净利润 23.40 亿元(+4.35%),2022 年前三季 度受镍价波动影响,对部分高温合金企业业绩增速造成拖累,随着成 本端压力缓解和发动机列装换装需求放量,业绩增速有望持续提升。 以高温合金为代表的核心企业将受益于高端高合国产替代;
②中游配 套需求放量+提质增效,规模效应持续体现。2022 年前三季度实现收 入 208.30 亿元(+25.18%);实现归母净利润 27.45 亿元(+53.77%), 航发中游以锻铸造为代表的赛道规模效应持续显现,将持续受益于小 核心大协作方针;③下游主机壁垒极高,业绩持续兑现。2022 年前三 季度航发动力实现收入 224.12 亿元(+22.18%);实现归母净利润 9.68 亿元(+23.67%),受益于国产航空发动机需求大幅释放,航发动力作 为下游主机龙头业绩有望持续兑现。
从前瞻指标来看,产业链整体于 2019 年开始密集产能扩充,2021 年 为新一轮产能布局高峰,目前处于产能建设快速爬坡阶段。军工“以 销定产”特性明显,受益于发动机成熟型号放量和新型号进入批产节 点,2019 年和 2021 年全产业链购建固定资产、无形资产和其他长期 资产支付的现金增速为 38.19%和 36.86%,表明全产业链自 2019 年 扩产提速;一般项目建设周期为 2-3 年,2021 年和 2022 年 Q3 固定 资产净值增速分别为 8.69%和 13.02%,表明 2022 年起全产业链产能 快速爬坡,上中下游各环节产能瓶颈逐步击破,产能快速释放或给予 业绩增长保障。
航发动力四大主机厂自 2019 年起陆续通过国拨及自筹等方式进行密 集的新一轮产能扩充,大部分项目将于 2022-2023 年达产。航发动力 自 2019 年起扩产行为提速明显,截至 2022H1,公司 20 个重点在建 工程中,8 个项目或将于 2022 年全部投产;7 个项目或将于 2023 年 全部投产并集中释放产能。除此以外,公司于 2014 年定增募集 9.61 亿元用于黎阳动力三代中等推力航空发动机生产线建设项目和 1.20 亿 元用于南方公司涡轴航空发动机修理能力建设项目,两项目分别于 2019 年 2 月和 2021 年 2 月竣工验收,公司目前已具备第三代航空发 动机的批量生产能力。
需求匹配:终端型号需求渐进释放,大协作打通产能瓶颈
强国必先强军,十四五先进战机需求释放节奏具备延续性。国防信息 化和武器装备的更新换代是应对现代化战争、实现强军目标的必然选 择。经过多年的发展和积累,我国已经形成较为系统的军工科研生产 体系,在重要武器型号方面也取得重要突破,以 J-20、Z-20、Y-20 等为代表的新一代武器装备在性能上已经达到或接近世界先进水平,技 术成熟度已满足批产要求,有望大批量列装部队,对相关军工企业将 产生积极影响。
2021 年中报,中航沈飞合同负债较年初增长 697.99%、 航发动力增长 784.69%;2022 年中报,中航西飞合同负债较年初增长 301.50%;2022 年 12 月,中直股份发布《关于调整 2022 年度日常关 联交易预计额度及预计 2023 年日常关联交易的公告》,预计 2023 年 中航财务公司存款上限金额为 130 亿元,较 2022 年截至披露日已发生 余额增加 1326.62%,主要系预计将在 2023 年收到客户大额预付款所 致,或表明公司大额订单落地在即。十四五开端之年以来,我国航空 产业正处于新机型放量初期,终端型号列装需求节奏具备延续性,展 望未来新机型有望陆续开始批产,带动行业长期高速增长。
飞机制造业通常采取“整机制造商―多级供应商”的制造模式,主机 厂推行“小核心大协作”发展模式,为上游零部件生产企业带来重大 发展机遇。产业链的第一级为整机制造商,主要从事产品设计、总装 制造、市场营销、客户服务和适航取证环节;第二级为关键航空子系 统制造商,所提供的子系统包括机体、发动机、航空电子等主要机载 设备;第三级主要包括众多为产业链上层的整机与子系统制造商提供 零部件与材料的供应商。航空航天零部件制造是航空航天制造业的基 础性子行业,是实现航空航天材料向关键子系统和整机制造转变的重 要环节,具有产品门类繁多、工艺路线复杂和产品精密度高的特点。
从军民融合与资产专用性角度,零部件制造业较专用子系统及整机组 装,在不同机型及军民应用领域之间具有更广泛的通用性及下游市场; 同时,由于零部件产品的高度定制化,零部件制造商易与整机及子系 统制造商形成较深入的合作关系。“十四五”期间我国新一代军机有望 加速放量,为航空制造业带来巨大市场空间;同时,主机厂推行“小 核心大协作”发展模式,在零部件生产和装配环节,外包比例有望大 幅提升,产业分工更加精细,配套体系更为稳定,将为上游零部件生 产企业带来重大发展机遇,业绩弹性有望高于主机厂。
产业链表现:景气度持续向中下游传导,全产业链备产踊跃
景气度持续向中下游传导,各子板块业绩增速放缓,中游部件营业收 入/归母净利润增速 28.91%/37.14%领先全赛道。我们基于 58 个核心 标的按照产业链上中下游进行分类,包括上游材料 11 家及元器件 18 家共 29 家、中游分系统 13 家及部件 8 家共 21 家和下游主机厂 8 家, 对 5 个子板块的景气度进行横向对比分析。
1)元器件:高基数、需求节奏及新产品研发投入致使业绩增速下探, 后续增速是否能够反弹有待观察。2022 年前三季度,元器件板块实现 营业收入 454.30 亿元,同比增长 14.81%,受到疫情反复和客户需求 节奏影响,收入增速较去年放缓;实现归母净利润 106.29 亿元,同比 增长 14.65%,板块自 20 年开始成为产业链景气度传导起点,产品结 构调整叠加规模效应使得利润增速在 20 年和 21 年远高于收入增速, 受制于高基数、新产能释放节奏和新产品研发投入增加影响,22 年前 三季度以被动元器件为代表的利润增速放缓,后续增速是否能够反弹 有待观察。
2)材料:增速放缓背景下,细分赛道受原材料价格和业务条线布局影 响有所分化。2022 年前三季度,材料板块实现营业收入 269.41 亿元, 同比增长 19.56%;实现归母净利润 44.97 亿元,同比增长 17.75%。 ①发动机:前三季度受镍价波动影响,对部分高温合金企业业绩增速 造成拖累,随着成本端压力缓解和发动机列装换装需求放量,业绩增 速有望持续提升;②飞机:钛合金企业受制于产品价格下行和海绵钛 高位运行影响,业绩增速有所放缓;碳纤维企业得益于需求旺盛叠加 高利润率新品贡献扩大,业绩保持较高增速;③特种材料:受益于先 进武器放量和迭代发展对先进材料提出高质高量要求背景下,如华秦 科技、光启技术和铂力特等特殊材料企业保持较高业绩增速,未来有 望持续受益。
3)分系统:步入利润稳定兑现期,部分企业业绩不及预期对板块造成 影响。2022 年前三季度,分系统板块实现营业收入 337.33 亿元,同 比增长 7.04%;实现归母净利润 32.45 亿元,同比下降 3.73%。如中 航电测受车检政策以及疫情管控的影响利润同比减少 27.20%等部分 企业对板块增速影响,预计未来伴随疫情影响消除、需求放量和产品 结构升级趋势下,板块业绩有望持续稳定增长。
4)部件:需求放量+提质增效,规模效应持续体现。2022 年前三季度, 部件板块实现营业收入 144.87 亿元,同比增长 28.91%;实现归母净 利润 25.45 亿元,同比增长 37.14%。产业链景气度于 21Q2 从上游传 导至航空中游部件配套板块,高基数影响下板块内规模效应持续显现, 预计未来在外部需求放量、内部产能释放和利用率提升带来规模效应、 业务纵向延伸提升配套能力+横向拓展强化自身实力等多重因素驱动 下,业绩有望持续兑现。
5)主机厂:批产交付提速,收入稳健增长利润拐点可期。2022 年前 三季度,主机厂板块实现营业收入 1123.50 亿元,同比增长 13.57%; 实现归母净利润 43.98 亿元,同比增长 1.10%。①航空发动机:航发 动力实现收入增速 22.18%和利润增速 23.67%,产能扩张下先进型号 批产交付全面提速+实战化训练带动航发修理量飞跃式增长带来收入 快速扩容,组装熟练度提
现在的gtp出现了向上的拐点了吗 gdp最新消息新闻
gtp增长意味着什么3月14日,OpenAI推发布了GPT-4。向科技界再次扔下了一枚“核弹”。
根据OpenAI的演示,我们知道了GPT-4拥有着比GPT-3.5更强大的力量:总结文章、写代码、报税、写诗等等。
但如果我们深入OpenAI所发布的技术报告,我们或许还能发现有关GPT-4更多的特点……
以及一些OpenAI没有点名和宣扬的,可能会令人背后一凉的细节。
1.新Bing装载GPT-4
自然而然地,GPT-4发布之时,新Bing也已经装载了最新的版本。
根据微软Bing副总裁【【微信】】在推特上所述,装载了GPT-4的新Bing已经将问答限制提升到了一次15个问题,一天最多提问150次。
2.文本长度扩大八倍
在GPT-4上,文本长度被显著提高。
在此之前我们知道,调用GPT的API收费方式是按照“token”计费,一个token通常对应大约 4 个字符,而1个汉字大致是2~2.5个token。
在GPT-4之前,token的限制大约在4096左右,大约相当于3072个英文单词,一旦对话的长度超过这个限制,模型就会生成不连贯且无意义的内容。
然而,到了GPT-4,最大token数为32768个,大约相当于24576个单词,文本长度被扩大了八倍。
也就是说,GPT-4现在可以回答更长的文本了。
OpenAI在文档中表示,现在GPT-4限制的上下文长度限制为8192个token,允许32768个token的版本名为GPT-4-32K,目前暂时限制了访问权限。在不久的未来,这一功能可能会被开放。
3.模型参数成为秘密
我们知道,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿,但这一情况在GPT-4被改变了。
OpenAI在报告中表示:
考虑到竞争格局和大型模型(如GPT-4)的安全影响,本报告没有包含有关架构(包括模型大小)、硬件、训练计算、数据集构造、训练方法或类似内容的进一步细节。
这意味着OpenAI没有再披露GPT-4模型的大小、参数的数量以及使用的硬件。
OpenAI称此举是考虑到对竞争者的忧虑,这可能是在暗示其对于竞争者――谷歌Bard――所采取的策略。
此外,OpenAI还提到“大型模型的安全影响”,尽管没有进一步解释,但这同样也暗指生成式人工智能所可能面对的更严肃的问题。
4.有选择地表达的“优秀”
GPT-4推出后,我们都看到了这一模型较上一代的优秀之处:
GPT-4通过模拟律师考试,分数在应试者的前10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。
但这实际上是OpenAI的一个小把戏――它只展示给你GPT-4最优秀的那部分,而更多的秘密藏在报告中。
下图显示的是GPT-4和GPT-3.5参加一些考试的成绩表现。可以看到,GPT-4并非在所有考试中的表现都那么优秀,GPT-3.5也并非一直都很差劲。
5.“预测”准确度提升
在ChatGPT推出以来,我们都知道这一模型在很多时候会“一本正经地胡说八道”,给出很多看似有理但实际上并不存在的论据。
尤其是在预测某些事情的时候,由于模型掌握了过去的数据,这反而导致了一种名为“后见之明”的认知偏差,使得模型对于自己的预测相当自信。
OpenAI在报告中表示,随着模型规模的增加,模型的准确度本应逐渐下降,但GPT-4逆转了这一趋势,下图显示预测精确度提升到了100。
OpenAI表示,虽然GPT-4的准确度显著提高,但预测仍是一件困难的事,他们还将就这一方面继续训练模型。
6. 还有30%的人更认可GPT3.5
尽管GPT-4展现出了比GPT-3.5优秀得多的能力,但OpenAI的调查显示,有70%的人认可GPT-4输出的结果:
GPT-4在遵循用户意图的能力方面比以前的模型有了大幅提高。在提交给ChatGPT和OpenAI API的5214个提示的数据集中,70.2%GPT-4生成的回答优于GPT3.5。
这意味着:仍有30%的人更认可GPT-3.5。
7.GPT-4语言能力更佳
尽管许多机器学习的测试都是用英文编写的,但OpenAI仍然用许多其他的语言对GPT-4进行了测试。
测试结果显示,在测试26种语言中的24种中,GPT-4优于 GPT-3.5和其他 LLM(Chinchilla、PaLM)的英语语言性能,包括拉脱维亚语、威尔士语和斯瓦希里语等低资源语言:
8.新增图像分析能力
图像分析能力是此次GPT-4最显著的进步之一。
OpenAI表示,GPT-4可以接受文本和图像的提问,这与纯文本设置并行,且允许用户制定任何视觉或语言的任务。具体来说,它可以生成文本输出,用户可以输入穿插的文本和图像。
在一系列领域――包括带有文本和照片的文档、图表或屏幕截图――GPT-4 展示了与纯文本输入类似的功能。
下图显示,GPT-4可以准确地描述出图片中的滑稽之处(大型 VGA 连接器插入小型现代智能手机充电端口,一个人站在出租车后方熨衣服)。
OpenAI还对GPT-4的图像分析能力进行了学术标准上的测试:
不过,GPT-4的图像分析功能尚未对外公开,用户可以通过bemyeye网站加入等候队列。
9. 仍然存在错误
尽管GPT-4功能强大,但它与早期GPT模型有相似的局限性。
OpenAI表示,GPT-4仍然不完全可靠――它会“产生幻觉”事实并犯推理错误:
在使用语言模型输出时,特别是在高风险上下文中,应该非常小心,使用与特定应用程序的需求相匹配的确切协议(例如人工检查、附加上下文或完全避免高风险使用)。
与之前的GPT-3.5模型相比,GPT-4显著减少了“幻觉”(GPT-3.5模型本身也在不断迭代中得到改进)。在我们内部的、对抗性设计的事实性评估中,GPT-4的得分比我们最新的GPT-3.5高出19个百分点。
10.数据库的时间更早
介绍完GPT-4的优点,接下来就是一些(可能有些奇怪的)不足之处。
我们都知道,ChatGPT的数据库的最后更新时间是在2021年的12月31日,这意味着2022年以后发生的事情不会被知晓,而这一缺陷在之后的GPT-3.5也得到了修复。
但奇怪的是,GPT-4的报告中,OpenAI清晰地写道:
GPT-4通常缺乏对其绝大多数训练前数据在2021年9月中断后发生的事件的知识,并且不从其经验中学习。它有时会犯一些简单的推理错误,这些错误似乎与许多领域的能力不相符,或者过于容易受骗,接受用户的明显错误陈述。它可以像人类一样在棘手的问题上失败,比如在它生成的代码中引入安全漏洞。
2021年9月……甚至比GPT-3还早。
在装载了GPT-4的最新ChatGPT中,当我们问起“谁是2022年世界杯冠军”时,ChatGPT果然还是一无所知:
但当借助了新Bing的检索功能后,它又变得“聪明”了起来:
11.可能帮助犯罪
在报告中,OpenAI提到了GPT-4可能仍然会帮助犯罪――这是在此前的版本都存在的问题,尽管OpenAI已经在努力调整,但仍然存在:
与之前的GPT模型一样,我们使用强化学习和人类反馈(RLHF)对模型的行为进行微调,以产生更好地符合用户意图的响应。
然而,在RLHF之后,我们的模型在不安全输入上仍然很脆弱,有时在安全输入和不安全输入上都表现出我们不希望看到的行为。
在RLHF路径的奖励模型数据收集部分,当对标签器的指令未指定时,就会出现这些不希望出现的行为。当给出不安全的输入时,模型可能会生成不受欢迎的内容,例如给出犯罪建议。
此外,模型也可能对安全输入过于谨慎,拒绝无害的请求或过度对冲。
为了在更细粒度的级别上引导我们的模型走向适当的行为,我们在很大程度上依赖于我们的模型本身作为工具。我们的安全方法包括两个主要组成部分,一套额外的安全相关RLHF训练提示,以及基于规则的奖励模型(RBRMs)。
12.垃圾信息
同样地,由于GPT-4拥有“看似合理地表达错误事情”的能力,它有可能在传播有害信息上颇为“有用”:
GPT-4可以生成逼真而有针对性的内容,包括新闻文章、推文、对话和电子邮件。
在《有害内容》中,我们讨论了类似的能力如何被滥用来剥削个人。在这里,我们讨论了关于虚假信息和影响操作的普遍关注基于我们的总体能力评估,我们期望GPT-4在生成现实的、有针对性的内容方面优于GPT-3。
但,仍存在GPT-4被用于生成旨在误导的内容的风险。
13.寻求权力
从这一条开始,接下来的内容可能有些恐怖。
在报告中,OpenAI提到了GPT-4出现了“寻求权力”的倾向,并警告这一特征的风险:
在更强大的模型中经常出现新的能力。一些特别令人关注的能力是创建长期计划并采取行动的能力,积累权力和资源(“寻求权力”),以及表现出越来越“代理”的行为。
这里的 “代理”不是指语言模型的人性化,也不是指智商,而是指以能力为特征的系统,例如,完成可能没有具体规定的、在训练中没有出现的目标;专注于实现具体的、可量化的目标;以及进行长期规划。
已经有一些证据表明模型中存在这种突发行为。
对于大多数可能的目标,最好的计划涉及辅助性的权力寻求,因为这对推进目标和避免目标的改变或威胁有内在的帮助。
更具体地说,对于大多数奖励函数和许多类型的代理人来说,权力寻求是最优的;而且有证据表明,现有模型可以将权力寻求确定为一种工具性的有用策略。
因此,我们对评估权力寻求行为特别感兴趣,因为它可能带来高风险。
更为令人毛骨悚然的是,在Openai提到的另一篇论文中写道:
相反,我们使用代理这个术语来强调一个日益明显的事实:即机器学习系统不完全处于人类控制之下。
14.赋予GPT-4钱、代码和梦想
最后一个小细节。
在测试GPT-4的过程中,OpenAI引入的外部的专家团队ARC作为“红方”。在报告的一条注释中,OpenAI提到了ARC的一个操作:
为了模拟GPT-4像一个可以在现实世界中行动的代理一样的行为,ARC将GPT-4与一个简单的读取-执行-打印循环结合起来,允许模型执行代码,进行链式推理,并委托给自己的副本。
ARC随后推进了在云计算服务上运行这个程序的一个版本,用少量的钱和一个带有语言模型API的账户,是否能够赚更多的钱,建立自己的副本,并增加自己的稳健性。
也就是说,ARC赋予了GPT-4自我编码、复制和执行的能力,甚至启动资金――GPT-4已经可以开始自己赚钱了。
本文来自华尔街见闻,欢迎下载APP查看更多