代码解读:基于深度学习的单目深度估计(4)
热门文章
0
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
代码解读:基于深度学习的单目深度估计(4) 今天再来分析深度网络的coarse和fine的stack结构 从这段代码中,可以了解: 1,define_fine_stack可以了解到三个卷积层的连接,这和论文的描述一致 2,但是define_coarse_stack的讲述与论文不符,不清楚这个原因 接下来看定义误差函数的代码, 具体的数学推导这里不去详解 总之,分析到现在,已经把源码中models文件夹下的depth.conf 和 depth.py 两个文件看完了,了解到: 1,depth.conf 讲述了深度网络的搭建模式,基本和论文是对应的 2,depth.py 介绍了深度推测函数,图片的预处理,深度网络的初始化以及误差函数的定义 而文件common存放的是一些更为底层的函数,不必要做更深分析 在源码的根目录下,net.py 和 pooling.py 是关于网络层以及池化层的底层函数,不做太多了解 说白了,跟论文相关的部分已经分析完了 最后,把目光转向 test.py 文件,之前分析了前几行,来看下面的代码, 从这段代码可以了解: 1,net的函数存入create_machine()初始化整个深度网络 2,machine的infer_depth()用来估计深度,这个函数之前分析过 3,对结果的depth图像进行处理,保存图像 总而言之,我把基于深度学习的单目深度估计从论文到算法到源码认真整理了一遍, 很有意思!
声纹识别与声音合成 谈谈声纹识别
声纹识别与声纹鉴定的区别,声纹识别声纹录制,声纹识别声十点,声纹识别声纹识别声纹说完视频声纹识别,又称说话人识别,是根据语音信号中的声纹特征来识别话者身份的过程,也是一种重要的生物认证手段。历经几十年的研究,当前声纹识别系统已取得了令人满意的性能表现,并在安防、司法、金融、家居等诸多领域中完成部署,有着广阔的应用前景。 然而,大量证据表明,这些系统在实际应用中容易受到恶意伪造行为的影响,致使系统的安全性存在很大隐患,在很大程度上限制了声纹识别技术的大规模推广应用。为了解决这一安全隐患,当前研究界和产业界从技术导向出发,对伪造攻击进行分类,探索相应的对抗策略。其中,ASVspoof竞赛系列最具代表。该赛事聚焦在声纹识别中的假冒闯入攻击与对策任务,提供了一个公平的评测平台(包括标准的数据、协议和评价),极大地促进了研究社区的发展,也积累了诸多有效的技术手段。 本文从应用导向出发,对声纹识别中的音频伪造问题进行梳理,提出了一种新的分类法,并介绍了各类伪造技术的基本概念和代表对策。该研究工作《An Application-Oriented Taxonomy on Spoofing, Disguise and Countermeasures in Speaker Recognition》近期已在领域权威杂志《APSIPA Transactions on Signal and Information Processing》上发表。这项工作的主要贡献包括: 从不同的应用场景(Application)出发,衍生出不同的伪造行为(Fake action)。这些应用场景包括访问控制、监听和司法,伪造行为分为假冒攻击(Spoofing attack)和伪装欺骗(Disguise cheating)两大类。进一步,根据伪造音频的生成模式(Production,来自人还是机器)和评价方法(Evaluation,通过听觉感知还是自动检测)的不同,对两大类伪造行为进一步细分,划分出不同的伪造技术手段(Technique),形成了从应用层到技术层的五层概念图(如下图所示)。本工作更多是以应用为导向,对音频伪造进行宏观划分;因此面向读者可以是领域内的专家或技术人员,也可以是对领域感兴趣的学生或工程师。 ?以应用为导向,声纹识别中的音频伪造分类图 原文链接(可下载全文): https://www.nowpublishers.com/article/Details/SIP-2022-0017 参考文献: Lantian Li, Xingliang Cheng, Thomas Fang Zheng. An Application-Oriented Taxonomy on Spoofing, Disguise and Countermeasures in Speaker Recognition. In APSIPA Transactions on Signal and Information Processing, 11(2), 2022.
近期有哪些车企退出了中国市场 中国车企败落之殇解读
有哪些车企退出中国市场,2021即将退出中国的车企,近期退出中国市场的汽车品牌,哪些汽车品牌退出中国随着新能源汽车发展进入“智能化”下半场,各大车企之间的竞争焦点开始转向城市NOA(城市自动辅助导航驾驶)。在车企和自动驾驶公司推进实现完全自动驾驶的过程中,城市场景是必须要攻克的关键环节,换言之,城市NOA属于ADAS(高级驾驶辅助系统)到完全自动驾驶的中间过渡阶段,传统车企和新势力企业都在不遗余力地积极布局。 车企为何急于落地城市NOA ? 图片来自小鹏汽车官方微博 今年2月8日,在理想L7的上市发布会上,理想首次展示了城市导航辅助驾驶的最新测试视频。并表示今年四季度将在AD MAX上开放城市NOA的早鸟用户内测。而此前李想在年初就曾公开表示理想基于BEV感知和Transformer模型的城市NOA导航辅助驾驶会在2023年底开始落地,打响了2023年城市NOA落地的第一枪。 所谓NOA(Navigate on Autopilot),即自动辅助导航驾驶,而城市NOA则是辅助导航驾驶的天花板,也是无人驾驶的入门槛。车主在设置好目的地后,车辆可以实现全程“自动”行驶,包括途中实现变道、超车、等红绿灯以及礼让行人等操作,实现难度要远大于此前的高速NOA,但在车辆行驶过程中,仍需要有驾驶员进行监督,以便在某些紧急情况下接管车辆。 据不完全统计,除2022年9月率先在广州开始推送城市NOA功能的小鹏汽车外,长城魏牌、蔚来、极狐以及智己和集度都在城市NOA领域有所布局,推出了各自的城市NOA功能,并陆续开启了定点测试。不过各厂商对于城市NOA的叫法有所不同,如小鹏的城市NGP、长城魏牌的城市NOH以及极狐的城区NCA等。据西部数据的行业研报显示,2023年将有多家车企的车型有望实现城市NOA推送,开启城市NOA元年。 魏牌官方视频截图 那么,传统车企和新势力造车企业为何都急于落地城市NOA?原因大致可以分成两方面:一方面是想实现差异化竞争。现阶段新能源市场中内卷严重,车企在辅助驾驶方面的技术水平差异不大,越早落地城市NOA,就将在未来的市场竞争中占据主动。同时,在营销层面也有助于吸引更多潜在用户关注,从而带动市场份额提升。此外,落地城市NOA也有助于车企展现技术实力,一旦实现成功落地,即便距离技术成熟还有一定距离,但至少意味着车企已经具备了实现全场景辅助驾驶的技术实力。 另一方面则是资本市场层面的推动。虽然城市NOA表面上看是车企间的竞争,但除去特斯拉和蔚小理等走全栈自研路线的车企外,其余绝大部分车企实现城市NOA功能仍需依靠供应商。有的选择与文远知行、轻舟智航和小马智行等L4级自动驾驶公司合作,而有些则选择自己孵化自动驾驶公司,如长城旗下的毫末知行。而不管是全栈自研还是与供应商合作,融资是首要任务,在讲好故事的同时,尽快将技术落地实现商业化,以此来满足资本市场的期待,以便获得后期持续的融资。虽然现阶段资本对于自动驾驶赛道投资比较谨慎,但对于城市NOA这类有望开启自动驾驶规模化落地的项目还是展现出一定兴趣。2022年底,在城市NOA等领域取得多项突破性进展的轻舟智航获得了数亿元B1轮融资。同样作为智能驾驶解决方案服务商的福瑞泰克在2022年11月至今短短三个月间就获得近10亿元的B轮融资。 一再推迟,城市NOA遭遇“拦路虎” 小鹏P5广州测试城市NOA视频截图 事实上,早在2021年上海车展,小鹏和极狐就开始为城市NOA造势。2022年城市NOA更是被车企们频繁提及,甚至给出了交付时间,但目前也只有小鹏P5和极狐阿尔法S全新HI版实现了城市NOA落地,其中小鹏P5率先在广州推出城市NGP,但功能尚未完善,仅限于城市主干道使用。而其他车企要么是还在个别城市测试中,要么就只给出了预计开始测试的时间节点。去年8月的成都车展上,长城官方宣布旗下的魏牌摩卡DHT-PHEV激光雷达版将于当年9月量产,但至今这款车型仍未交付,还处于测试阶段。既然车企对于城市NOA如此热衷,急于落地,那为何在推进城市NOA过程中一再跳票? 首先,一个重要原因在于高精地图。在实现城市NOA的技术路线上,不同玩家各不相同,明显的界定在于是否需要高精地图。对于城市路况而言,一些如公交车道、潮汐车道等特殊道路无法仅靠感知系统来识别,势必需要高精地图的辅助。 目前车企要想合法使用高精地图,除了与图商合作外,还有一种就是自己购买资质,从而实现“地图自由”。例如小鹏于2021年5月收购智途科技,以此来获得高精地图甲级测绘资质,但意想不到的是,2022年智图科技未通过资质复审。有业内人士称,小鹏汽车的城市NGP迟迟未能全面落地,没有高精地图资质是重要原因之一。除此之外,现阶段高精地图还存在制作成本高、周期长、“鲜度”低等短板,如果要想实现城市NOA功能,最理想的状态是做到实时更新,但就现阶段而言,即便是国内头部的地图厂商,也是无法实现的。 相比之下,车路协同虽然可以解决高精地图“鲜度”的问题,可以实时获得道路数据,并通过云端实现交通指挥控制,但也面临着基建问题,实现的难度更大。同时,车路协同玩家面向更多的是政府客户,与城市NOA玩家面对的用户群体不同,所以这也是为何车路协同玩家未参与到城市NOA竞争中的原因之一。 图片来自理想汽车官方微博 其次,另一重要原因在于安全隐患。抛开城市NOA不谈,目前应用范围相对较广的NOA还没有得到完善,不仅令消费者的驾乘体验变差,一些故障还可能会引发安全隐患。年初网络上闹得沸沸扬扬的理想L9“灵异事件”,其根本原因就是视觉感知系统出现了BUG。后续理想L9还被曝高速NOA失灵,造成追尾事故。类似的情况在近年来其实并不少见,即便现在辅助驾驶系统做的最好的特斯拉,也频频出现问题。以至于近期特斯拉开始在欧洲市场招聘自动驾驶安全员这一全新岗位,目的就是为了在欧洲推广FSD(全自动驾驶) Beta,一方面是迫于法规压力,但更多的是出于安全考虑。 与高速NOA相比,城市NOA中的交通复杂程度呈倍数级增长,可以说一个是“小学”水平,一个是“大学水平”。因此对于软硬件的综合能力要求更高,提升激光雷达、高清摄像头和毫米波雷达等硬件的性能和精度外,同时还要具备更高算力的芯片和精准的视觉感知算法。以小鹏为例,其推出的城市NGP功能,感知模型的数量是高速NGP的4倍,预测/规划/控制相关代码量则提升至88倍。 据IIHS(美国公路安全保险协会)近期一项最新测试结果显示,所有光线条件下,配备了行人AEB的比未配备的车辆,出现严重碰撞率低27%,伤害事故率低30%。在没有路灯的夜晚,道路上发生车辆碰撞行人事故时,配备和未配备行人AEB(自动紧急刹车系统)的车辆,出现的碰撞风险没有区别。简单来说,就是车辆的AEB系统虽然可以检测到行人,但只在白天或光线充足的情况下才起作用。这对于城市NOA而言,也是一项挑战,毕竟在城市场景下,交通参与者众多,其中行人占据了较大的比例。 而提到软硬件,势必涉及到成本问题。现阶段感知系统的元器件包括摄像头、毫米波雷达、超声波雷达和激光雷达。其中激光雷达能够通过信号反射构建更为精准的3D测量数据,可以实现更长、更远范围的3D建模,是自动驾驶在感知层面的核心元件,同时也是感知元器件中价格最为昂贵的。从成本结构上来看,激光雷达的成本构成有三部分,光学部件、主板芯片和结构件等,目前虽然光学部件和结构件都实现了国产替代,但占成本1/3的主板芯片仍受国际巨头垄断。据公开资料显示,目前市场上的单颗激光雷达成本价格最高仍接近1万元。而想要实现城市NOA至少需要一颗激光雷达。以小鹏P5为例,搭载单颗激光雷达的车型售价超过了20万元。而搭载3颗激光雷达的极狐阿尔法S全新HI版售价超过了40万。 另外,法规的缺失也是原因之一。目前国内还没有针对自动驾驶的相关国家法规,对于事故责任的认定还存在盲区。现阶段只有深圳于2022年8月出台了一部地方性的法规《深圳经济特区智能网联汽车管理条例》,但其中只规定了“在有驾驶人的智能网联汽车发生交通事故造成损害,属于该智能网联汽车一方责任的,由驾驶人承担赔偿责任”,并没有明确L3级自动驾驶系统可被视作事故承担者的主体资格,所以对于达到L3级的城市NOA而言,一旦车辆发生事故,驾驶人依旧是担责主体。不过,好消息是,去年11月工信部、公安部印发《关于开展智能网联汽车准入和通行试点工作的通知(征求意见稿)》中明确了事故责任认定规则,即以自动驾驶系统是否激活为分类标准,未激活时由安全员承担责任,激活时由试点使用主体承担责任。虽然只是针对城市试点阶段的规定,但对于未来自动驾驶国家法规的推出具有积极意义。 总结:作为迈向完全自动驾驶的必经之路,城市NOA的落地是大势所趋。据西部证券最新研报称,2023-2025年搭载NOA的车型将分别达到70万、169万和348万辆,其中支持城市NOA功能的占比分别为17%、40%和70%。有业内人士认为,城市NOA功能在大量上车之前,没有一家公司能做到90分。但对于车企而言,如果要等到技术成熟才开始落地,那肯定也是不现实的,智能化时代的竞争,落后一步,要想追赶就难上加难了。 而对于消费者而言,城市NOA是一项新事物,发展初期难免遭遇“阵痛期”,比如感知系统不够准确、路线规划不够智能以及并线超车不够果断等等,容易产生一些不好的驾驶体验,所以更需要用户的鼓励和包容。相信随着技术不断发展以及相关产业链的逐步完善,城市NOA也将一步步实现自身的升级与进步,为进入完全自动驾驶时代打下坚实基础。
版权声明:除非特别标注原创,其它均来自互联网,转载时请以链接形式注明文章出处。