大牛证券_炒股配资平台哪家好_专业股票配资资讯网官网

AI大模型驱动周期演进加速 3D视觉感知打开机会空间


发布日期:2024-04-30 02:58    点击次数:173


  AI大模型驱动下,从投资人到产业界都在思索由此带来的冲击和机会。因其逐渐有了“智能涌现”能力,产业链方如何承接这些技术赋能,投入节点选择也变得重要。

  “投资人这几年一大主题就是AI。”一村淞灵投资总经理张晨对21世纪经济报道记者表示,“通过对AI方向的积累学习,我们公司形成了生态打法:在感知周期时,重视对AI视觉、触觉、嗅觉、类脑领域布局;现在是模型周期,未来会走向行为周期。无论是哪一个AI周期发展阶段,我们坚定看好中国的产业发展。”

  除了偏向于自然语言侧的ChatGPT外,2023年Meta发布了旗下图像类AI大模型SAM(Segment Anything Model)。据介绍,这是一种用于图像分割的基础模型,可以在无需额外训练、零样本泛化前提下,实现辨别物体、对图像的理解能力。业界认为由此开启了机器视觉的GPT时刻,将推动跨视觉模态的场景应用,如自动驾驶、安防监控等。

  “在去年(2023年)上半年我还有一些顾虑甚至危机感:当AI厉害到输入什么数据都能得到很好的效果,是否可能就不需要我们3D感知行业了?”光鉴科技创始人兼CEO朱力对记者分析,“但通过与硅谷业内交流,我们的一致结论是:其一,AI很依赖数据来源,如果输入的数据很差就会导致输出结果不好,因此好的传感器很有价值;其二,AI最终需要计算也要考虑到成本,在传感器和算力之间寻求平衡很重要,目前阶段行业是在把感知能力做强,再拓展应用的阶段。”

  生成式AI的出现,令AI不同发展周期的时长在缩短,也驱动产业链演进落地打开新空间,但同时快速迭代也会吞没一些既有能力布局,考验着产业链的思索。

  AI驱动演变

  如果说AI大模型类似于进行运算的大脑,要支持大脑运转需要足够充足的触角和养料,因此围绕AI感知侧的相关产业链发展成长就殊为重要。

  天风证券就指出,看好3D视觉通过与AI更紧密地结合有望实现更高效的智能感知和控制系统。通过将深度学习、机器学习、大语言模型等AI技术应用于3D视觉感知,可实现更高效的数据处理、特征提取和模式识别。

  张晨对记者分析,在其定义的AI发展三个周期中,AI的感知周期阶段,主要是通过感知外部环境来丰富具身智能所需相关信息,如视觉、嗅觉、类脑等,核心是解决信息获取问题;在模型周期主要解决机器思考和决策问题的过程;行为周期则可能是出现人类目前认知无法达到的应用。

  SAM模型的出现,是对以图形、视觉为基础的产业链应用打开新空间。

  “现在来看,模型周期的发展进程在缩短,比如研究多模态融合,如果在2021年早期投资机构不布局,后续可能就没有机会了。因为AI发展速度太快,几乎每周都要知识更新。”张晨感慨,目前AI行业已进入模型周期,当前出现了基础大模型和行业大模型不同类型,在大模型应用阶段,会出现诸多投资机会。

  在这一逻辑下,一村淞灵面向感知周期,在早期就开始参与投资3D视觉领域领先公司光鉴科技。

  朱力曾是苹果公司3D传感项目负责人,在发掘该细分领域成长空间后选择归国创业。他对记者表示,3D视觉传感意味着提升机器的感知能力,构建X-Y-Z空间坐标,相较于2D视觉,3D视觉主要为机器算法服务,更加精准和安全,也具备更强的隐私性,可以为人工智能带来更优秀的感知能力。

  “AI大模型出现,将机器原有能力进行了扩充。举例来说,此前设计家用扫地机器人时,避障功能通常需要植入多种分类模型才能有较好表现,但有了通用大模型后,用一个模型就可以让机器智能化快速提升。”

  因此对视觉传感行业而言,AI大模型出现可以驱动产品更加完整,进而促进AI相关软硬件的规模化应用。SAM模型则主要解决了感知层的通用性问题,让空间传感信息转化成自然语言处理的过程更加高效。“坦率说,大多数应用型公司很难做到自己搭建一个基础大模型,但是通过引入这种底层能力,在一些垂直应用上嵌入我们的数据进行微调,可以带来差异化价值。”他进一步指出。

  “当然在大模型应用中,我们还处在偏应用端,不用操之过急很早参与进去。”朱力表示,可以成为大模型的应用参与者,探索其中新方向,但当前还没必要对大模型本身过早投入,例如微调等动作。因为很有可能目前正在做的事情,几个月后就会被Open AI的功能升级所抵消,抓住自身垂直场景的核心环节很关键。

  感知侧路线图

  面对涌动的AI浪潮,产业链厂商的技术和应用路线图也在逐渐拓维。

  “我不断在思考。视觉感知几乎与智能相关的行业都沾边,选择做什么,首先要定位在价值链条中创造的是什么。”朱力分析,因为当前现实生活中的人工智能应用,有85%以上信息来自视觉信息。光鉴科技的目标是通过视觉能力,解决智能设备和人、空间之间的交互问题。

  手机端是最早把3D视觉行业推向拐点的应用,苹果在iPhoneX中率先应用Face ID后让供应链成本快速降低,才有了在其他行业进一步探索应用的可能性。

  “2023年有一个明显趋势,多家国内手机大厂在旗舰手机中专门配置安全芯片,在这方面3D视觉会比2D视觉有更大优势,且旗舰手机的成本空间相对高,3D视觉应用落地会有更大想象空间。”朱力对记者分析。

  从量级看,即便手机行业目前走到一定瓶颈发展期,但依然是一个十多亿台体量的大市场,对于供应链企业来说,即便只应用在10%手机中,也是上亿台手机的发展空间。

  生物识别场景除手机外,支付也是一个快速成长的市场。“刷脸支付是我们前几年投入的方向,刷掌支付会是下一个趋势。随着产业界的推动,在信息安全保护相对谨慎的欧美国家也认可了这种生物识别支付方式,相比于用户可能担心人脸信息涉及隐私,刷掌支付被认为是开放社会中生物识别的最佳形态。”他续称。

  在近些年沉沉浮浮的XR行业,苹果Vision Pro中内置了不少光学器件,也会是3D传感领域的一大机会。但即便在2024年苹果将量产商用旗下产品,显然目前这还不是消费者能大规模接受的应用终端。

  朱力分析认为,Vision Pro目前阶段的重要使命,是提供给大量专业开发者建设应用生态。正因XR行业当前没有出现杀手级应用,行业拐点不会快速到来。“或许在2-3年后,行业对XR应用趋势达成共识,同时其本身通过迭代优化、成本快速下降,预计在2026年左右,可能会迎来市场真正需要的XR产品。”基于这一判断,光鉴科技目前也在与创新产品公司合作,研发新的产品方案,但会谨慎地控制投入。

  机器人和汽车是成长空间和天花板都很高的另外两大终端市场。朱力分析,机器人市场能带来相对较高的附加值;汽车市场则是伴随国内快速迭代必然会出现高需求,“我们目前在汽车市场会聚焦服务国内2-3家客户,先把产品打磨到足够好,再考虑面向全球销售产品。”

  周期中寻路

  智能汽车无疑是当前视觉传感产业链重要的落地驱动之一。只是面对不同场景,整车厂可能会存在路线快速选择和调整的过程。

  朱力对记者分析,3D视觉传感在智能汽车中的落地场景有两类:智能驾驶、人机交互。目前智能驾驶相关应用如辅助驾驶、自动泊车等,以激光雷达类供应商居多,但其偏高的成本意味着普遍应用门槛较高。而人机交互在汽车智能化浪潮中也很关键,“那就类似智能手机和功能机的区别,是采用键盘还是屏幕交互,体验差异很大。”他续称,该部分能力可以从既往消费电子领域的积累中延伸而来,涉及汽车如何理解人发出的指令(隔空交互、手势交互等)、如何理解车内环境等。

  “比如人进入车内后,座椅如何根据人员需求自动调整,我们已经可以交付这类方案。”朱力介绍,3D视觉可以解决一定隐私安全疑虑,比如车内疲劳监测场景,需要车内配置摄像头和算法,但3D视觉并非构建图像信息,而是空间信息,“哪怕最坏情况下,这些信息被黑客捕捉了,也并不了解这些信息背后是怎样的影像。”

  “我们认为,3D视觉会是未来解决座舱内人机交互的关键技术,但我们还不会参与面向自动驾驶的车外视觉感知。”朱力补充道,因为自动驾驶市场内卷严重,找准可以实现商业闭环的切入点很重要,不能不计成本内卷;同时伴随大模型兴起,自动驾驶未来的发展路线将有很多变数,既往架构设计很可能会有重大变化,因此目前需要谨慎。

  从产业发展历程看,3D视觉传感早期由美国和日本厂商探路发展模式并走向成熟,目前在国内呈现产业链公司相对分散的局面。

  张晨对记者分析,让AI理解物理世界到底是什么样子,是3D传感产业链环节最主要的优势,其也是向机器提供物理世界深度信息的关键纽带。“我们觉得机器视觉度过了多轮经济周期变化,目前欧美日等市场找到了其细分领域发展规律,优势明显。在这一方向,从技术到产品打磨、形成工程量产,都需要积累、迭代、收获反馈。在中国发展机器视觉、尤其3D视觉也要经历这些过程,才能找到规律。”

  “消费电子行业的特点是迭代快、周期短,但爆发力惊人。因此就需要创业团队具备敏锐的商业嗅觉,同时理解技术演进趋势。”他表示。

  “3D视觉会是未来人工智能进入人类生活的重要桥梁。”朱力总结道,当前AI在生活中的渗透率越来越高,在需要人机交互的环节,都将有广阔发展空间。