6月21号,在东莞松山湖举办的华为开发者大会(HDC 2024)上,华为云官宣推出盘古大模型5.0,这是继去年7月盘古大模型3.0推出后的一次重磅升级。
就在华为开发者大会举办之时,国内大模型企业的竞争正进入白热化。5月,一些企业打响价格战,将之前业界已经建立的商业模式彻底“摧毁”。而大家也在四处出击,甚至零元争夺大项目,中标项目榜上的座次每个月都在变化。大模型舞台的机会千载难逢,但竞争刚刚开始,就变得异常惨烈。
而从这次华为释放的信息看,大模型的竞赛需要回归主航道。毕竟一方面在Scaling Law规律之下,全球前沿企业在技术上持续取得创新和进展,其中有许多隐秘、高价值的部分需要追赶;另一方面,发展新质生产力,产业AI是主战场,但在千行百业中,仍有很多难题亟待解决。
在大会中,华为常务董事、华为云CEO张平安展示了大量盘古大模型在企业核心场景的最新突破成果。张平安称,华为云与开发者一起深入到千行万业,解难题,做难事,为行业和企业带来实际价值,并强调盘古将继续在行业中攻坚克难。
01
盘古5.0三大升级,为解行业难题
大会上公布了盘古大模型5.0有三个创新升级:全系列、多模态、强思维,尤其突出了模型升级与产业之间的联系,体现“从行业中来,到行业中去”。
其中,全系列是大众在会前猜测最多的,人们认为盘古将从B端延伸到C端,但这次盘古推出了四个系列的模型,包含不同参数规格,有端侧也有云侧,体现了端云协同。比如十亿级参数的Pangu E系列可支撑手机、PC等端侧智能应用,百亿级参数的Pangu P系列适用于低时延、低成本的推理场景等。
对于多模态,这是今年非常火热的方向。虽然过去几年,业界主要聚焦在大语言模型上,但除了语言之外,还有图像、视频、音频等多模态数据,数据量是文本数据的百倍乃至千倍。业界不少企业在攻克多模态大模型,期望将不同模态的数据统一,将理解和生成统一,从而能更好的对物理世界理解、感知和决策。
从张平安的介绍来看,盘古大模型的多模态技术,与解决行业难题相关,也更多利用了华为在行业侧的资源。
它能更好、更精准地理解物理世界,包括文本、图片、视频,以及行业中更会涉及的雷达、红外、遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率。这些能力更能解决行业难题,如通过卫星遥感图像,盘古大模型就能准确分析出一个区域农作物的生长状况、收成状况,可用于农作物的产量预估、病虫害的监测等。
在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。
再如,对于图片和视频,强调可支持10K超高分辨率,因为这对精准理解和重构物理世界非常关键。
“物理世界就是多种模态的,大模型走进千行万业时,希望这些能力能带着盘古解决更多行业难题。”张平安说。
在强思维提升方面,华为云将思维链技术与一种“策略搜索”技术深度结合。业界对思维链并不陌生,它代表了大模型理解、推理的核心能力,而华为这次提出了“策略搜索”,不同于大热的“增强检索(RAG)”,RAG用于克制大模型的幻觉,而“策略搜索”是智能体用来适应变化并做出决策的过程。华为云称,两者结合,实现数学能力和复杂任务规划能力,是创造有价值行业助手的关键。
从盘古5.0升级的信息看,它紧跟了全球大模型技术前沿的潮流,但同时重在从行业出发,技术升级仍聚焦在“解行业难题”上,发挥华为在产业侧的优势。
比如,盘古5.0在演示生成能力时,不像年初Sora发布时放出的极具娱乐性和冲击性的视频,而是演示了如何重塑智能驾驶、工业设计、建筑设计等,行业人士会更体会到其中的意义。
以智能驾驶为例,有车企人士告诉数智前线,在训练过程中,车企用大模型做数据生成,这是当下一大趋势,但大都是静态数据,像交通流这些动态数据,年初Sora发布时,让他们看到了希望,但当时看还达不到要求。而在这次大会上,盘古率先演示了自动驾驶的视频生成。这重塑了自动驾驶的训练方式。
盘古大模型生成车身四周六个摄像头的视频
“盘古大模型也能生成风景视频和炫酷的科幻视频。”张平安称,“但我们努力的方向不在这里,大模型可以风花雪月,我们认为更关键的是要解决行业难题。”
大会上,张平安也介绍了华为云在具身智能上的进展。业界有一种说法,当下多模态大模型正在演化成智能体Agent,帮助人们感知、理解和决策。当数字世界的Agent进入到物理世界,与硬件结合,这就是具身智能。令业界兴奋的是,大模型给具身机器人带来了思考能力。
华为云的盘古具身智能大模型,采用了以云助端方式,能让机器人完成10步以上的复杂任务规划。比如,夸父机器人现场演示在几种物品中识别出一瓶水,然后递到现场一名工作人员的手中。而盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人。
02
盘古如何在行业中“解难题”
在盘古5.0发布之际,华为云也介绍了过去近一年,盘古在行业中的落地进展。盘古是首个定位于行业的大模型,有风向标意义。
业界看到,虽然行业是大模型落地的主战场,但相对消费类场景,行业落地很难。IDC中国高级研究经理崔粲总结,过去一年有四类应用是行业的共性方向:一是知识问答,如客服及设备管理;二是视觉模型泛化增强,如安全生产监控;三是数据分析助手;四是专业内容生成。但这些应用在很多行业人士看来,不算颠覆性。因此,目前有两种截然不同的声音,一是积极拥抱,另一是认为业务与大模型之间还较遥远。
而从华为云在大会上公布的案例看,盘古已深入到行业核心场景,如工业和制造,解决核心痛点,进展相对较快。分析多行业的案例,盘古大模型也呈现了一些典型打法和路径。
在落入一个行业之初,华为云首先与行业领军企业达成战略合作。如在钢铁这个大众眼中的传统行业,宝武钢铁集团是全球规模最大的龙头企业,在国家发展新质生产力,以及宝武集团全面推进AI战略转型的方针下,2023年,华为公司董事长梁华带队,拜访了宝武集团董事长胡望明,双方达成合作意向,提出共同研究现场痛点、难点的解决方案,形成钢铁冶金或工业领域大模型。
其次是华为技术专家下到一线。张平安介绍,过去一年,华为有超过500名专家到一线,跑工地、进车间。他们与客户专家及一线工人一起梳理需求。在宝武集团,双方决定挑战高炉炼铁和热轧钢带难题。
在热轧场景中,每次生产钢板的种类和尺寸不同时,都需要工程师重新调整参数,一次需要耗费约5天时间。客户期望通过大模型,降低热轧生产线调优时间,并提高预测精度和钢板成材率。再如,高炉被认为是“AI落地最难的应用场景”,它是5000m³的黑匣子,内部最高温度达2300℃。如果使用盘古大模型,将黑箱子变成灰箱,甚至白箱,指导高炉精准控制,每吨铁水就可减少1kg焦炭消耗,成本可降低3元,有望每年为宝钢降本超10亿元。
再次,大模型是极致的系统工程。在每个行业“解难题”时,一方面离不开通用底座和行业大模型的智慧升级,另一方面要在工程化上做得透彻,包括数据问题,都是非常系统化的工程,只有抠得很细,才能有好的效果。
目前盘古大模型已经在宝武钢铁集团1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。
在高炉场景中,双方一起在算法、数据、工程化多管齐下,解决高炉中上千种参数勾连耦合问题,以及数据误差大、高时滞性等问题,逐步将高炉变得“透明”、可控。
此外,从海内外前沿企业的探索看,大模型应用,需要构建一站式业务平台,包含高性能框架、大算力、各种大模型,以及丰富的工具。华为云也在构建这样的大平台。就在一周前,华为云宣布芜湖云节点上线,至此构建了三大核心枢纽的算力一张网,一步步解决AI自主算力供应短缺问题。
过去一年,盘古大模型保持了一定的节奏。张平安介绍,盘古已在30多个行业,落地到超过400个应用场景。从进展看,大模型目前主要还在解决核心单点问题。未来,当它从一个环节进入多环节后,将可能成为“中枢”一类的角色,连通企业的数据中台、各种业务系统和知识库,最终彻底重塑产业的流程。
03
实现行业价值,才是硬道理
最近几个月,大模型项目争夺和落地是市场的热点。一些大模型企业打响价格战。清华大学新闻学院元宇宙文化实验室主任沈阳认为,这说明各个大模型的功能和性能在快速接近,模仿GPT-4的阶段已基本告一段落,AI已从创新试验走向了大众推广阶段。随着规模急速扩张的阶段到来,市场份额成为首要关注点。“如果在这个阶段落伍的话,功能好(也)没有用了。”
一位大模型人士说,大模型价格战可能会重演安防市场的故事,“本来是很好的生意,因为价格战变得没那么好了”。另一位人士称,大家都是把最弱的模型给降下来了,性能强的模型依然很贵,这样的降价,意义不大。还有人士认为,这一轮降价基本是云厂商在打,云厂商的游戏是“羊毛出在猪身上”,哪怕API调用不赚钱,可以在其他服务上赚钱,这也逼着一些非云的大模型技术企业出走海外。
但更多的行业人士认为,大模型降价的本质不应该是价格,而是最终能让ROI为正。大模型降价,短期会推动更多的尝鲜及试用,但要想实现积极作用,还要看是否为客户实现了业务价值。
“客户对于最终产出物的核心关注点,就是ROI。”一位应用开发资深行业人士告诉数智前线,他当下正在落地多个大模型行业项目,“ROI的测算就是拿效果说话,甚至是一些较为直观的计算。比如,成本的节省数字,新客户及客户转化的量化数字,工作效率的提升数据。”毕竟大模型与早期互联网的游戏规则有很大不同。大模型的边际成本仍然非常高,每增加一个用户,基础设施所需增加的成本肉眼可见。这与互联网厂商当年靠“烧钱胜出”的情况完全不同。
而作为一种潜力巨大的新兴技术,以大模型为代表的人工智能,已成为发展新质生产力的重要引擎,尤其中国具有全球门类最齐全、体系最完整的工业体系,大模型与产业的结合,潜力更为巨大。今年开年,政府工作报告明确提出开展“人工智能+”行动。“人工智能+”已经成为国策。
从张平安的演讲中看出,华为云坚持AI for industries战略,深入行业,解决行业难题,靠价值打开巨大的产业空间,从而加速形成新质生产力。而“从产业中来,到产业中去”的路径,在当下诸多的挑战和竞争中,也更有可能把握住大模型最为关键的发展大潮。