华为的宏图是成为下一个十年最伟大的软件公司?
华为的“软”实力正在更迅速地刷新市场认知。
自去年底华为云正式发布需求管理服务工具——CodeArts Req以来,今年4月又推出自研自用的MetaERP,一个完全由华为自己的操作系统、数据库、编译器和语言做出来的管理系统软件。
【资料图】
而后不到3个月,华为云在今天的开发者大会(HDC.Cloud 2023 )上正式发布盘古大模型3.0,并再度强调了其定位——“AI for Industries”。同时从其发布会上披露的信息看,盘古大模型所覆盖的行业以及应用场景也更加下沉。
华为盘古大模型聚焦各行各业,为更多细分应用场景打造相应的解决方案
华为常务董事、华为云CEO张平安表示:“华为的盘古大模型不会写诗,只会做事。它要帮助各行各业,在各个领域,让AI来赋予价值,比如我们在金融,我们在政务,我们在矿山,我们在气象,都有很多的工作小组派下去,为各个行业带来价值。我们一直坚持的方向就是‘AI for Industries’。”
“AI for Industries”是一个愿景极高的口号,其根本目的就是让人工智能与各行各业深度融合。这家在过去被认为重新定义全球通信行业的公司,现在开始有可能凭借AI技术迭代这一结构性的变革机会成为全球软件行业的巨无霸。
本次发布会披露的信息中,华为盘古大模型3.0是一个完全面向行业的大模型系列,第一层包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,它们提供满足行业场景的多种技能。第二层是行业大模型,包括政务、金融、制造、矿山、气象、铁路、药物分子等大模型。第三层是面向更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
此外,华为云还发布了华为昇腾AI云服务,单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,构建了昇腾的计算引擎CANN、AI框架MindSpore,以及AI开发平台ModelArts,为大模型开发和运行提供分布式并行加速,算子和编译优化,集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。
前生今世
事实上,大模型并不是新鲜事物。早在2021年,华为云就发布了盘古大模型,当时包括NLP(中文语言)、CV、科学计算3个大模型,目的就是为行业和开发者建立一套通用、易用的人工智能开发工作流。
由于当时人工智能算法繁多,且碎片化严重。开发者面对每一个场景,都必须选择独立的模型,并配合数据处理、模型优化、模型迭代等一系列开发环境。当然,也无法积累通用知识,不同领域的数据差异较大,更需要不同的技巧进行微调,往往导致开发效率低下。
为了解决这一难题,预训练大模型相关研究应运而生。预训练大模型就是通过无监督或者自监督学习等深度学习的方法,配合大量参数的神经网络模型,从海量数据中获取知识并进行学习。如有特定开发任务,开发者就能按需调用相关模型和工具,结合行业经验,实现对大模型的预训练,以解决实际业务问题。
在这一背景下,华为盘古大模型在两年前就已经诞生,最初的目的就是面向To B端的行业用户和开发者,为其打造通用化的人工智能平台。正如第一次工业革命让生产从“小作坊模式”,转向“工业化生产模式”,而华为盘古大模型将改变传统“小作坊开发模式”,让开发者借助人工智能工具迈入全新的“工业化开发模式”。
不止是大模型
华为盘古大模型3.0还具有全栈技术加持的优势,能够提供高效的模型训练和推理能力。首先,华为从AI芯片到AI框架Mindspore,从全流程支持MLOps开发的AI平台ModelArts到基础大模型,均实现全栈自主创新;其次,昇腾AI云服务不仅提供稳定可靠的高效训练和推理能力,还具备队规模并行训练能力,加之全栈的性能优化,是提升大模型训练的出色平台;另一方面,由于华为的自研芯片和算力支持,有效抵御全球AI芯片短缺和价格暴涨的压力。
另一方面,华为作为云计算大厂,可提供多样化部署的能力,包括公有云场景;大模型专区(公有云);混合云场景3种模式,企业可根据自身特点和需要,选择适合的模式来建立自己的大模型。
此外,华为还拥有深厚的行业积累和核心Know-How沉淀,例如超过10个行业军团/系统部、超400个行业解决方案、7大行业aPaaS(应用程序平台即服务),以及盘古大模型行业开发套件、大模型训练工作流、数据撰写与标注平台等,实现快速开发行业大模型。
与实体经济深度融合
任正非曾表示,要让煤矿工人可以穿西装打领带工作。这一愿景的背后,离不开5G、人工智能、大模型等新兴技术在煤矿等实体经济场景中的应用。
煤矿,给人的印象是一项复杂性和危险性极高的工作。为了保证井下人员作业安全,通过人工智能实现“少人无人”的安全高效作业是煤矿智能化追求的重要目标。然而,在煤矿场景中仍然要面临着场景需求多、矿山间复制难、场景落地难、AI人才不足等诸多挑战。
华为云盘古矿山大模型可实现覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1,000多个细分场景,只需导入海量无标注的矿山场景数据,即可进行无监督自主学习,实现预训练的目的。
药物研发方面,华为盘古大模型也得到了不错的应用。例如,西安交通大学第一附属医院刘冰教授在新药研发中采用的一种AI辅助药物设计服务,正是基于华为云盘古药物分子大模型打造,突破性地研发出一款超级抗菌药Drug X(肉桂酰菌素),并将先导药的研发周期从数年缩短至一个月,研发成本也降低了70%,打破了医药界“双十定律”(即新药研发需要花费10年时间、10亿美元)。
此外,华为盘古大模型3.0还在铁路、气象、政务、金融、制造等行业实现了深入的应用,推动实体经济与传统行业实现深度融合。相比传统数值预测方法,盘古气象大模型的预测速度提升10,000倍,能够提供秒级的全球气象预报。
目前,通用大模型与行业大模型的定义已经有了明显的区分。例如,通用大模型主要面向工作和学习,就类似一个AI助手,协助人提升效率;而行业大模型更像是工具,与各行各业深度融合,提供更便利、更高效的AI工具或解决方案。可以说,行业大模型更贴近行业,更贴近实体经济,也更能为各行各业行业带来价值。
一直以来,华为盘古3.0大模型都没有强调生成式AI,而是始终明确自身行业大模型的定位。更值得注意的是,盘古大模型3.0除了预训练大模型外,还特别针对行业和场景提供了相应的解决方案和服务,让行业用户和开发者按需选择适合的服务,从而实现开发效率的提升。
同时,盘古大模型3.0还提供全栈自研的技术加持和优势,并配合华为多年来在各个产业的积累和沉淀,有助于解决各行各业的各类痛点,将原本“小作坊开发模式”,转变为“工业化开发模式”,实现效率的倍增。
可以预见的是,“千模大战”之下,行业必将迎来一波“洗牌”。只有真正带给行业价值的大模型才能突出重围,所以更聚焦也更懂行业的行业大模型的研发已是大势所趋。
正如华为轮值董事长胡厚崑在2023世界人工智能大会所说, 人工智能的发展,关键是要“走深向实”,赋能产业升级。当前阶段,华为在人工智能发展上有两个着力点:第一,打造强有力的算力底座,支撑中国人工智能产业的发展。第二,从通用大模型到行业大模型,让人工智能服务好千行百业、服务好科研创新。
福布斯中国独家稿件,未经许可,请勿转载
精彩资讯永不错过
▽