在华为开发者大会(云)2023活动上,华为推出了盘古大模型3.0,作为AI行业的新计算能力。盘古大模型3.0将专注于建立核心竞争力,帮助客户、合作伙伴和开发人员运营人工智能,并推动跨行业的真正价值创造。
盘古大模型3.0现已推出,涵盖政府、金融、制造业、矿业、气象等多个领域。现在是时候探索盘古大模型3.0在这些关键领域的含义了。
盘古大模型3.0采用L0、L1、L2三层“5+N+X”架构,让我们详细解释一下。
L0层由五个基础模型组成:NLP、CV、multimodal、预测和科学计算,它们提供了通用技能,为特定行业的应用程序提供了无限的可能性。
盘古3.0有100亿参数、380亿参数、710亿参数、1000亿参数等不同规格,满足客户不同的需求和不同的时延、响应时间标准。还提供了全新的功能集,例如基于知识的问答、文案和盘古NLP模型的代码生成;盘古多模态模型的图像生成与理解。所有这些功能集都将提供给客户和合作伙伴,并且无论模型大小(参数数量)如何,它们都是一致的。
L1层由N个行业定制模型组成。华为云可以为客户提供在开放行业数据集上训练的行业模型,包括政府、金融、制造业、矿业、气象等行业的盘古模型。或者,客户可以使用基于华为L0或L1盘古模型的自己的数据集来训练自己的模型。
L2层为特定行业场景和任务提供预训练模型,如智能政务热线、智能支行助理、先导化合物筛选、输送带异物检测、台风轨迹预测等。这些模型可以快速部署并缩短响应时间。
客户可以基于华为L0或L1盘古模型,使用自己的数据集训练自己的模型。我们一起来看看华为盘古大模型不同领域所取得的成效:
盘古采矿模型:
盘古采矿模型已在中国8个煤矿得到应用。单个模型可以支持1000多个煤矿开采子场景,包括挖掘、驾驶、设备控制、运输、通风、洗煤等。它有助于建造更安全、更智能的煤矿,只需要一个小的地下工作人员,甚至根本不需要地下工作人员,就能高效地运行。
盘古铁路模型:
铁路方面,盘古铁路模型可以准确识别67种货运车辆和430多种铁路以及鉴别货运车辆故障。盘古铁路模型可以快速扫描铁路TFDS系统捕获的数百万张图像,并过滤掉95%的无故障图像。通过这种方式,列车检查员可以专注于剩余的图像,这有助于他们提高效率和准确性。
盘古气象模型:
盘古气象模型(或盘古天气)是第一个在精度上超过最先进的数值天气预报(NWP)方法的人工智能模型。预测速度也快了几个数量级。过去,预测台风在10天内的轨迹需要在3000台服务器的高性能集群上进行4到5个小时的模拟。现在,盘古模型可以在单个服务器的单个GPU上在10秒内完成,并且结果更加准确。
盘古金融模型:
金融服务,盘古金融模型在包含银行政策、流程和案例研究数据的大型数据集上进行了预先训练,可以根据客户的服务请求自动为银行柜员生成正确的服务工作流程和指南。这有助于他们更有效、更自信地处理服务请求。从本质上讲,盘古金融模型为每个银行员工提供了自己的个人智能助手。
盘古制造模型:
制造业,在过去,为一条生产线制定一天的零件分配计划需要三个多小时。盘古制造模型经过华为自身生产线的零部件数据、业务流程和规则的预训练,能够准确理解意图。通过调用华为OptVerse AI Solver插件,盘古模型可以在1分钟内制定3天的生产计划。
盘古药物分子模型:
医药研发,开发一种新药平均需要10年时间,耗资10亿美元。现在,盘古药物分子模型能够将先导化合物的发现从几年缩短到一个月,将药物研发成本降低70%。利用这个模型,由西安交通大学刘冰教授领导的团队最近发现了一种新的超级抗生素——这是40年来发现的第一种新型抗生素,具有全新的蛋白质靶点,并且属于自己的一类。
在不久的将来,华为可能会通过即将推出的版本将盘古AI模型的范围扩展到更多领域。