国内企业竞速“垂直大模型”新赛道
首个旅游行业垂直大模型“携程问道”、首个商查大模型“天眼妹”可信商业助理……在通用大模型方兴未艾的同时,面向垂直产业的大模型异军突起。国内多家企业加大“垂直大模型”研发投入,并在旅游、商业、金融、医疗、办公协同等领域加快应用。
“垂直大模型”异军突起
“带孩子出国玩有什么推荐?”“有什么适合带孩子玩的景点?”“有什么适合家庭入住的酒店?”“这里面哪些有户外泳池?”……诸如此类问题,以后可能不用再花费时间搜索或查阅旅游“攻略”。打开“携程问道”,跟机器人简单聊上几句,或许就能获得一份适合自己的旅游路线推荐,并且可以直接下单订机票、订酒店。
携程集团近日发布国内首个旅游行业垂直大模型“携程问道”。携程集团董事局主席梁建章介绍,“携程问道”筛选了200亿高质量非结构性旅游数据,结合携程现有精确的结构性实时数据以及历史训练的机器人和搜索算法,进行了自研垂直模型的训练。“我们投入了巨大人力,对旅行通用回复内容进行生成和校验,才能让我们提供的推荐可靠性要优于基础大模型”。
这只是一个缩影。近段时间,国内面向垂直产业的大模型异军突起。华为发布盘古金融、电力、药物分子三个垂直领域大模型;阿里云宣布与7家企业推动大模型在油气、电力、交通等行业落地;京东表示将发布千亿级大模型,进一步聚焦行业应用。
业内人士认为,目前,国内出现了做通用大模型和做垂直大模型两条路径。算力、大规模数据、高成本人才成为大部分企业入局通用大模型的“拦路虎”。深度定制、广阔的场景应用,则催生了国内垂直领域大模型的开发。
“垂直大模型是针对特定领域或任务进行深度学习训练的超大规模模型。相较于通用大模型,垂直大模型具有更强的领域专业性和任务针对性,能够更好地解决特定领域的问题和提供更加精准的服务。”国研新经济研究院创始院长、新经济智库首席研究员朱克力对《经济参考报》记者表示。
覆盖多行业多领域
记者获悉,垂直大模型正加快覆盖金融、医疗、商业、办公协同等行业和领域。
在金融领域,盘古大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。
在医疗领域,商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”,具有提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来将支持医学图像、文本、结构化数据等多模态综合分析。
在商业领域,天眼查与华为云共同推出商查大模型“天眼妹”可信商业助理,利用预训练语言模型中的自然语言理解能力、思维链推理能力,结合天眼查的中控技术,精准识别用户真实意图,并返回天眼查商业知识库中的商查数据和商查知识结果,实现数据可信。
在汽车领域,百度智能云为长安汽车提供了人工智能基础设施平台和数字人平台,双方正在开发一款基于文心大模型的生成式人工智能产品,以提升用户体验。同时,百度与吉利汽车一起打造汽车行业大模型,构建工厂数字化大脑,降低管理运维成本,提高资源利用效率。
此外还有办公协同类大模型、音乐创作类大模型等。如金山WPS办公大模型,具有文案营销设计、演示内容自动生成、文字润色、要点概括、大纲生成、文档内容问答、文学创作等功能。昆仑万维通过打造AI音乐大模型,赋能音乐人及音乐爱好者创作更多元且独特的音乐作品。
“未来垂直类大模型将是通用大模型的重要补充。例如针对医学、工业设计等某个细分领域的垂直大模型,能够覆盖通用大模型无法触及的区域,从而扩大人工智能的应用范围。”浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林对《经济参考报》记者表示。
大规模落地须补齐短板
业内人士认为,垂直大模型面向产业侧将产生广阔的市场需求,但大规模落地仍须加快补齐短板。
百度集团执行副总裁、百度智能云事业群总裁沈抖认为,大模型的产业落地需要“智能新基建”。在算力方面,各地需建设智算中心,为企业提供优质稳定的算力;在数据方面,需建设标注基地,为大模型提供高质量的标注数据。最终,让大模型能够覆盖长尾场景,持续提升行业生产力、感知丰富度、语言交互开放性以及模型可解释性等能力。
朱克力认为,垂直大模型大规模落地还面临数据集、计算资源、泛化能力等问题和挑战。他建议,加强数据集的建设和维护,通过多种方式获取高质量数据;利用现有计算资源进行模型训练和推理,通过并行计算、分布式计算等方式降低计算成本;持续优化垂直大模型,提高其泛化能力和可解释性,同时关注模型的可靠性和可信度。
“此外,在应用垂直大模型时,应保护用户隐私和权益。还需要不断进行技术创新和优化,持续关注技术发展和应用所带来的挑战。”朱克力说。