大企业初炼大模型,数据是“拦路虎”

内容摘要央企国企等大型企业成为大模型落地的急先锋。这些企业业务覆盖宽广,企业体量庞大。它们既可以为大模型提供用武之地的丰富场景,又能支付起早期大模型落地的巨大成本。不过,随着DeepSeek免费开源崛起,数据问题成为阻碍大模型落地进程新的拦路虎。很

央企国企等大型企业成为大模型落地的急先锋。

这些企业业务覆盖宽广,企业体量庞大。它们既可以为大模型提供用武之地的丰富场景,又能支付起早期大模型落地的巨大成本。不过,随着DeepSeek免费开源崛起,数据问题成为阻碍大模型落地进程新的拦路虎。很多央企国等大型企业业务数据分散且格式多样,需解决非结构化数据的清洗、标注和知识化问题。

“大模型应用场景市场刚刚开始,目前的应用还是冰山一角。企业会先拿出边缘性场景做尝试,逐步走到核心场景,也会从一些局部的部门或者局部岗位开始尝试,逐渐走到全部岗位,也就是所有系统都用大模型迭代。”亚信科技执行董事兼CEO高念书对记者表示。

落地大企业

大模型交付的业务,对冲了亚信科技传统业务的下滑。

三大通信运营商近年来缩减了对5G的投资,这直接影响亚信科技的相关业务。而另一方面,央企国企等大型企业正在积极搭建自己的大模型能力,这为亚信科技的转型提供了缓冲地带。

“垂直行业我们不想把摊子铺得太大,也不想踩太多坑,所以风险控制方面会非常关注,因此会聚焦在两个大的方向,一个是我们5G专网的应用,另外一个就是大模型应用交付。”高念书表示。

阿里巴巴、百度等企业的大模型是亚信科技向企业交付垂直产业模型的底座。2023年4月份,亚信科技跟阿里云签署合作协议,从当年6月份开始大量做场景部署。

“大模型交付商机主要在能源、电力、航空、烟草、金融、政务、医疗这些大的领域。”高念书对记者表示,“我们很多标杆案例,主要面向一些央企、国企。”

央企国企等大型企业落地大模型,也是从最初简单的问答、BI(商业智能)场景,逐渐做更深入的场景,比如亚信科技帮电网做的调度场景、网络规划等场景,以及航空领域的机务助手、零配件调度场景。

中关村科金总裁喻友平同样感觉到央企国企对人工智能的热情,该公司专注垂类大模型技术与应用,拿到不少做垂类场景的央企国企订单。

亚信科技和中关村科金有相似之处。它们目前都不做基础大模型,而专注于在基础大模型之上,帮企业落地垂类大模型应用,成为打通产业和模型的桥梁。

大模型还在不断迭代,落地过程尚处于探索阶段。企业在落地大模型的过程中,都必须投入不菲的成本。

算力底座是必需的花费,购买英伟达或者本土企业的算力卡,这就一笔高昂的开支。即便DeepSeek大模型,它的满血版所需要的算力投入“也得好几百万”。而此前,企业还需要购买闭源大模型,据喻友平观察,“大模型刚出来的时候,奇货可居,上千万价格都有”。

这么大额的投资,企业不得不考虑投资回报。

“投多少,能挣多少钱,能节省多少成本?企业得算账。”喻友平表示。在一些应用场景,比如智能营销和客服,企业的账目容易算出来,央国企和民企都愿意落地场景垂类大模型应用,甚至民企积极性更大。智能客服就是中关村科金最主要的产品之一。

但是在生产、研发和运维这些核心业务场景中,大模型如何发挥作用,企业还看不到清晰的图景。

“目前大家还在摸索阶段,很多人还处在不知道怎么做的阶段。企业去算ROI(投资回报率),可能算不清楚,就只能算长期账。”喻友平表示,“我觉得这就是央国企等大型企业的长处,它们基本盘大,敢于投入。在核心的生产、研发等业务场景中投入大模型,它们更积极。”

数据是难题

DeepSeek把大模型价格打下来,企业落地大模型的成本低了。

在大模型的价格战中,大模型价格从千万级下降。“后来百万级别也很多,再后来就是200万也卖、100万也卖。”喻友平对记者表示,DeepSeek出来之后,一个显著的变化就是,没有人去买一个闭源大模型了,“模型成本直接降到零了”。

“DeepSeek来了后确实对大模型交付工作产生了非常大影响,之前大厂提供的大模型基本上不会为客户提供微调和训练的服务,因为训练一圈大概是千万级以上投入,客户一般支付不起。而且训练需要海量数据,一般客户私有数据也不具备这个数量级。”亚信科技副总裁、云事业部总经理傅葳对记者表示。

价格不是大模型落地企业唯一的拦路虎。

大模型的能力日新月异。企业本身对于什么场景可以用大模型,这个大模型怎么用以及预期效果是什么,会带来什么样的新问题,这些方面的经验都不充足。

“在这里面更重要一点就是企业的数据问题。”傅葳说,数据是大模型的前站,也是企业的核心资产。

在人工智能浪潮里,应用大模型的企业通常既没有能力自产算力,更难以开发自己的基础大模型,只有经年累月积累的业务数据是自己的,而且是核心秘密。企业担心业务数据外流造成损失,所以大型企业往往愿意本地化部署大模型。但这些数据通常是初级和粗糙的,难以直接投喂给大模型。如果企业内部没有做过数据收集、整理、清洗,就很难一站式地部署大模型。

“我们接触很多客户,他举手说要做大模型,提出很多场景,但是我们入场第一站都还是帮助他做数据收集清洗,包括整理、标注这些工作。这些工作量比较大,也会带来比较大的成本。”傅葳表示。这些工作都需要亚信科技、中关村科金等企业去做。

“我们认为大模型应用场景市场才是刚刚开始,我们目前看到的应用还是冰山一角。”高念书认为,未来的石油、石化、机场等各个行业,都会有自己专业模型以及专有智能体。

喻友平认为,随着越来越多的企业将大模型应用到核心业务中,企业大模型的胜负手不再是模型参数大小,而是谁更懂用垂类知识和经验提升业务价值。垂类大模型作为大模型进一步商业化的关键,已成为企业数智化升级的必选项,无论是央国企还是民企,都一样。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1