>首页> IT >

AI大模型私有化正野蛮生长:仅4个月接到上市公司大单_速看料

时间:2023-06-27 16:17:47       来源:腾讯网

作者|James

6月12日,在上影节期间界面新闻、娱乐资本论合办的“首届上海文娱科创沙龙”中,猴子无限CEO尹博昊和澜码科技创始人、CEO周健等嘉宾,在圆桌论坛上畅谈“低代码平权和私有化模型”的话题。


(资料图片)

这个“低代码平权”听起来挺玄乎,但实际上说的事情很简单:

一方面,原本并不是做技术,也没有在写代码的文娱公司,希望能够获得跟以前要聘请程序员才能拥有的,那种靠编程来解决问题的能力;

另一方面,是拥有技术的公司,知道AIGC是怎么回事,但他们致力于帮助更多的不懂技术的企业,让他们也能平等的拥有AIGC给他们带来的便利。

作为供需两端,随着AIGC新技术对开发门槛的不断降低,这两类公司就在拥抱人工智能,实现技术平权的道路上来了一场“双向奔赴”。

在沙龙前夕,娱乐资本论特意探访了三家在AI大模型领域崭露头角的公司,这三家公司都入选了娱乐资本论刚刚评选出的“AIGC50”榜单。它们分别以不同的方式解决了AI大模型的部署、智能文本处理和自动化平台的问题:

猴子无限专注于开源AI大模型的部署和优化,为中大型客户提供服务;

达观数据深耕智能文本处理领域,为大型企业建设智能知识库系统;

澜码科技在大模型上做自动化平台,帮助B2B的专业工作。

高速增长:成立刚4个月就接到大单

猴子无限的创始人和CEO尹伯昊是一位经验丰富的创业者。猴子无限成立于去年8月,专注于开源AI大模型的部署和优化。他们的目标是为中大型客户提供服务,特别是帮助那些想使用GPT解决问题的人。公司在创业初期就得到了知名投资人陆奇的“奇迹创坛”资金支持。

他们的客户包括海尔、字节跳动、香港大学等。“我们跟香港大学在做蛋白质合成方面的合作,港大为我们提供了近40万小时的算力支持,付了很多钱。” 

达观数据成立于2015年,已经在智能文本处理(IDP)领域深耕8年。他们的目标是为大型企业建设智能知识库系统,以提高信息管理和工作效率。

AI文本处理具有挑战性,“尤其是中文的语义分析和断句分析,我们背后还有‘话里有话’,人有的时候会通过语境来理解表面意思之外的深层含义。”

在ChatGPT发布之后,达观开始使用其在RPA和NLP领域的数据等积累,来训练其自己的大模型。“这种算法基础的积累使我们豁然开朗,一些东西处理起来更具有智能性和自动化。我们在写作RPA上具有优势,原来积累的优势都能用通用AGI的方式实现,这为我们提供了一个非常好的技术路径,所以我们感觉振奋。”

“我们在大模型上做自动化平台,帮助B2B的专业工作,确保其正确性、质量和安全性。”澜码科技CEO周健表示。

从创业到有产品出来,澜码大概用了四个月。创业两个月的时候,公司只有一个小demo,然后直接冲进了标杆项目当中。

“这段时间对我来说,实际上是很梦幻的。按照公司发展情况,我应该是先为市值2亿的公司服务,再是10亿,100亿……实际上,公司开了三个月,我已经与相比之下更头部的一家上市公司签约,并成功交付。现在应该有三五家上市公司在与我谈合作,客户的规模也是远超我的预期。本质上是微软和OpenAI创造了这种焦虑,我本身带着一点小光环,所以通过一些宣传手段就达到了这个成果。”

商业模式:不约而同服务大中型企业  

“我们核心是为中大型客户提供服务,向大企业提供本地化运行的解决方案。”尹伯昊说。“我们的解决方案很简单,就是帮助那些想使用(Chat)GPT解决问题的人,当他们发现GPT在解决问题上效果不佳时,会找到我们,我们只专注于这一点。”

企业给出商业机密数据,以此训练小模型或向量数据库,对于提升AI应用的行业效果至关重要。一般情况下,企业给的数据并不是结构化的,因此需要建立数据清洗的管线。

尹伯昊说,合作的第一步是深入了解客户的具体需求。他认为本地部署大模型,虽然表面看和ChatGPT的差异是生成效果问题,但本质上是个成本问题。“所以问题的方向逐渐从我可能比GPT效果更好,变成商业上更实惠的‘平替’。”

达观数据主要服务金融机构、智能制造和政府部门等大型企业客户。“我们的目标是为企业提供一个智能知识库,让他们能够更加高效地管理信息,提高工作效率。”

达观可以协助企业整理历史文档,并生成供大型AI模型决策使用的向量数据库。知识库可被视为企业或媒体的软实力,并可令企业深入洞察自身及市场状况,在市场中抢占先机。

在服务中信证券、招行、广发等金融系统客户时,达观提供信贷流程管理、风险控制和表格处理等文本处理,协助企业编写定期报告,审核财务报表。“我们打交道的这些客户,大家都非常的严谨,所以给我们的工期给的也都比较紧,提的需求也比较具体,也比较难。”

此外,达观数据还推出了嵌入WPS内的智能文本处理工具“达观助手”。

大模型作为统计模型,虽然可能会产生不准确的信息,但其强大的能力在于理解用户需求,并通过逻辑推理将其拆解成具体的行动计划。澜码科技将自己比作神经中枢,能够连接所有的软件和设备,成为用户需求的最终执行者。

澜码开发的自动化工具名为Ask Xbot,计划在7月底发布,可以通过语音命令调起Windows桌面应用和功能,就像增强版的Siri。特赞和轻流(Qingflow)等公司已经在内部试用。除此之外,他们还和一家头部办公厂商展开了合作,在其办公应用中的自动化处理项目已经交付,会在近期上线。

周健认为,做这个领域的护城河是私有数据。“你不会愿意把数据给大模型,我训练之后,小模型能提供个性化服务。大公司大模型的私有化部署报价都很高。”

竞争优势:从技术到工程各有千秋

在海尔,猴子无限提供了工业级的私有大模型部署方案。“过去这个过程需要很长时间,但我们在工程上做了很多努力,效果还不错。实际上,我们甚至没有去过海尔现场。”

“算法很难有壁垒,但是工程能力是有壁垒的。”尹伯昊介绍,他们有从开源社区招聘来的出色的工程和算法团队,他们之前参与过开源代码,工程能力很强,能快速实现功能。

尹博昊在“首届上海文娱科创沙龙”的圆桌论坛上。图/娱乐资本论

“本质上,你想要用最低成本解决中大型客户的需求,这是一个体系战争。如果早期的AI是一个好玩的想法和场景能赚钱的话,现在到了下半场,最后的竞争是体系竞争,谁拥有更好的组织,谁就能够取得成功。”

达观在智能文本处理领域有深厚的积累,而更让他们自信的是客户方面对自主可控的高度需要。

“数据的合理流动和数据安全非常重要。我们处理的数据都与企业密切相关,都是私有化部署,都与企业的经营管理数据息息相关。所以,我们必须确保系统内部的安全。我们提出了完全自主可控的知识产权,100%自研技术。”

达观数据正在与国产算力、推理芯片生产企业燧原科技合作。两家公司都是信创体系的一部分。

在与头部办公厂商合作初期,澜码科技花了一个月的时间帮助他们理解项目的核心目标,最初以为可以简单地开发一个工作台,实质上帮他们做了数据治理和API治理。这些实操过程中积累的宝贵经验,让他们跟同行间拉开了差距。

例如,澜码科技需要梳理该办公应用提供的API来构建基础设施,但在这个过程中,测试由该部分API生成的数据集时,一开始的准确率相当低。经过不懈努力,到项目结束时,准确率已经明显改善,使该功能达到了可用水平。

通过与该头部办公厂商的合作,澜码科技认识到行业的复杂性。该公司产品的国内用户,具有一种独特的“中国式表格”概念。单元格的数据不是结构化的,而是将表格作为空间使用,类似于画布。以至于在淘宝上有商家专门提供制作这种表格的服务,年营业额可达10亿元。

周健在“首届上海文娱科创沙龙”的圆桌论坛上。图/娱乐资本论

交互的细节和准确性至关重要。澜码的方案让用户可以不通过键盘和鼠标操作,而只是“声控”。但人机交互还包括动作、语速和表情等元素。经过反复测试,有些案例中用户话说到一半,系统就猜测到最可能的操作并已经开始自动执行。“即使是像微软copilot也只解决了15%的问题,最终的形态仍然不确定。”

未来展望:大模型的民主化、个性化  

在我们采访结束后不久的5月底,猴子无限发布了一个与Runway Gen2类似的图片生成视频的方案演示。尹伯昊兴奋地对我们说:“我们会提供一个的稳定的图生视频解决方案,我们会保证其控制性非常好。”

他计划将这个图生视频方案开源。他表示开源表面上看对企业“没有好处”,但通过行业影响力和定义行业标准,作为一种获客和传播渠道,其实贡献很大。

尹伯昊认为,大模型将变得民主化,每家公司、每个人都会有至少一个专属模型。“我觉得很多人对大模型的生态有很多误解,很多人认为大模型很贵,但我觉得大模型其实是赚钱的,不是那么贵。它的‘便宜’是指综合成本,将算力等成本分摊后就很便宜。我们现在进行微调和prompt优化都很便宜。”

达观认为,AGI的发展需要算力、算法、数据等多方力量共同发力才能实现。“我们当前最大的挑战是如何实现数字化转型,特别是如何有效应用大模型,这不是一家企业所能完成的,它必须形成一个生态,必须要有自建的供应链,必须自我组合,形成联合体。因此,"联合创新"这个概念近期被频繁提及。”

“我刚去参加了在贵阳举办的中国国际数据博览会,我们希望与能够产生优质数据的企业或机构建立良好的合作,因此提出了"创新联合体"这个概念。”

为进一步推动生态共建,达观与北大、复旦、交大、中央财经大学、上海财经大学、上海外国语大学等高校展开多样的合作,共建实验室,以共同推动文本处理在国内的技术发展。

澜码科技的长期目标是,在工程架构下有效利用大语言模型,提高API的数量、智能程度、通用性和易用性。他们计划在未来3-5年内实现这一目标,并在竞争出现时,通过大规模的产品实现高收入。

周健设想了一种名为“CEO Copilot”的概念工具,将工作流、日程、审批等做成对话框式交互,面向企业管理者推销,引起他们对GPT驱动的RPA工具的兴趣,激发后续采购。“很多企业的高层很焦虑怎么用,那我的逻辑是先建立销售渠道,然后等我有更大的产品时,就去推销。我先把这个东西像钉子一样塞进去,再卖别的产品。”

此外,澜码科技还关注如何通过Markdown作为交互,将对话框变成画布,以实现无限的可能性。他们设想未来的金融销售方式将通过Word文档和Excel表格进行,而不是通过与大量人员反复聊天。

“我不再做低代码,所有的RPA(机器人自动化)、低代码和BI(商业智能)都不会做。我会将它们封装成API,供我的投放系统调用。”周健提到,之前企业要做自动化加AI的工具,找NLP(自然语言处理)团队太贵了,现在成本低了很多。“对我来说,我前东家那种RPA只是我的供应商。我的核心是在大模型上重新做我的核心。”  

关键词: