百川智能大模型能力再迭代 正式开启商业化进程

21Tech白杨 2023-09-25 19:16

过去半年,百川智能平均每28天便推出一个大模型。

21世纪经济报道记者白杨 北京报道

9月25日,百川智能发布Baichuan2-53B 闭源大模型,全面升级了Baichuan1-53B的各项能力。与此同时,作为首批通过备案的大模型企业,百川智能此次还开放了Baichuan2-53B API接口,正式进军To B领域,开启商业化进程。

目前,由搜狗创始人王小川创办的百川智能,在经过近半年的发展后,已经形成了“开源+闭源”大模型并行的发展布局。值得关注的是,此次发布的Baichuan2-53B已经是百川智能的第6款大模型,这意味着,自4月10日成立以来,该公司平均每28天便推出一个大模型。

9月初,百川智能宣布开源Baichuan2-7B、Baichuan2-13B等大模型,并且均为免费可商用。王小川当时表示,百川智能刚成立时,原计划是今年三季度发布500亿规模参数的模型,四季度发布对标ChatGPT 3.5的模型,在明年一季度发布超级应用。但在6月份的时候,王小川看到了中国市场存在做开源模型的需求,于是百川智能率先发布了多款开源大模型产品。

据王小川透露,截至9月初,百川智能发布的Baichuan-7B、Baichuan-13B两款开源大模型下载量已经超过500万。

当然,在开源之外,百川智能也在发力迭代闭源大模型。今年8月8日,百川智能发布了搜索增强大模型Baichuan-53B,在此基础上,Baichuan2-53B则重点在数学和逻辑推理能力维度进行了强化。

另外在解决业界关心的大模型幻觉问题上,Baichuan2-53B也从不同方向做了优化。比如在提升数据质量方面,Baichuan2-53B独创了一套数据质量体系,以低质、优质为标准将数据进行分类;另外在信息获取方面,Baichuan2-53B则对指令意图理解、智能搜索和结果增强等多个模块进行了升级。

据百川智能透露,经过FacTool的评测,Baichuan2-53B 的综合得分为140.5,在主流基础大模型中仅排在GPT-4之后。而FacTool是由上海交通大学、卡内基梅隆大学、香港城市大学、Meta 等机构学者共同提出的一款能够查核大模型生成内容事实准确性的通用框架。

而在大模型能力迭代同时,百川智能此次也将Baichuan2-53B的API接口进行了开放,这意味着企业和开发者可以通过API将Baichuan2-53B集成至他们的应用程序和服务中。

作为一家创业公司,百川智能不仅需要展示在产品技术上的能力,更需要对大模型的商业模式进行验证,因为在目前的市场环境下,百川智能需要获得造血能力,才能进一步去探索大模型技术更前沿的创新。

(作者:白杨 编辑:林曦)

白杨

IT版记者

关注科技互联网领域报道。微信:by_xiansheng(加好友请备注姓名、公司及职务)