阿里巴巴的AI战略将多线并行。
21世纪经济报道记者白杨 北京报道
11月14日,阿里巴巴智能信息事业群对外发布了全栈自研、千亿级参数的夸克大模型,并表示该模型将应用于通用搜索、医疗健康、教育学习、职场办公等场景。
据介绍,夸克大模型是阿里巴巴智能信息事业群旗下夸克团队基于Transformer架构自主研发的多模态大模型,在此基础上,夸克还组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。
事实上,丰富的数据储备,也是阿里巴巴智能信息事业群推进大模型自研的推动力之一。一方面,夸克拥有十分全面的中文数据库,这使大模型能更好地理解、评估、提炼中文知识体系;另一方面,在过去的业务发展中,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,这也是训练大模型非常重要的数据。
在解决大模型“幻觉”以及对不良、虚假信息识别方面,夸克大模型建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。而在性能上,夸克团队表示,夸克大模型的整体能力已超过GPT-3.5,在写作、考试等部分场景中优于GPT-4。
另外,对于为何要自研大模型,阿里巴巴智能信息事业群解释称,这是服务于夸克的业务战略。今年以来,夸克App在产品迭代中已经在逐步融入AI技术,而夸克大模型将会优先落地在通识问答、专业搜索等领域。
阿里巴巴智能信息事业群总裁吴嘉表示,AIGC技术将会给搜索产品带来全新变化,夸克也将借助自研大模型进行全面升级,全新的夸克很快就会和大家见面。
(作者:白杨 编辑:张伟贤)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。