1月30日,全国产算力平台“飞星一号”首个成果发布,“中国算力”在AI大模型方面迎来最新突破。
当天,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火认知大模型V3.5;星火语音大模型、讯飞星火开源大模型“星火开源-13B”也在发布会上首次亮相。
目前,星火开发者超35万生态增长迅猛,打造个人应用赋能亿万用户;讯飞星火赋能千行百业,携手保险、银行、能源、汽车、通话等领域联合龙头企业,打造大模型赋能的应用标杆。站在2024年的开端,通用人工智能领域未来无限广阔,人工智能大模型也必将在科技革命中引燃新的星火。
“我们展望一个充满希望、孕育着生长能量的春天。相信2024年一定可以实现星火燎原,通用人工智能不仅能够在中国各大领域深度而广泛应用,而且我们在源头技术创新、在大模型的底层能力上也会站上全新台阶。”科大讯飞董事长刘庆峰说道。
算力是人工智能发展的核心动力,算力资源是支撑数字经济发展的坚实基础。
2022年,美国商务部向英伟达、AMD等该国芯片厂商出台了对华出口禁令,不断收紧对华芯片出口管制措施。
受上述政策影响,打造中国坚实的算力底座,既是满足各行各业多样化的AI算力需求,更是打破芯片“卡脖子”封锁、为全球范围内大模型应用开辟新的算力之源。
“国产大模型只有基于中国自主创新的算力底座才有大未来。”早在2023年,刘庆峰就曾公开表示。
人工智能大模型的研发与应用依托于强大的算力底座,大模型必须建立在完全自主可控的平台上,才能掌握通用人工智能时代的发展主动权。讯飞星火V3.5大模型的面世,标志着国产算力平台“飞星一号”迎来最新突破。
为了抢抓通用人工智能时代的发展主动权,科大讯飞对国产算力底座的布局较早。2023年10月,科大讯飞就曾宣布联合华为打造基于昇腾生态的自主可控大模型算力底座“飞星一号”平台。在国产算力底座“飞星一号”启用后的90多天里,科大讯飞启动了对标GPT-4的更大参数规模的大模型训练。
如今,首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。
“我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。”刘庆峰指出,“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”
刘庆峰介绍,讯飞星火大模型的开发者数量位居国内第一,在讯飞开放平台之上,大模型总开发者超35万,其中企业开发者超22万,开发者数增长迅猛。
“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”发布会上的实操演示环节,刘聪和讯飞星火V3.5现场互动,讯飞星火V3.5一口地道的东北话逗乐现场观众。讯飞星火V3.5快速为刘聪定制了旅游攻略,还催促他赶快买票,毕竟春运机票紧俏。
人工智能也可以充满人情味与趣味性。讯飞星火V3.5不仅在语义理解、指令跟随和多轮对话的演示中,展现出优异的能力,更是在情绪感知和拟人合成方面表现出色。
2023年5月,科大讯飞正式发布星火认知大模型,历经四个版本的迭代升级,讯飞星火已发展为首批覆盖安卓和iOS主流应用市场的国产大模型。此次基于国产“飞星一号”算力底座训练的讯飞星火V3.5大模型问世,还有哪些应用亮点与技术突破值得行业关注?讯飞星火V3.5如何为人类生活带来真正有效的解决方案?
刘庆峰介绍,讯飞星火V3.5大模型对标国际最先进水平,在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升,赋能千行百业,助力科研、工业等领域刚需应用提质增效。
应用方面,人工智能大模型首先赋能的场景,就是教育领域。科大讯飞此次重磅推出星火智慧黑板,具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享四大功能。“黑板不再是简单的板书工具,而是跃迁成为教师的AI助手。”刘庆峰提及,在最近的实际展示与使用中,升级后的星火智慧黑板得到了师生、教育专家和业务合作伙伴们的高度评价。
教育领域之外,讯飞星火V3.5大模型全新赋能知识学习与内容创作,大模型全新提升数智化生产力,可以更好助力科研、工业等民生刚需领域提质增效。科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品讯飞智文,对年终总结计划、述职PPT、活动策划、政策问答等任务“信手拈来”。
大模型也在持续赋能办公硬件,自去年5月讯飞星火正式发布起,有超过60万讯飞智能办公本、智能录音笔用户累计调用语篇规整、会议纪要、自动写稿等能力650万次,市场用销量表达好评;软件应用方面,星火赋能个人应用打造,目前基于讯飞听见、讯飞星火APP、讯飞输入法等应用,已累计赋能亿万用户。在星火大模型赋能下,越来越多的用户拥有专业AI助手。
行业测评显示,当前,讯飞星火已稳居国产大模型头部梯队。2023年8月,《麻省理工科技评论》中国对多个中文大模型平台的代表作出评测,讯飞星火认知大模型V2.0荣获“最聪明”的国产大模型称号。
人工智能为人类实现无障碍沟通构建了科技的桥梁。在实现简洁明了、快速准确的基本沟通需求之外,人工智能如何进一步做到“声情并茂”地演绎出有韵律、有音色、有情绪的沟通场景?
事实上,智能语音有着较高的技术壁垒,囊括声学、语言学、计算机等多学科交互技术,在全球范围内,也仅有少数通信巨头及高科技厂商在智能语音市场拥有竞争力。
“1999年,中文语音市场全部被国际通信巨头控制,中国人被掐住了咽喉;我们创办科大讯飞,提出要让中国语音技术做到全世界最好,要在多语种技术上做到全世界第一。”刘庆峰在讯飞星火大模型首次发布时曾表示。
如今,在讯飞星火V3.5发布会上,科大讯飞首次发布星火语音大模型。“通过星火语音大模型的评测效果,我们非常自豪地告诉大家,科大讯飞继续保持了全球领先的水平。”刘庆峰说道。
刘庆峰介绍,星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。
“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。
在场景应用方面,星火语音大模型不止助力国际沟通,还能“百搭”更多场景,赋能实际应用。
刘庆峰介绍,在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互变革,如赋能汽车,智能驾舱、智能座舱、智能导航、音乐控制等交互体验将进一步优化;陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。
在此优势下,语音大模型的能力升级也应用于C端硬件产品。发布会上,刘庆峰介绍了搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷,增强式翻译技术让翻译机化身AI翻译助手。据介绍,此次讯飞翻译机多语种自动识别升级,将支持35种语言,为跨语言沟通提质增效;增强式翻译提供中英双语服务,让跨语言交流更加省心出彩。
在此次发布会上,科大讯飞还发布了首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B。
据介绍,本次开源拥有130亿稠密参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。
刘庆峰透露,星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅,在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,实用性大幅提升,在处理复杂的自然语言任务时更加得心应手。
基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,场景应用效果领先,训练策略针对昇腾算力极致优化。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
“开源只有更多的场景落地,才能更好地增进生态合作。目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。”刘庆峰指出。
目前,全国各省已陆续进入“两会时间”。据记者不完全统计,已有近10个省份的政府工作报告规划了新一年大模型或通用人工智能的发展蓝图。
在今年的各地“两会”上,北京、上海、天津、重庆四大直辖市密集出台人工智能支持政策与培育方案,推动通用人工智能产业化应用由虚向实;广东省致力打造通用人工智能产业创新引领地;山东省围绕人工智能等领域实施20项左右前沿技术攻关;河北省布局人工智能算力中心等新基建,年内重点建设投资2000亿。
步入2024年,国产算力平台正迎来新的战略机遇期,以大模型赋能千行百业的时代已经到来,进入应用落地的关键时期。
在1月23日发布的安徽省政府工作报告中指出:“科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。”
“讯飞星火”作为安徽科技创新实现新突破的有力佐证,正式被写入安徽省政府工作报告并获肯定处于“全国领先水平”,成为安徽省通用人工智能发展的标志性节点,并且在未来还将持续赋能产业生态发展。此外,由安徽省农业农村厅联合科大讯飞打造的“耕云农业大模型”也在列安徽省政府工作报告,大模型助力科技强农,赋能各行各业的高质量发展。
科技创新看安徽,人工智能看合肥。事实上,早在去年10月,安徽省便将“打造人工智能科技创新策源地和新兴产业聚集地”作为抢抓通用人工智能机遇的战略目标,起草发布了《安徽省通用人工智能创新发展三年行动计划(2023—2025年)》,加速推动通用人工智能产业化落地。此外,合肥人工智能产业入选国家战略性新兴产业集群,战略性新兴产业占规上工业比重超56%。
讯飞星火V3.5大模型作为“飞星一号”算力平台的首个应用成果,构建了业界领先的大模型开发者生态,将为产业生态发展提供更多选择,也将推动国产大模型的自主创新。
展望未来,刘庆峰表示:“在今天的大模型时代,我们绝不能只用开源模型做应用落地,在通用大模型的底座上一定要有国家队站出来。”
刘庆峰强调,当前,发展通用人工智能是必须要做的事情,否则工业、科研、民生等各个专用领域都会极大落后于世界,而中国是世界唯一有望成为智慧涌现第二极的国家。
“通用人工智能大未来刚刚开启,它必将深刻改变世界的未来,需要顶天立地的长期主义精神。”展望2024年讯飞星火大模型发展,刘庆峰指出,一是一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果;二是2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越;三是高楼大厦要建立在安全可控的平台之上,要实现自主可控平台上的生态繁荣。