金融版记者,长期关注外汇,大宗商品,全球货币财经政策,国内金融创新的报道与研究。
在朝阳永续首席金融工程师陈实看来,ChatGPT兴起,让不少量化私募纷纷“脑洞大开”。比如有些私募机构给ChatGPT一篇投研报告,要求它按照自己的需求,将相关报告摘要找出来;还有私募机构正打算用ChatGPT写投研报告或投资策略。
在他看来,这都得益于自然语言模型技术的蓬勃发展。
记者获悉,自然语言模型的发展,主要经历三个阶段。
第一阶段以语言统计模型为主,它的做法相对简单——即给它一句话,让它将这句话切成词,并根据上下文关系预测其中一个字的出现概率。但这个模型的两大痛点,一是文本语义识别能力不强,比如对语言统计模型而言,“你喜欢我”与“我喜欢你”是同一个意思;二是当文本内容较多时,语句统计模型的某个文字权重矩阵会出现偏差,不利于算法模型运算。
到了第二阶段词向量模型的诞生,有效解决上述两大痛点时也解决了切词后的文本信息丢失问题。但词向量模型也有某些缺陷,一是单词的向量是唯一的,无法区分某些多义词的多重含义,二是模型训练时容易出现维度“爆炸”,且训练过程是串行的,导致算力资源耗费巨大且训练时间漫长。
记者获悉,这导致前两个阶段的自然语言模型只能处理相对简单的工作,比如简单的文本解析、情绪分析与主题模型搭建,但无法处理复杂任务。而Transformer技术的兴起,彻底改变了这种状况。
究其原因,Transformer解决了自然语言模型的注意力机制问题,即通过词与词的关联性训练,它会给每个词之间设立单独的权重曲线,且通过并行训练模式大幅提升训练速度。正是Transformer技术的兴起,它将自然语言模型引入第三发展阶段——预训练语言模型,即它能通过训练,将文章主题与相关逻辑、内容资料“提取”出来,整合成新的文本提供给读者。
记者了解到,如今的预训练语言模型有两大代表技术,一是GPT,二是BERT,前者将自己生成的结果通过再训练并输入到模型,适合文本生成类工作;后者则通过上下游训练,比较合适语言理解工作,可以作为文本生成、更深层次的语义情感分析与阅读理解,信息检索与问答对话。
宽邦科技创始人CEO梁举告诉记者,若将AI模型分成两类,一是分析型AI,二是生成型AI,前者主要类似搜索引擎,提供一个分析结果与预算,后者则是生成用户所需的信息文本。
“ChatGPT属于后者,且它已经历多个发展阶段。如今ChatGPT3.5版本拥有逾1700亿参数,预计4.0版本的数据参数可能会再扩大100倍,预计未来3-5年,ChatGPT可能会自己写代码与文本,到时量化私募基金只需提一些投资策略文本需求,它就能直接写出来,包括图表与视频的生成。”他认为。
记者多方了解到,目前个别大型量化私募基金已开始尝试使用ChatGPT撰写投资策略代码,因为金融投资的文本信息需求,主要涵盖投资者与媒体的关注度,管理层、投资者与媒体的情绪,财务报告文本可读性,新闻的隐含波动率指数,投资者分歧,行业分类等六类。数据来源来自搜索指数、股吧数据、上市公司报告、上市公司电话会议等。若能将这些数据收集起来与词向量模型匹配,再通过ChatGPT按照自身要求生成更通俗易懂的自然语言文本,就能对行业相关上市公司各类信息的了解更加全面精准,从而促进投资策略的迭代升级与精准投资决策。
陈实告诉记者,目前量化私募基金提升数据与算法能力的迫切需求,主要表现在两方面,一是从分析师报告提取分析师的情绪,再做预测。二是对分析师报告股价同比性做研究,甚至建立分析师文本因子以预测未来个股投资的超额收益率。但这都需要ChatGPT的自然语言交互功能,以便私募基金更好地理解分析师在报告里的“情绪”与对上市公司投资价值的“预判”。
在上海蒙玺投资管理有限公司总经理李骧看来,包括ChatGPT等AI能力的持续发展,对量化私募基金提前洞察投资风险也有着较大的促进作用。比如随着量化私募行业规模增长,高频策略的集中度日益提高,令机构获取高频策略超额回报的难度增加,驱动高频策略私募纷纷拓展中低频策略,但这需要私募机构需不断优化风控能力,包括设定其他人尚未发现的风险点并进行求解。各类AI能力的持续发展,将有助量化私募基金风控能力的不断优化。
※ 回答内容仅为作者个人观点,与本报立场无关
如有疑问,请联系客服微信:touzitong21
如何客观量化中医特色诊断信息是涉及中医药传承创新的核心问题,也是制约中医药现代化的瓶颈问题。现代科技(如传感技术、图像处理、人工智能、大数据)正在为中医诊断的客观量化带来革命性的变革,通过多种技术手段
查看全部答案实现中医“千人千方”的个性化调理需求,正是现代科技赋能中医药的核心突破点。其关键在于将中医整体观、辨证论治的精髓,与大数据、人工智能、多组学技术、智能设备等深度融合,构建“数字化中医个体”并实现动态精
查看全部答案这是个好问题,并且我们呼吁中医药装备应该首先瞄准基层应用场景,中医药装备的生命力和成长土壤可能也在基层。针对基层医疗卫生场景的中医药装备研发,核心必须围绕“实用、好用、耐用、能用得起”展开,重点提升基
查看全部答案在回答中医药装备的重要性之前,我想先减轻一部分人的顾虑,中医药装备不是中医的“异化”,而是其生命力的当代延伸。正如针灸针从砭石演化至无菌套管针,拥抱技术不断创新才能更好传承。我们认为大力发展中医药装备
查看全部答案广州软件应用技术研究院(原广州中国科学院软件应用技术研究所,简称广州软件院)成立于2011年5月27日,当时是中国科学院软件研究所与广州南沙开发区管委会共建的独立运营事业法人单位。建院的目标是:发挥中
查看全部答案电梯零部件质量检测用 AI 大模型,主要是通过视频检测算法,替代人工肉眼检查,具体可以分四步走:第一步,收集缺陷数据,进行标注。把生产中常见的缺陷(比如齿轮裂纹、导轨划痕、焊点不平整等)拍成高清照片,
查看全部答案从两个方面来寻找,一个是企业中的某些重复的、低效率的或者容易出错的环节,比如企业产品的智能客服、企业领导的发言稿撰写、审核或比对文件信息等。一个是有数据积累的业务环节,比如投顾报告的撰写,历史的投顾报
查看全部答案从企业数字化发展历程来看,可以将其分为信息化、数字化和智能化三个阶段。在信息化阶段,是企业数字化发展的初级阶段,更多关注于技术的应用和内部流程的优化,表现在:1)应用ERP、CRM等通用应用软件,支持
查看全部答案蜂鸟音乐的指控有其依据,但可能争议较大,从现有公开信息来看不构成合理指控的可能性更大一些。首先,根据邓紫棋的公开声明,其所能够重新翻录录音制品依据的是我国《著作权法》第42条第2款的法定许可,即“录音
查看全部答案向音乐作品的原始著作权人支付报酬或版税分成,是著作权转让或授权合同中应当约定的属于受让方的基本合同义务之一。若本次争议双方签署的协议中包含这一条款,则蜂鸟音乐在长期未履行该义务且无合理解释和合法依据的
查看全部答案蜂鸟音乐早在2014年就将“邓紫棋”“G.E.M.”等注册为商标,解约后仍持续申请“邓紫棋”“G.E.M.”相关的新商标。截至目前,多个相关商标因蜂鸟音乐连续三年未使用被撤销,但仍有少数商标处于有效状
查看全部答案在演唱会中演唱歌曲的行为,属于我国《著作权法》中所规定表演权的范畴。因此,判断邓紫棋后续在演唱会中演唱相关歌曲是否侵权主要看相关歌曲的表演权归属于谁。根据蜂鸟音乐之前的版权声明,公司声称对邓紫棋201
查看全部答案在创作过程中,创作者应保留原始文件和时间记录,创作过程中的Demo作为作品雏形,建议保留原始文件和时间记录并进行登记。这可以作为证明作品创作时间和归属的重要证据。作品发生重大修改时,应当登记新版本以确
查看全部答案如果男方拒绝支付抚养费且失联,可以采取以下法律手段维护权益:一、法律依据1. 《民法典》第1085条:离婚后,子女由一方直接抚养的,另一方应负担部分或全部抚养费。2. 《民事诉讼法》:可通过法院强制执
查看全部答案离婚后若发现配偶在婚姻存续期间擅自将夫妻共同财产赠与第三者,你有权通过法律途径追回全部或部分财产。具体为:一、可追回的情形1. 赠与的财产属于夫妻共同财产,常见为现金转账、房产、车辆、奢侈品、大额消费
查看全部答案根据《民法典》第1088条,全职妈妈可主张家务补偿。即使夫妻共同财产制下,离婚时也可在财产分割基础上额外要求补偿。全职妈妈的隐形付出(如育儿、家务、照顾老人)均被认可,但全职妈妈需主动提出主张。法院会
查看全部答案在中国法律框架下,“净身出户”并非法定概念,但对方存在出轨、家暴等过错行为时,无过错方可以主张多分财产、离婚损害赔偿等权益。具体需结合证据和法律规则处理:一、法律对“过错方”的惩罚性规定1. 财产分割
查看全部答案在实践中,以下家务付出是可以量化的:1. 长期承担全部家务;2. 因家务放弃职业发展;3. 抚养子女、照料患病老人等专项付出。可以量化的家务付出,补偿计算是没有无固定公式的,但可以参考以下因素:当地家
查看全部答案在中国法律框架下,不知情的配偶是否需要承担对方的个人债务,需根据债务性质、用途及举证情况综合判断。具体为:一、法律基本原则根据《民法典》第1064条,夫妻债务的认定分为两类:1. 共同债务:需共同偿还
查看全部答案全职妈妈在争取子女抚养权时,需结合法律依据和实际策略,重点证明自身具备抚养能力和对子女成长最有利的条件。具体为:一、法律明确支持的情形根据《民法典》第1084条,法院判决抚养权的核心原则是:“最有利于
查看全部答案
