金融版记者,长期关注外汇,大宗商品,全球货币财经政策,国内金融创新的报道与研究。
在朝阳永续首席金融工程师陈实看来,ChatGPT兴起,让不少量化私募纷纷“脑洞大开”。比如有些私募机构给ChatGPT一篇投研报告,要求它按照自己的需求,将相关报告摘要找出来;还有私募机构正打算用ChatGPT写投研报告或投资策略。
在他看来,这都得益于自然语言模型技术的蓬勃发展。
记者获悉,自然语言模型的发展,主要经历三个阶段。
第一阶段以语言统计模型为主,它的做法相对简单——即给它一句话,让它将这句话切成词,并根据上下文关系预测其中一个字的出现概率。但这个模型的两大痛点,一是文本语义识别能力不强,比如对语言统计模型而言,“你喜欢我”与“我喜欢你”是同一个意思;二是当文本内容较多时,语句统计模型的某个文字权重矩阵会出现偏差,不利于算法模型运算。
到了第二阶段词向量模型的诞生,有效解决上述两大痛点时也解决了切词后的文本信息丢失问题。但词向量模型也有某些缺陷,一是单词的向量是唯一的,无法区分某些多义词的多重含义,二是模型训练时容易出现维度“爆炸”,且训练过程是串行的,导致算力资源耗费巨大且训练时间漫长。
记者获悉,这导致前两个阶段的自然语言模型只能处理相对简单的工作,比如简单的文本解析、情绪分析与主题模型搭建,但无法处理复杂任务。而Transformer技术的兴起,彻底改变了这种状况。
究其原因,Transformer解决了自然语言模型的注意力机制问题,即通过词与词的关联性训练,它会给每个词之间设立单独的权重曲线,且通过并行训练模式大幅提升训练速度。正是Transformer技术的兴起,它将自然语言模型引入第三发展阶段——预训练语言模型,即它能通过训练,将文章主题与相关逻辑、内容资料“提取”出来,整合成新的文本提供给读者。
记者了解到,如今的预训练语言模型有两大代表技术,一是GPT,二是BERT,前者将自己生成的结果通过再训练并输入到模型,适合文本生成类工作;后者则通过上下游训练,比较合适语言理解工作,可以作为文本生成、更深层次的语义情感分析与阅读理解,信息检索与问答对话。
宽邦科技创始人CEO梁举告诉记者,若将AI模型分成两类,一是分析型AI,二是生成型AI,前者主要类似搜索引擎,提供一个分析结果与预算,后者则是生成用户所需的信息文本。
“ChatGPT属于后者,且它已经历多个发展阶段。如今ChatGPT3.5版本拥有逾1700亿参数,预计4.0版本的数据参数可能会再扩大100倍,预计未来3-5年,ChatGPT可能会自己写代码与文本,到时量化私募基金只需提一些投资策略文本需求,它就能直接写出来,包括图表与视频的生成。”他认为。
记者多方了解到,目前个别大型量化私募基金已开始尝试使用ChatGPT撰写投资策略代码,因为金融投资的文本信息需求,主要涵盖投资者与媒体的关注度,管理层、投资者与媒体的情绪,财务报告文本可读性,新闻的隐含波动率指数,投资者分歧,行业分类等六类。数据来源来自搜索指数、股吧数据、上市公司报告、上市公司电话会议等。若能将这些数据收集起来与词向量模型匹配,再通过ChatGPT按照自身要求生成更通俗易懂的自然语言文本,就能对行业相关上市公司各类信息的了解更加全面精准,从而促进投资策略的迭代升级与精准投资决策。
陈实告诉记者,目前量化私募基金提升数据与算法能力的迫切需求,主要表现在两方面,一是从分析师报告提取分析师的情绪,再做预测。二是对分析师报告股价同比性做研究,甚至建立分析师文本因子以预测未来个股投资的超额收益率。但这都需要ChatGPT的自然语言交互功能,以便私募基金更好地理解分析师在报告里的“情绪”与对上市公司投资价值的“预判”。
在上海蒙玺投资管理有限公司总经理李骧看来,包括ChatGPT等AI能力的持续发展,对量化私募基金提前洞察投资风险也有着较大的促进作用。比如随着量化私募行业规模增长,高频策略的集中度日益提高,令机构获取高频策略超额回报的难度增加,驱动高频策略私募纷纷拓展中低频策略,但这需要私募机构需不断优化风控能力,包括设定其他人尚未发现的风险点并进行求解。各类AI能力的持续发展,将有助量化私募基金风控能力的不断优化。
※ 回答内容仅为作者个人观点,与本报立场无关
如有疑问,请联系客服微信:touzitong21
坦白讲,纯技能角度,AI Agent绝大部分都比我做得好。比如编程,我虽然是北大计算机系本科、海外计算机系硕士,但多年没写代码,AI编程肯定比我强;还有写文章,它能把我口语化的表达整理成规范文字,虽然
查看全部答案这个问题很关键,我作为理科生,也严格思考过。首先,必须明确:任何系统都存在安全漏洞,只是概率高低不同,安全问题的绝对性是成立的。其次,重点在于如何隔离漏洞、防范风险,以及控制损失大小,这一点必须想清楚
查看全部答案有,而且很多,几乎每周都会遇到。印象最深的有两个坑:第一个坑,AI曾经把我花了三周手动写的内容全部删除了。原因是我让它执行一个小任务,但它的记忆出现错乱,误删了所有内容。当时这个项目是一次性的,我不是
查看全部答案这个问题很深刻,我自己也有焦虑。但我有两个朴素的建议:第一,找到自己当下的满足感和幸福感,立足当下。不要想太多关于AI未来、工作变化的宏大命题,尤其是家长,想太多没用,反而会内耗。回到生活本身,孩子开
查看全部答案我更愿意把AI Agent看作“AI时代的计算机”——企业要不要用它,核心不在于AI本身,而在于企业决策层有没有清晰的认知:比如企业的客户是谁、战略是什么、产品是什么、价值链是什么,老板想让企业走向哪
查看全部答案主要是两类人群:第一类,需要处理大量信息、文件,频繁产生内容、分析报告或给客户建议,且每天信息来源多、有高频重复工作的人群。比如咨询师、保险经纪人、财务分析师、法务、金融分析师等。过去他们需要靠自己阅
查看全部答案关于“训练AI”和“掌控AI”的平衡,我的建议是“目标导向”:如果你有具体的工作、业务目标,想要拿到更好的结果,不妨多尝试用AI协同,慢慢摸索掌控AI的方法,同时根据需求训练AI适配自己的需求——两者
查看全部答案心源性猝死实际上是心脏病致死的一个较为重要的原因,并非突然增多或减少,而是一直存在。由于传媒影响力强大,在“人人都是自媒体”的传播效应下,许多公众人物或运动员猝死的情况为大众所知,相对而言似乎更为常见
查看全部答案对于马拉松运动员或从事剧烈运动的人群而言,他们实际上是在挑战自身极限。在这一群体中,运动前的评估极为重要。部分人存在心脏结构异常,或是冠状动脉、血管存在异常,若未进行仔细评估,或有所忽略,亦或是未留意
查看全部答案压力过大,意味着您可能平时对自身身体状况关注不足,未养成健康的生活习惯。您或许因忙于工作或事业,存在熬夜、连续长时间工作以及高强度工作等情况,未能将血压控制在较为安全、理想的范围,血脂升高、血糖升高等
查看全部答案如今部分心血管疾病呈现出年轻化趋势,这是由于生活水平不断提升,脑力劳动者数量增多,体力劳动者数量减少,人们平时不太注重体育锻炼与身体养护。许多患者在年轻时便出现“三高”症状或具备“三高”的危险因素,即
查看全部答案首先,应尽量维持良好的生活状态与生活习惯。例如,需保持规律的作息,尤其要保证充足的睡眠时间,每日至少应保证6小时以上的睡眠。其次,应争取每周进行1.5-2小时的有氧运动,主要包括游泳、骑自行车、使用椭
查看全部答案部分心脏病专家积极倡导,猝发心脏病时应及时拨打120。在拨打 120 之前,需实施心肺复苏术(CPR)。当下,健康教育推广成效显著,有关心肺复苏术的急救知识已普及至学校。部分小学生已掌握急救技能,这极
查看全部答案如何客观量化中医特色诊断信息是涉及中医药传承创新的核心问题,也是制约中医药现代化的瓶颈问题。现代科技(如传感技术、图像处理、人工智能、大数据)正在为中医诊断的客观量化带来革命性的变革,通过多种技术手段
查看全部答案实现中医“千人千方”的个性化调理需求,正是现代科技赋能中医药的核心突破点。其关键在于将中医整体观、辨证论治的精髓,与大数据、人工智能、多组学技术、智能设备等深度融合,构建“数字化中医个体”并实现动态精
查看全部答案这是个好问题,并且我们呼吁中医药装备应该首先瞄准基层应用场景,中医药装备的生命力和成长土壤可能也在基层。针对基层医疗卫生场景的中医药装备研发,核心必须围绕“实用、好用、耐用、能用得起”展开,重点提升基
查看全部答案在回答中医药装备的重要性之前,我想先减轻一部分人的顾虑,中医药装备不是中医的“异化”,而是其生命力的当代延伸。正如针灸针从砭石演化至无菌套管针,拥抱技术不断创新才能更好传承。我们认为大力发展中医药装备
查看全部答案广州软件应用技术研究院(原广州中国科学院软件应用技术研究所,简称广州软件院)成立于2011年5月27日,当时是中国科学院软件研究所与广州南沙开发区管委会共建的独立运营事业法人单位。建院的目标是:发挥中
查看全部答案电梯零部件质量检测用 AI 大模型,主要是通过视频检测算法,替代人工肉眼检查,具体可以分四步走:第一步,收集缺陷数据,进行标注。把生产中常见的缺陷(比如齿轮裂纹、导轨划痕、焊点不平整等)拍成高清照片,
查看全部答案从两个方面来寻找,一个是企业中的某些重复的、低效率的或者容易出错的环节,比如企业产品的智能客服、企业领导的发言稿撰写、审核或比对文件信息等。一个是有数据积累的业务环节,比如投顾报告的撰写,历史的投顾报
查看全部答案
