Bloomberg 刚刚推出了金融 ChatGPT
你的新 AI 金融大师,但代价是什么?
布隆伯格发布了一项史无前例的公告,可能会永远改变我们对金融和投资方式的理解。
但为什么?好吧,这很简单。
想一想世界上最大的金融机构之一在过去四十年中积累的所有财务数据,然后想象一个内置所有这些知识的对话式且易于访问的聊天机器人。
那是 BloombergGPT。
BloombergGPT 代表了世界上最重要的部门金融与人类进步史上的根本性转变之一生成人工智能之间的融合。
但 BloombergGPT 也可能带来无法预料的后果,这些后果可能会严重影响您的投资,并将金融市场的整体非理性推向新的记录。
不同的数据,不同的结果
Bloomberg 已决定进入看似未开发的金融 LLM 世界,即为金融任务训练的 AI 模型,因为这些模型具有巨大的前景。
然而,BloombergGPT(不要因其名称与 OpenAI 的产品系列混淆)是一种端到端的专有彭博解决方案。
换句话说,他们并没有简单地将他们的数据连接到 OpenAI 的 GPT-4 API 并根据他们的需要微调模型——即进一步训练一个已经预先训练过的模型,比如 GPT-4。
恰恰相反,他们从头开始创建了一个模型。
特别是,他们将其开发基于 BLOOM,这是一个由 Hugging Face 的联合创始人领导的开源项目,它创建了一个大型语言模型 (LLM),与 OpenAI 的 GPT 系列相比,任何人都可以访问,同时大小非常相似。
但这并不是让 BloombergGPT 真正与众不同的原因。
成为您最好的财务朋友的 3630 亿个理由
尽管身处当今竞争最激烈的行业之一,BloombergGPT 还是有一个独特之处。
它是在历史上最大的金融数据集 3630 亿个令牌(一个令牌是一组字符或单词)中训练的模型。
这意味着这个模型可以准确地描述为 LLM,它更多地接触了我们所见过的财务数据,这让任何其他可能的比较都非常尴尬。
但这还不是全部。
为了最大限度地提高结果,他们采用了一种新的训练方法,使用多样化的数据集,其中大约一半是严格在领域内的,例如财务报告和新闻,另一半是公开的一般知识信息主要在 Internet 上可用。
根据执行的评估,这使得该模型成为有史以来第一个在金融方面表现出色同时在其他领域也相当出色的 LLM,同时比 GPT-4 等最先进的模型小得多.
但这怎么可能呢?
不做大的 500 亿个理由
Bloomberg 对该模型的特殊性持开放态度,从它“仅”500 亿个参数开始。
自然地,人们倾向于思考:如果这些模型随着规模的增长而变得更好,那么当我们拥有 1750 亿参数的 GPT-3、5800 亿的 Google Brains 的 PaLM 或巨大的 Megatron 等模型时,为什么只有 500 亿参数- LM 达到疯狂的 1 万亿?
事实上,参数的数量不是任意的,您需要考虑许多因素,例如数据集的大小。
如果你训练的模型对于你的数据集来说太大了,你的模型就会过拟合。
也就是说,它会通过记忆来学习完全适应你的数据,使其不适用于训练语料库之外的数据。
相反,如果您的模型对于您的数据集来说太小,您的模型将欠拟合,这意味着它不会因为缺乏正确学习数据所需的大小而无法很好地进行预测。
出于这些原因,他们使用Hoffmann 等人关于训练的理想模型大小的指导方针,以 500 亿结算。
但令人惊讶的是,尽管它比其他模型小得多,但由于其独特的训练数据集,它在金融主题上的表现远远优于其他模型。
总而言之,这里的一切听起来都很棒,但布隆伯格实际上取得了什么成就?
伟大的计算器,更好的心理学家
BloombergGPT 的评估涉及多项财务任务。这些包括:
FPB:金融新闻句子的情感分类任务
FiQA SA:预测财经新闻和微博头条中特定方面的情绪。
标题:确定黄金商品领域的新闻标题是否包含特定信息的二元分类任务。
NER:用于信用风险评估的金融数据命名实体识别任务。
命名实体识别涉及正确识别数据中的实体。
例如,对于“Twitter has open source its algorithm”这句话,机器应该能够将 Twitter 标记为一个组织。
另一方面,对于“Twitter 发布其最新功能”这句话,Twitter 可以被标记为组织或产品,使其成为一项重要的练习。
5. ConvFinQA:一项任务,需要根据标准普尔 500 指数收益报告回答会话问题,报告在公共开发集上的精确匹配准确性。
不出所料,BloombergGPT 在五项任务(ConvFinQA、FiQA SA、FPB 和 Headline)中的四项(ConvFinQA、FiQA SA、FPB 和 Headline)中的所有模型(GPT-Neo X、OPT 66B 和 BLOOM 176B)中表现最好,并且在 NER 中排名第二,正如我们所见以下:
因此,我们很快就会看到 BloombergGPT 被用于分析市场情绪、解读新闻标题、制作财务文件,甚至做出交易决策。
太棒了,但代价是什么?
把我们的钱给机器人
在 BloombergGPT 可能做出的所有贡献中,我敢打赌,让 Bloomberg 大赚一笔的将是情绪分析。
情绪机器
BloombergGPT 在五个内部特定方面的情绪分析任务上进行了评估,全部使用英语。
任务是:
股票新闻情绪:预测新闻报道中表达的对公司的情绪。
股票社交媒体情绪:预测与财务相关的社交媒体内容中表达的对公司的情绪。
Equity Transcript Sentiment:预测公司新闻发布会的成绩单中表达的对公司的情绪。
ES News Sentiment:预测新闻报道中表达的关于公司环境和社会政策的情绪。
国家新闻情绪:预测新闻报道中表达的对一个国家经济的情绪。
BloombergGPT 在这些情绪分析任务上的表现优于所有其他模型,如下所示:
现在,我希望你想一想这可能带来的影响。
让情绪化的市场更加非理性
如果我们能够计算出有多少投资决策是完全情绪化的决策,尤其是那些短期到期的决策,我们可能会远远超过一个舒适的价值。
事实上,像许多上市公司每天都遭受的情况,比如看到你的 10% 的价值被聊天机器人的错误陈述抹去,正如谷歌与巴德看到的那样,表明金融市场是多么的不合理和荒谬。
然而,数亿美元的资金是基于头条新闻、有偏见的分析师预测和不明智的决策而转移的。
例如,人们开始抛售他们在 Republic First Bancorp 的头寸,将这家银行的名字与陷入困境的 First Republic Bank 混淆(歇斯底里地,这导致这家银行的股票价值每月下跌 30%,仅仅因为名字相似到另一家银行)。
因此,如果这个工具被市场参与者普遍使用,会有多危险?
不受控制的决策和波动
想象一下,所有投资银行的交易部门和其他强大的市场参与者都开始使用相同的工具来评估市场情绪,以提高日间交易的效率。
突然间,价值数十亿美元的资金将取决于该工具从新闻头条或财务报告中衡量情绪的程度,从而使公司和散户投资者可以突然进行投资以寻找额外的一分钱。
自然地,如果大型持有者合并到相同的工具中,波动性将大大增加,因为大部分市场参与者将获得相同的阿尔法并根据相同的有偏见的模型得出相同的结论,同时使那些无法利用这些技术的人裸泳被抓。
一个不平等和波动性更高的市场?
如果模型对某些公司产生特定的、无法解释的偏见,迫使他们对他们产生负面情绪,从而使整个市场都反对他们,那会发生什么?
总而言之,我的观点是,在一个已经充斥着猖獗的投机和笨拙的决策的市场中,这些模型的极端便利性可以使它们成为决定整体市场走势的相关因素。
例如,如果交易机器人没有自动增强这些模型以做出自动交易决策,我会感到非常惊讶。
当然,也有人会提出相反的观点,认为这些模型也将被用来更好地了解公司,以便根据他们拥有的大量知识做出更好的决策。
但是,市场对好消息或坏消息的反应速度极快,加上人类在压力和长时间工作是常见趋势的工作中必须适应自己并自动做出某些决定的自然趋势,使我相信潜在的结果这些模型的负面影响可能远大于正面影响。
最后一句话
BloombergGPT 只是 AI 创新的冰山一角,从中可以看出跟上这项技术的发展有多么困难。
但是,如果您订阅我的时事通讯,每周只需 5 分钟即可完成,因为您将以一种易于阅读、易于理解的方式深入探讨创新主题,为您提供有关 AI 的最新消息和有见地的创新和加密货币。
随便看看:
相关推荐:
网友评论:
推荐使用友言、多说、畅言(需备案后使用)等社会化评论插件