真的是搞钱的!12.6K星星的开源金融大模型FinGPT

AIGC最新资讯7个月前发布 AiBots
61 0 0
真的是搞钱的!12.6K星星的开源金融大模型FinGPT

FinGPT采用数据中心的方法,为研究人员和从业者提供开发金融大语言模型(LLM)的资源。这对金融界来说无疑是令人振奋的,如果你从事金融报表的解读、数据分析、股票或者量化交易等工作,这款模型将成为你的得力助手。(访问链接在文章底部)

在金融领域应用语言模型面临许多复杂障碍。这些障碍包括获取数据的困难、多样化数据格式和类型的处理、数据质量不一致性,以及对最新信息的需求。由于数据来源多样,如Web平台、API、PDF文档和图像,历史或专业金融数据的提取更加复杂。

金融领域专有模型如BloombergGPT通过独占访问专业数据来训练金融领域的语言模型,但其数据收集和训练协议的封闭性和透明性不足,急需开放和包容性的替代方案。FinGPT强调数据获取、清理和预处理,旨在通过促进数据可访问性推动金融领域的研究、协作和创新。

真的是搞钱的!12.6K星星的开源金融大模型FinGPT

FinGPT-Forecaster 应用,输入以下内容:

  1. 股票代码(例如 AAPL、MSFT、NVDA)
  2. 您希望预测发生的日期 (yyyy-mm-dd)
  3. 过去几周检索市场新闻的次数
  4. 是否添加最新的基本财务信息作为附加信息

点击提交!您将收到对该公司的全面分析以及对下周股价走势的预测!

整体架构

真的是搞钱的!12.6K星星的开源金融大模型FinGPT

整个项目由4个部分组成:

  • 第一部分是数据源,在这里,我们从互联网上收集历史和流媒体数据。
  • 接下来,我们将数据推送到数据工程部分,在这里我们会对数据进行清洗,标记化处理和提示工程。
  • 然后,数据被推送到大语言模型(LLMs)。在这里,我们可以以不同的方式使用LLMs。我们不仅可以使用收集到的数据来训练我们自己的轻量级微调模型,还可以使用这些数据和训练好的模型或LLM API来支持我们的应用程序。
  • 最后一部分将是应用程序部分,我们可以使用数据和LLMs来制作许多有趣的应用程序。

数据层

FinGPT通过使用API、网络抓取工具和数据库访问,从金融新闻、社交媒体、报告文件、趋势数据和学术数据集中获取多样化数据,以确保合法和合规的实时更新和数据处理。

真的是搞钱的!12.6K星星的开源金融大模型FinGPT

 

例如新闻数据来源:

真的是搞钱的!12.6K星星的开源金融大模型FinGPT

模型

真的是搞钱的!12.6K星星的开源金融大模型FinGPT
  • 在数据中心的自然语言处理领域,我们不需要从头开始训练模型。我们只需要调用API和进行轻量级的微调。
  • 左边是一些可能会用到的LLM APIs,中间是我们可能用来进行微调的模型,右边是一些微调方法。每次微调不到 300 美元。

应用

智能投顾:

  • ChatGPT可以像专业人士一样进行投资建议。
  • 在这个例子中,苹果的股价上涨与ChatGPT分析新闻的预测相符
真的是搞钱的!12.6K星星的开源金融大模型FinGPT

量化交易:

通过结合新闻、社交媒体推文和公司公告的情感因子,尤其是Twitter推文和ChatGPT信号,我们可以显著提升交易结果,甚至单靠Twitter情感因子交易也能取得良好收益;结合价格因素将进一步优化结果。

真的是搞钱的!12.6K星星的开源金融大模型FinGPT

包括但不限于:

真的是搞钱的!12.6K星星的开源金融大模型FinGPT

Github:https://github.com/AI4Finance-Foundation/FinGPT

官网:https://ai4finance-foundation.github.io/FinNLP/zh/
真的是搞钱的!12.6K星星的开源金融大模型FinGPT
真的是搞钱的!12.6K星星的开源金融大模型FinGPT

© 版权声明

相关文章

暂无评论

暂无评论...