摘要
金融情感分析旨在将文本内容分类至预定义的情感类别,以解析其对金融市场波动的潜在影响。然而,预训练大型语言模型在金融情感分析任务中的直接应用仍面临显著挑战:其一,现有方法难以适配领域特定目标,且无法灵活适应定制化的金融数据范式;其二,主流模型仅依赖单支股票自身信息预测价格变化,忽略了关联资产间的交叉影响。
本文提出一个融合大型语言模型与图神经网络的框架,通过新闻情感信号预测股票价格走势。具体而言,我们基于开源Llama-8B模型构建核心基座,利用监督微调技术增强其对金融情感模式的感知能力,并设计双通道图神经网络捕捉跨资产依赖关系以强化情感信号。在中国A股市场的实验表明,新闻情感对股价变动具有显著驱动力,可有效提升投资组合的夏普比率。
1.引言
传统资产定价模型(如CAPM、APT和Fama-French三因子模型)强调系统性风险、企业基本面等经济变量对资产收益的影响 ,但未充分关注新闻情绪等非经济因素的作用。行为金融学通过重新审视传统金融学的理性假设,揭示了投资者的非理性特征 ,指出情绪等心理因素显著影响投资决策,从而推动新闻情绪进入研究视野。随着互联网技术发展,信息获取成本大幅降低,网络新闻已成为投资者了解股票市场的主要渠道。新闻报道中的情感元素能迅速引发投资者情绪共振,进而对市场决策产生多维度影响,包括短期价格趋势预测、虚假新闻识别及系统性风险监测等。
金融情感分析涉及命名实体识别、方面抽取和主观性检测等一系列自然语言处理任务。其技术演进主要分为三个阶段。首先是词典驱动阶段,早期方法[1-3]将文档视为词袋(Bag-of-Words),通过预定义词典(如Loughran-McDonald词典、FinSenticNet)映射词汇至情感类别。此类方法基于语义方向判断文本极性,无需标注数据,但依赖人工构建的金融情感词典。
例如,FinSenticNet通过构建语义相似图(semantic similarity graph)生成半监督分类框架,显著提升词典的领域覆盖率和可解释性。然后是机器学习优化阶段,随着数据复杂度上升,随机森林(Random Forest)、支持向量机(SVM)等算法[4-6]被应用于社交媒体和新闻数据的语义极性检测。研究者通过特征选择算法(如Boruta、Lasso)优化模型性能,验证了其在加密货币波动预测和股票市场趋势分析中的有效性。
此阶段的核心突破在于引入词嵌入技术(如Word2Vec)[7-12],卷积神经网络(CNN)结合词袋模型(BoW)高效捕捉文本局部特征;循环神经网络(RNN)通过门控机制建模金融新闻的序列依赖性,增强长距离上下文关联,推动神经网络在金融情感分析中的应用。目前是大语言模型主导阶段,基于Transformer架构的大语言模型(如BERT、Llama 3)[13-21]凭借海量语料预训练与上下文学习能力,成为当前情感分析的核心工具。
大语言模型技术路线分为两类,编码器架构(以金融领域微调的BERT变体(如FinBERT)为代表,擅长情感分类任务)和解码器架构(如BloombergGPT、GPT系列及Llama变体,支持生成式情感推理与多任务分析)。
然而,现有基于大语言模型的方法仍存在两大局限。其一,领域适应性不足。通用领域模型因缺乏对金融术语及市场事件模式的深度建模,在金融场景中表现欠佳。通过监督微调(Supervised Fine-Tuning, SFT)利用领域标注数据(如情感标签)优化模型参数,将通用知识迁移至金融情感分析任务以提升泛化能力。其二,结构性市场依赖缺失。当前基于LLM的金融情感分析框架孤立处理单只股票,未能充分探索金融市场传染理论中的交叉影响机制——投资者羊群效应会通过行业关联或主题联动形成动态依赖网络,而此类结构性关系未被现有模型有效捕捉。
本文提出一种融合微调大语言模型与属性图神经网络的创新框架,用于金融情感分析任务。该框架通过三阶段流程实现端到端的市场情感建模与投资决策支持。首先,基于Llama-8B架构,采用统一提示模板对个股及行业新闻进行监督微调,捕获新闻文本的深层情感特征。
然后,结合金融先验知识,构建Barra风险因子语义相似图与新闻主题共现图,通过双通道图神经网络实现跨资产情感信号增强。
最后,融合增强后的多维度情感特征,输入价格趋势预测模块生成横截面投资组合配置方案。在沪深300、中证500及中证1000指数的测试中,本框架相较基线大语言模型实现年化收益率提升10个百分点,最大回撤降低20%。该情感分析框架将增强证券公司对市场情绪的洞察能力,辅助智慧投研平台建设,赋能投资决策与风险管理。
2.方法
本框架的核心思想是:利用大语言模型(LLM)生成的文本表征作为图神经网络(GNN)的补充特征实现股价预测。微调后的LLM处理股票新闻,输出文本情感嵌入向量;GNN融合LLM生成特征与图结构信息,基于消息传递机制聚合邻域节点的增强特征,生成最终股价趋势预测。
我们通过对Llama-8B模型进行微调,该过程涵盖提示工程(Prompt Engineering)与参数校准两大关键环节。首先设计面向金融领域的Alpaca风格专用输入模板,实现大语言模型与金融语义空间的对齐。该提示模板的结构如下所示:

在此模板框架下,模型通过指令语义分析理解零样本分类目标,并依据情感类别及强度级别实现分层情感归类;进而通过模板内嵌的动态内容替换机制批量生成监督训练数据;最终利用该数据集对预训练LLM进行参数校准,使其严格遵循预设规范执行金融情感分类任务。
通过预定义的提示模板,将大量监督样本对(输入空间X与情感标注输出空间Y)输入预训练模型。对于给定的一个包含所有提示词的输入序列(x∈X),基于LLM的策略π_θ(参数为θ)处理教学情景化输入生成对应的响应词序列(y={y_1,y_2,…,y_N}∈Y)。
根据贝叶斯定理,生成词序列的条件概率分布被形式化为
其中π_θ (y|x)表示在输入序列x条件下输出序列y的联合概率分布,∏iⁿ(i=1)^n表示对输出序列中每个分词的概率进行自回归分解,y_i是输出序列中的第i个分词,y_1,…,y_(i-1)表示当前分词之前的所有历史输出。监督微调的目标通过交叉熵损失函数最大化所有响应分词的概率:

其中D={X,Y}为监督数据集。通过反向传播,该监督微调方法的目标函数使预训练大模型能够最小化预测结果与监督标签的偏差,并通过调整模型参数以捕捉在金融语义环境下新闻情绪信号。
在保持模型架构完整性的同时提升大语言模型微调效率,我们通过计算优化实现两项核心加速技术:梯度裁剪与混合精度训练(采用半精度格式FP16)。梯度裁剪将参数梯度幅值限制在特定阈值内,既可防止梯度爆炸,又能保持参数更新方向性;混合精度算术则结合FP16张量运算与FP32主权重,在几乎不损失精度的情况下降低显存占用并加速计算。在两相加速技术的辅助下,最终完成监督微调的预训练大语言模型用于从金融新闻中提取情感表征。我们将经过微调的预训练大语言模型在解码器最后一层输出分词上下文语义特征的时候,沿序列轴执行均值池化并通过双层MLP投影为固定维度情感嵌入用于表示经过大语言模型提炼的金融新闻情绪:

其中Xstock表示股票新闻对应的文本序列,Zstock经过提取的情感表征。
为了提升新闻情绪信号的准确度,我们利用图神经网络捕捉股票间的交叉影响效应。其中金融新闻中提取的情感编码Zstock作为图神经网络模型的补充文本特征。设Gt=(V,E)表示交易日t的股票关系图(下文在不引起歧义时省略下标t),其中V={Vi}iⁿ=1为股票节点集合,ei,j∈E表示节点Vi和Vj间的边,Ni表示节点Vi的邻居集合。
我们构建了两种图结构应用图神经网络捕捉股票关联效应下的情绪特征:一种是主题共现图GT=(V,ET),边(i,j)∈ET表示股票i和j在新闻文本中被共同提及;另一种是语义关联图Gs=(V,Es),采用Barra中国股票模型CNE5(该模型将股票收益分解为1个市场因子、10个风格因子和32个行业因子)计算所有股票对的余弦距离,选取每只股票距离最近的前K只股票作为邻居构成边集合Es。
基于两种图结构,为捕捉关联股票的影响,图神经网络(GNN)通过两阶段机制运作:先聚合节点邻居的信息,再基于聚合结果更新节点表征。其第l层的计算过程形式化定义为:

其中h_i^((l) )表示股票i在第l层的表征向量,〖h'〗_i^((l))是通过聚合第l-1层邻居表征生成的中间向量,h_i^((0) )表示初始化的节点特征来自于微调的预训练大语言模型。图神经网络中关键的两个函数是聚集函数和更新函数,聚集函数负责将邻居节点特征进行聚合,更新函数负责融合节点自身历史特征和邻居聚合结果,在实践中我们使用基于Transformer的图神经网络架构[22]。在GT和Gs图上堆叠L层基于Transformer的图神经网络后,将主题图特征h_(T,i)^((L) )和语义图特征h_(S,i)^((L) )通过单层的MLP融合生成节点i的最终表征h_(F,i)。在t时刻融合了拓扑和语义依赖关系的金融情感表征最终用于预测股票在t+1时刻的收益率或者趋势。
受FinGAT[23]启发,我们的模型通过双任务同时优化横截面收益率排序与股价趋势预测,两项任务的预测能利用互补信号:排序任务捕捉资产相对位置(横截面关系),而价格趋势建模时序动态(纵向规律)。这种双任务方法通过强制模型学习在静态比较与序列变动间通用的共享表征来增强鲁棒性,缓解金融时间序列分析中的过拟合风险。在预测收益率排序时,采用成对排序损失函数(pairwise ranking loss)促使股票基于预测收益率的排序与基于真实收益率的排序保持一致;在预测股价涨跌方向时,使用交叉熵损失函数衡量预测涨跌分布与真实分布之间的差异。最终损失函数表示为:

其中L_rank强制预测收益率排序与真实排序一致,L_trend衡量价格涨跌的二分类误差,θ表示可学习参数,λ控制L_2正则化强度,δ平衡任务优先级。y_i^rank为真实收益率,y_i^trend为真实二分类标签(当真实收益率为正时标记为1,负时标记为0),y ̂_i^rank是预测的收益率(h_(F,i)经过一层线性变化),y ̂_i^trend是预测的趋势(h_(F,i)经过一层带sigmoid激活函数的非线性变化)。
3.实验
我们的框架在中国A股市场上全面评估验证了框架的有效性。在监督微调阶段,我们选用了10万条个股新闻和10万条行业新闻(含情感标签);为了探讨情绪因子对股票市场的影响,我们在沪深300、中证500和中证1000三大A股指数成分股进行指数增强的验证,选取了2014年到2024年十年的指数数据。
我们对比了三类基准模型:(1) 经微调的预训练语言模型(包括BERT[14]、OPT[15]、FinBERT[13]、Llama 3[16]、FinLlama[18]和LLM2Vec[24]),均通过Hugging Face平台适配为金融情感分析任务;(2) 经典图神经网络架构(GCN[25]、GraphSAGE[26]和RevGAT[27]);(3) LLM-GNN混合框架(TAPE[28]和STAGE[29]),采用序列到图的混合学习方法——先由LLM作为前缀处理器生成文本图数据的节点嵌入,再通过GNN增强图表示能力。实验在三类指标上进行了评估:(1) 衡量盈利能力的年化收益率(ARet);(2)衡量风险管理的最大回撤(DD)和组合换手率(TVR);(3)衡量风险调整收益的年化夏普比率(SR)。
实验结果表明,FLAG在所有数据集上均优于纯LLM和GNN方法,详见表1。通过分析可以得出以下结论:(1)FLAG相比STAGE实现了41.86%(ARet)、58.14%(SP)和9.77%(DD)的平均提升,同时保持相当的换手率,这表明结合LLM与GNN的金融新闻分析框架能在控制交易费用的同时提高风险调整收益。(2)联合分析实验显示,基于图结构的模型优于独立LLM,这凸显了股票间收益关联性的重要影响。此外,通过微调LLM的提示工程充分利用节点文本特征(而非直接初始化词向量)能更好地发挥新闻作用,因此我们提出了融合微调LLM与GNN的情感分析框架——LLM负责适应金融数据领域并提取个股情感表征,GNN基于Barra因子和新闻共现建立股票关联以增强情感传播。(3)除显著的性能提升外,我们还发现两个现象:其一,在部分数据集上本方法换手率指标略逊于其他基准,这可能是因为微调LLM能更精准捕捉新闻情感,而目标股票情感每日快速变化(甚至逆转)导致频繁调仓;其二,沪深300指数的改进幅度弱于中证500和中证1000,这可能是由于2022-2024年A股市场风格偏向中小盘成长股,而大盘价值股优势相对较弱。
表1:在纯多头策略下各情绪分析框架的性能表现

4.结论
金融情感分析作为金融科技与行为金融学的交叉应用,正深刻重塑股票市场运行逻辑、证券公司业务模式及A股市场生态结构。本文基于自然语言处理(NLP)与图神经网络(GNN)的框架验证了从新闻、社交媒体及研报中提取情感信号(如正负面强度分级)可显著加速价格发现过程。
该技术通过“数据-情绪-决策”闭环推动A股市场从经验驱动转向数据驱动——对券商而言,其提升智慧投研渗透率并催生智能投顾业态;对市场而言,情绪因子加剧风格分化(小盘成长股相对受益)与风险传导复杂性。
未来需平衡技术创新与监管合规,以应对情绪波动及算法同质化引发的系统性风险。
参考文献
[1] P. C. Tetlock, Giving content to investor sentiment: The role of media in the stock market, The Journal of finance 62 (3) (2007) 1139–1168.
[2] F. Li, The information content of forward-looking statements in corporate filings—a na¨ıve bayesian machine learning approach, Journal of accounting research 48 (5) (2010) 1049–1102.
[3] J. E. Engelberg, A. V. Reed, M. C. Ringgenberg, How are shorts informed?: Short sellers, news, and information processing, Journal of Financial Economics 105 (2) (2012) 260–278.
[4] G. Wang, T. Wang, B. Wang, D. Sambasivan, Z. Zhang, H. Zheng, B. Y.Zhao, Crowds on wall street: Extracting value from collaborative investing platforms, in: Proceedings of the 18th ACM conference on computer supported cooperative work & social computing, 2015, pp. 17–30.
[5] M. Atzeni, A. Dridi, D. Reforgiato Recupero, Fine-grained sentiment analysis on financial microblogs and news headlines, in: Semantic Web Challenges: 4th SemWebEval Challenge at ESWC 2017, Portoroz, Slovenia, May 28-June 1, 2017, Revised Selected Papers, Springer, 2017, pp. 124–128.
[6] B. Liu, Sentiment analysis and opinion mining, Springer Nature, 2022.
[7] M. Kraus, S. Feuerriegel, Decision support from financial disclosures with deep neural networks and transfer learning, Decision Support Systems 104 (2017) 38–48.
[8] B. Lutz, N. Pr¨ollochs, D. Neumann, Sentence-level sentiment analysis of financial news using distributed text representations and multi-instance learning, arXiv preprint arXiv:1901.00400.
[9] Z. Yang, D. Yang, C. Dyer, X. He, A. Smola, E. Hovy, Hierarchical attention networks for document classification, in: Proceedings of the 2016 conference of the North American chapter of the association for computational linguistics: human language technologies, 2016, pp. 1480–1489.
[10] L. Zhang, S. Wang, B. Liu, Deep learning for sentiment analysis: A survey, Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 8 (4) (2018) e1253.
[11] S. Sohangir, D. Wang, A. Pomeranets, T. M. Khoshgoftaar, Big data: Deep learning for financial sentiment analysis, Journal of Big Data 5 (1) (2018) 1–25.
[12] M. Maia, A. Freitas, S. Handschuh, Finsslx: A sentiment analysis model for the financial domain using text simplification, in: 2018 IEEE 12th International Conference on Semantic Computing (ICSC), IEEE, 2018, pp. 318–319.
[13] A. H. Huang, H. Wang, Y. Yang, Finbert: A large language model for extracting information from financial text, Contemporary Accounting Research 40 (2) (2023) 806–841.
[14] J. D. M.-W. C. Kenton, L. K. Toutanova, Bert: Pre-training of deep bidirectional transformers for language understanding, in: Proceedings of naacL-HLT, Vol. 1, Minneapolis, Minnesota, 2019, p. 2.
[15] S. Zhang, S. Roller, N. Goyal, M. Artetxe, M. Chen, S. Chen, C. Dewan, M. Diab, X. Li, X. V. Lin, et al., Opt: Open pre-trained transformer language models, arXiv preprint arXiv:2205.01068.
[16] H. Touvron, T. Lavril, G. Izacard, X. Martinet, M.-A. Lachaux, T. Lacroix, B. Rozi`ere, N. Goyal, E. Hambro, F. Azhar, et al., Llama: Open and efficient foundation language models, arXiv preprint arXiv:2302.13971.
[17] R. S. Shah, K. Chawla, D. Eidnani, A. Shah, W. Du, S. Chava, N. Raman, C. Smiley, J. Chen, D. Yang, When flue meets flang: Benchmarks and large pre-trained language model for financial domain, arXiv preprint arXiv:2211.00083.
[18] T. Konstantinidis, G. Iacovides, M. Xu, T. G. Constantinides, D. Mandic, Finllama: Financial sentiment classification for algorithmic trading applications, arXiv preprint arXiv:2403.12285.
[19] Y. Yang, Y. Tang, K. Y. Tam, Investlm: A large language model for investment using financial domain instruction tuning, arXiv preprint arXiv:2309.13064.
[20] X.-Y. Liu, G. Wang, H. Yang, D. Zha, Fingpt: Democratizing internet-scale data for financial large language models, arXiv preprint arXiv:2307.10485.
[21] A. Meta, Introducing meta llama 3: The most capable openly available llm to date, Meta AI.
[22] P. Veliˇckovi´c, G. Cucurull, A. Casanova, A. Romero, P. Lio, Y. Bengio, Graph attention networks, arXiv preprint arXiv:1710.10903.
[23] Y.-L. Hsu, Y.-C. Tsai, C.-T. Li, Fingat: Financial graph attention networks for recommending top-k k profitable stocks, IEEE transactions on knowledge and data engineering 35 (1) (2021) 469–481.
[24] P. BehnamGhader, V. Adlakha, M. Mosbach, D. Bahdanau, N. Chapados,
S. Reddy, Llm2vec: Large language models are secretly powerful text encoders, arXiv preprint arXiv:2404.05961.
[25] T. N. Kipf, M. Welling, Semi-supervised classification with graph convolutional networks, arXiv preprint arXiv:1609.02907.
[26] W. Hamilton, Z. Ying, J. Leskovec, Inductive representation learning on large graphs, Advances in neural information processing systems 30.
[27] G. Li, M. M¨uller, B. Ghanem, V. Koltun, Training graph neural networks with 1000 layers, in: International conference on machine learning, PMLR, 2021, pp. 6437–6449.
[28] X. He, X. Bresson, T. Laurent, A. Perold, Y. LeCun, B. Hooi, Harnessing explanations: Llm-to-lm interpreter for enhanced text-attributed graph representation learning, arXiv preprint arXiv:2305.19523.
[29] A. Zolnai-Lucas, J. Boylan, C. Hokamp, P. Ghaffari, Stage: Simplified text-attributed graph embeddings using pre-trained llms, arXiv preprint arXiv:2407.12860.