# 高频时序预测研究 Idea 周报 2026-W26

- 周期: `2026-06-22` 至 `2026-06-28`
- 生成时间: `2026-06-24T08:23:22+00:00`
- source registry version: `2026-06-16.v4`
- 来源条目: `65`
- 候选想法: `22`

## 本周结论

本周候选只代表研究启发，不代表可直接上线。每篇文章由 LLM 或人工 notes 尽量总结文章自身的背景、逻辑、方法、数据和结果；没有依据的字段留空，不再硬写固定模板。项目相关迁移只放在“研究启发/管线落点”里，不混入文章摘要。本轮特别关注高频数据特征工程，优先识别能转化为订单流、盘口形态、价格层记忆、事件时间、主动买卖和 sidecar 字段的想法。

## 本周汇总导航

本周共 `22` 条候选 idea，分布在 `7` 个板块。
证据分布: 已读 PDF 9, 已读网页 10, 读取失败 3。
摘要质量: {'high': 7, 'medium': 12, 'low': 3}；摘要长度中位数 `661.5` 字；有提示的条目 `6` 条。

- **AI 辅助因子生成**：7 条
  - Chain-of-Alpha：基于 LLM 的自动公式化 Alpha 挖掘框架：把 Alpha 挖掘组织为生成链与优化链
  - FactorMAD：基于 LLM 多智能体辩论的可解释 Alpha 因子挖掘：把多智能体辩论用于 Alpha 因子挖掘
  - LLM 驱动的自动稳健特征工程：把 LLM 与进化优化结合用于自动特征发现
- **其他研究背景**：1 条
  - SkyJEPA：用于四旋翼零样本仿真到现实控制的长视野世界模型学习：将 JEPA 式潜在预测用于实时四旋翼高频控制，而非仅用于低频运动规划
- **时序预测模型与 LOB**：5 条
  - TLOB：基于限价订单簿数据的双注意力 Transformer 股价趋势预测模型：把简单 MLPLOB 作为强基线，挑战复杂架构必然更优的假设
  - LiT：限价订单簿Transformer：提出不依赖CNN的LOB Transformer，用结构化patch和自注意力建模盘口空间与时间依赖。
  - Deep Limit Order Book Forecasting：深度限价订单簿预测与 LOBFrame 基准：发布 LOBFrame 以支持大规模 LOB 数据处理和模型评估
- **订单簿表示与逐笔数据**：1 条
  - 基于注意力机制的限价订单簿阅读、突出与全簿预测：把预测对象从中间价扩展到完整多层订单簿价格和数量
- **评估审计与风险控制**：2 条
  - 双分支自监督学习检测市场操纵：融合频域异常合成与领域特征：针对信号隐蔽、标签稀缺和边界模糊提出统一自监督检测框架
  - 金融科技系统中的自适应风险评估：基于强化学习的连续策略优化：将实时风险评分建模为连续动作 MDP
- **高频数据特征工程**：5 条
  - 中信建投：市场微观结构系列研究，从分钟频到 Level2 的探索与发现：把分钟频因子和 Level2 订单流放在同一微观结构框架下讨论
  - 国信证券：高频订单成交数据蕴含的 Alpha 信息：从逐笔成交数据拆解日频 K 线无法表达的日内路径差异
  - 挂单方向长期记忆性的讨论与应用：用逐笔委托方向编码和自相关函数实证检验A股挂单方向长期记忆。
- **高频订单流与微观结构**：1 条
  - RAVEN：用于金融时间序列预测的状态感知可变上下文专家网络：明确指出固定上下文窗口与非平稳金融收益过程存在结构性错配。

### 重点亮点

- **高频数据特征工程** / 中信建投：市场微观结构系列研究，从分钟频到 Level2 的探索与发现：把分钟频因子和 Level2 订单流放在同一微观结构框架下讨论
- **时序预测模型与 LOB** / TLOB：基于限价订单簿数据的双注意力 Transformer 股价趋势预测模型：把简单 MLPLOB 作为强基线，挑战复杂架构必然更优的假设
- **高频数据特征工程** / 国信证券：高频订单成交数据蕴含的 Alpha 信息：从逐笔成交数据拆解日频 K 线无法表达的日内路径差异
- **时序预测模型与 LOB** / LiT：限价订单簿Transformer：提出不依赖CNN的LOB Transformer，用结构化patch和自注意力建模盘口空间与时间依赖。
- **高频数据特征工程** / 挂单方向长期记忆性的讨论与应用：用逐笔委托方向编码和自相关函数实证检验A股挂单方向长期记忆。

## 按类别整理的候选想法

## AI 辅助因子生成

### IDEA-2026-W26-a27f038b — Chain-of-Alpha：基于 LLM 的自动公式化 Alpha 挖掘框架

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://www.researchgate.net/publication/394426875_Chain-of-Alpha_Unleashing_the_Power_of_Large_Language_Models_for_Alpha_Mining_in_Quantitative_Trading
- 原题: Chain-of-Alpha: LLM-based framework for automated formulaic alpha mining
- 研究轴: 因子生成 / 表示学习, 评估审计 / 可比性
- 管线落点: LLM 因子生成, 回测与可比性审计
- 角色: `评估审计 / 可比性候选`
- 原文证据: `读取失败`；摘要质量: `低`；摘要长度: `476` 字；提示: 读取失败，summary 主要依赖元数据或人工 notes

研究亮点:

- 把 Alpha 挖掘组织为生成链与优化链
- 强调回测反馈对 LLM 候选公式迭代的约束作用
- 关注先验知识与自动生成的结合

文章摘要: 这项研究围绕 LLM 在公式化 Alpha 挖掘中的自动化应用展开。根据已有材料，文章的重点不是单次生成一个候选因子，而是把 Alpha 发现组织成连续链式流程：先由大语言模型结合先验知识生成候选公式，再通过回测反馈评估候选表现，并在反馈基础上继续优化、筛选和迭代。其核心动机是，传统公式化 Alpha 挖掘高度依赖研究员经验，搜索空间大、试错成本高，且候选表达的改进通常缺少系统化闭环；LLM 可以承担候选生成、表达改写和经验复用的角色，但只有接入可验证的回测反馈，才能减少纯文本生成带来的随意性。输入材料提到文章强调“因子生成链”和“因子优化链”，说明其框架很可能把生成、评估、修正和再评估串成一套自动化循环。由于 source_reading 未能取得原文，材料没有提供具体模型、数据集、市场范围、回测指标或实证收益数字，因此不能进一步确认其算法实现细节和实验结论。就已知信息而言，文章的主要价值在于把 LLM alpha mining 从孤立 prompt 任务提升为反馈驱动的流程设计，强调用先验知识与实证评估共同约束 Alpha 公式生成。

背景: 公式化 Alpha 挖掘通常需要在大量候选表达中搜索有效信号，依赖研究经验且试错成本高；LLM 提供了自动生成和改写候选公式的可能。

逻辑: 文章强调通过因子生成链和因子优化链，把候选生成、回测评估、反馈修正和再次优化组成闭环，而不是停留在一次性生成。

方法: 已知材料仅说明使用 LLM 进行自动公式化 Alpha 挖掘，并结合回测反馈和先验知识迭代改进候选公式；具体模型、提示结构和优化算法未给出。

研究启发: 可用于每周 idea -> LLM prompt -> factor card -> L0-L4 -> SFT/BT -> 经验库的闭环设计，让外部研究摘要转化为下一轮 prompt 的结构化约束。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: llm_factor_pipeline, backtest_audit。

可能增益: 可能提升周报 idea 与实际因子实验之间的转化率，让外部研究不只是归档，而能形成下一轮 prompt 的结构化约束。

### IDEA-2026-W26-bfce6abb — FactorMAD：基于 LLM 多智能体辩论的可解释 Alpha 因子挖掘

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://dl.acm.org/doi/10.1145/3768292.3770377
- 原题: FactorMAD: A Multi-Agent Debate Framework Based on Large Language Models for Interpretable Alpha Factor Mining
- 研究轴: 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`
- 原文证据: `读取失败`；摘要质量: `低`；摘要长度: `400` 字；提示: 读取失败，summary 主要依赖元数据或人工 notes

研究亮点:

- 把多智能体辩论用于 Alpha 因子挖掘
- 强调候选因子的机制讨论和可解释性
- 关注减少缺少经济含义的复杂表达式

文章摘要: FactorMAD 关注 Alpha 因子挖掘中“候选因子为什么成立、是否具有可解释机制”这一问题。可见材料显示，文章把大型语言模型驱动的多智能体辩论引入 Alpha 挖掘流程，核心不是单纯让模型生成更多公式，而是让多个智能体围绕候选因子的市场机制、经济含义和合理性展开讨论，从而提高因子发现过程的可解释性。该思路针对传统自动化因子挖掘常见的缺陷：候选表达式可能在历史回测中看似有效，但缺少清晰机制支撑，难以判断其是否只是数据挖掘产物；同时，单一 LLM 生成过程也可能受到已有知识模板影响，产生同质化或难以验证的因子。文章标题和摘要线索表明，FactorMAD 的重点在于用多智能体辩论框架组织候选因子的生成、批判和解释，使因子不仅是数学表达式，也伴随可讨论的投资假设或市场行为解释。现有材料没有给出具体智能体分工、数据集、回测区间、基准方法或数值结果，因此不能进一步确认其实验效果和适用市场范围。

背景: Alpha 因子挖掘需要在预测效果之外关注经济机制和可解释性，否则候选因子容易成为缺少依据的历史拟合表达式。

逻辑: 通过多智能体辩论，让不同 LLM 角色围绕候选因子的机制、合理性和解释展开交互式讨论，以提升因子挖掘的可解释性。

方法: 使用基于大型语言模型的多智能体辩论框架进行可解释 Alpha 因子挖掘；可见材料未提供更细的算法流程。

研究启发: 可让 LLM 因子 pipeline 增加 debate/reviewer 阶段：一个 agent 提机制，一个 agent 查泄露，一个 agent 查字段合同，一个 agent 查经济含义。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 可能提升候选因子机制质量，减少看似复杂但实际不可解释或不可交易的表达式。

### IDEA-2026-W26-e82cae75 — LLM 驱动的自动稳健特征工程

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5124841
- 原题: LLM-Driven Automated Robust Feature Engineering
- 研究轴: 因子生成 / 表示学习, 高频特征工程
- 管线落点: LLM 因子生成, 高频数据特征工程
- 角色: `高频数据特征工程候选`
- 原文证据: `读取失败`；摘要质量: `低`；摘要长度: `457` 字；提示: 读取失败，summary 主要依赖元数据或人工 notes

研究亮点:

- 把 LLM 与进化优化结合用于自动特征发现
- 强调稳健性和可解释性，而不只是扩大候选数量
- 面向从手工特征构造到自动化特征工程的转变

文章摘要: 这篇研究讨论 LLM 与进化优化结合的自动特征工程方法，目标是从依赖人工经验的特征构造转向更自动、更稳健且可解释的特征发现。根据输入材料，文章的核心问题是：在许多预测任务中，特征质量直接影响模型表现，但手工设计特征需要领域知识、迭代成本高，也容易产生只在局部样本有效的脆弱表达。LLM 可以根据任务背景和领域语义生成候选特征表达，而进化优化可以承担搜索、筛选和逐步改良候选的职责，因此二者结合能够形成自动探索特征空间的框架。标题中的“robust feature engineering”表明文章关注的不只是生成更多特征，还包括稳健性与可解释性，即候选特征应在不同样本或条件下保持较稳定的有效性，并能够被人理解或审查。由于 source_reading 没有取得原文，输入材料未提供具体算法流程、进化算子、评估指标、数据集、任务类型或实验结果，因此摘要只能确认其研究方向和方法组合，不能补充未出现的实证结论。文章最值得关注的部分是将 LLM 的语义生成能力与进化搜索的迭代优化能力结合，用于自动发现可解释候选特征。

背景: 特征工程常依赖人工经验，候选空间大、试错成本高，并且容易产生缺乏稳健性的特征表达。

逻辑: LLM 负责根据任务和领域语义提出候选特征，进化优化负责在候选空间中搜索、筛选和迭代改良，从而提升自动特征发现的系统性。

方法: 已知材料仅说明文章结合 LLM 与进化优化，用于自动发现稳健、可解释的特征；具体算法、搜索流程和评估机制未给出。

高频特征工程关注点: 文章主题本身是自动特征工程，但输入材料没有说明是否使用高频数据，也没有列出订单不平衡、微价格、队列状态等具体高频特征。

研究启发: 可用于 LGB/Linear/MLP 特征工程侧：LLM 生成候选表达后，先经过 static analyzer、相关性去重和稳定性 proxy，再进入 SFT/BT；潜在价值是从生成单个因子升级为维护候选特征池和失败经验库。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: llm_factor_pipeline, hft_feature_engineering。

可能增益: 潜在增益是把 AI 从“写单个因子”升级为“维护候选特征池和失败经验库”。

### IDEA-2026-W26-31e382a1 — AlphaAgent：带正则化探索的 LLM Alpha 挖掘以对抗 Alpha 衰减

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://arxiv.org/abs/2502.16789
- 原题: AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration
- 研究轴: 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `684` 字

研究亮点:

- 把原创性、假设一致性和复杂度控制显式纳入 LLM 因子生成
- 用 AST 相似度衡量候选 Alpha 与已有 Alpha 的结构重复度
- 在中证 500 与 S&P 500 上报告了跨市场、跨状态的抗衰减表现
- 形成假设、构建、回测、反馈的闭环式 Alpha 挖掘流程

文章摘要: AlphaAgent 研究的是自动化 Alpha 挖掘中的衰减问题：许多因子在历史样本中表现良好，但随着市场环境变化、过拟合暴露或交易拥挤加剧，预测能力会迅速下降。文章指出，传统遗传规划和强化学习方法往往过度追求历史绩效指标，容易产生复杂但缺少金融逻辑的表达式；直接使用大型语言模型虽然能利用金融知识生成因子，但如果缺少约束，也可能复用 RSI、动量、价值、规模等已有模式，造成因子同质化和拥挤，反而加速衰减。为解决这一问题，文章提出 AlphaAgent，一个结合 LLM agent 与专门正则化机制的自主 Alpha 挖掘框架。它包含三类关键约束：第一，用抽象语法树与已有 Alpha 库做结构相似度比较，约束原创性；第二，用 LLM 评估市场假设、因子描述和表达式之间的语义一致性，保证假设与因子形式对齐；第三，用 AST 结构和参数数量控制复杂度，避免过度工程化表达式。框架流程包括假设提出、因子构建、因子开发、回测和反馈，形成闭环迭代。实验覆盖 2021 年 1 月至 2024 年 12 月的中国中证 500 和美国 S&P 500 市场，并跨牛熊环境评估。论文报告称，扣除交易成本后，AlphaAgent 在两个市场分别取得 11.0% 和 8.74% 的平均年化超额收益，IR 分别为 1.5 和 1.05；同时相比传统方法和已有 LLM 方法，表现出更强的抗衰减能力，有效因子比例提升 81%，token 消耗减少 30%。文章的边界在于它仍依赖符号表达式、算子库、已有 Alpha 库和回测反馈质量，正则化能降低但不能消除数据挖掘与市场变化风险。

背景: Alpha 衰减来自过拟合、p-hacking、市场拥挤和市场结构变化；传统 GP/RL 与直接 LLM 生成都可能产生缺少持久性的因子。

逻辑: 因子生成不应只优化历史表现，而要同时满足原创性、金融假设一致性和适度复杂度，三者共同约束 LLM 探索方向，以降低衰减风险。

方法: AlphaAgent 使用假设生成、因子构建、评估反馈的闭环多智能体流程，并用 AST 相似度约束原创性、LLM 语义评分约束假设因子一致性、AST 结构与参数数量约束复杂度。

数据: 实验覆盖 2021 年 1 月至 2024 年 12 月的中国中证 500 与美国 S&P 500 市场，并比较不同市场状态下的表现。

结果: 论文报告扣除交易成本后，在中证 500 和 S&P 500 上分别实现 11.0% 与 8.74% 的平均年化超额收益，IR 分别为 1.5 与 1.05；有效因子比例提升 81%，token 消耗减少 30%。

研究启发: 与我们的 llm_factor_pipeline 高度契合：可把 L0-L4、SFT、BT 失败原因写回经验库，用于下一轮 prompt 和候选因子约束，减少重复 rolling-window 因子、降低 invented field 风险。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 潜在增益是减少重复 rolling-window 因子、降低 invented field 风险，提高 LLM 因子生成的有效探索率。

### IDEA-2026-W26-7c9e1e60 — 面向稀疏投资组合优化的 LLM 进化式 Alpha 因子发现

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://openreview.net/forum?id=Zs3ZXwfaIu
- 原题: Evolutionary Alpha Factor Discovery with Large Language Models for Sparse Portfolio Optimization
- 研究轴: 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `600` 字

研究亮点:

- 把稀疏组合选择重构为因子驱动的 top-m 排名问题
- 使用进化反馈循环持续改进 Alpha 因子池
- 在 Fama-French 基准和中美真实市场数据上进行评估
- 消融结果强调 prompt、因子多样性和 LLM 后端的重要性

文章摘要: 这篇文章关注稀疏投资组合优化问题，即在大量资产中选择少量资产构建组合。传统方法通常依赖历史收益估计和静态优化目标，但在市场动态变化时容易适应不足，尤其在高波动或大资产池场景下，历史估计误差和固定目标会削弱组合选择效果。文章提出一种利用大型语言模型自动发现并迭代改进 Alpha 因子的框架，目标是让因子发现直接服务于稀疏组合构建。其关键建模方式是把资产选择重新表述为由因子信号驱动的 top-m 排名问题：模型生成或更新因子后，根据因子信号对资产排序，并围绕最终选出的少量资产组合表现进行反馈。框架引入进化式反馈循环，根据绩效持续增强因子池，而不是一次性生成固定因子集合。OpenReview 摘要显示，文章强调 prompt 设计、因子多样性和 LLM 后端选择对结果有重要影响，说明该方法并非仅依靠语言模型的自由生成能力，而是把生成、筛选、反馈和组合目标联动起来。实验在五个 Fama-French 基准数据集以及两个真实市场数据集上进行，真实数据覆盖美国和中国市场。结果称该方法持续优于统计类和优化类基准，尤其在高波动和大规模资产池设置中表现突出。文章的主要贡献在于把 LLM 引导的可解释因子生成与稀疏组合优化目标结合起来，并用进化搜索机制让因子池随表现反馈不断调整。其适用边界在于，摘要未披露具体因子语言、交易成本、换手约束、回测细节和统计显著性检验，因此结果可信度还需要完整论文细节支撑。

背景: 稀疏投资组合优化需要在大资产池中选择少量资产，传统依赖历史收益估计和静态目标的方法难以适应变化市场。

逻辑: 将资产选择转化为因子信号驱动的 top-m 排名问题，并通过组合表现反馈不断进化因子池，使 Alpha 发现与稀疏组合目标一致。

方法: 框架使用 LLM 自动生成和迭代细化 Alpha 因子，引入进化式反馈循环，根据表现更新因子池，并评估 prompt 设计、因子多样性和 LLM 后端的影响。

数据: 实验使用五个 Fama-French 基准数据集，以及美国和中国两个真实市场数据集。

结果: 文章报告该方法持续优于统计类和优化类基准，尤其在高波动和大资产池设置中表现更强；消融实验显示 prompt 设计、因子多样性和 LLM 后端选择很重要。

研究启发: 可把我们的 discovery -> SFT -> BT 结果变成进化反馈：保留机制、变异表达、约束字段、淘汰低质量模式，让 LLM 因子生成从一次性 prompt 变成带记忆的持续研究系统。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 可能让 LLM 因子生成从一次性 prompt 变成带记忆的持续研究系统。

### IDEA-2026-W26-9dfdbf58 — 量化投资中的 LLM 自动策略发现

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://aclanthology.org/2025.findings-emnlp.1005/
- 原题: Automate Strategy Finding with LLM in Quant Investment
- 研究轴: 因子生成 / 表示学习, 评估审计 / 可比性
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `605` 字

研究亮点:

- 提出风险感知的三阶段多智能体策略发现框架
- 强调生成因子的可执行性、预测质量、市场状态适配和类别平衡
- 将 Alpha 生成与动态权重优化连接到组合构建
- 在 SSE50 区间实验中报告 53.17% 累计收益

文章摘要: 这篇 EMNLP Findings 2025 论文提出一个用于量化投资自动策略发现的三阶段框架，核心目标是利用大型语言模型构建可执行的 Alpha 因子候选，并通过风险感知的多智能体系统完成筛选、评估和组合构建。文章的动机来自金融场景中传统深度学习模型的脆弱性：模型可能对市场状态变化敏感，难以稳定泛化，也不容易解释信号来源。为此，作者使用 prompt-engineered LLMs 在多类金融数据上生成可执行 Alpha 因子候选，再通过多模态 agent 评估模块进行过滤。过滤标准不仅包括预测质量，还包括市场状态适配和类别平衡，避免策略过度集中在单一类型信号上。最后，框架使用动态权重优化，根据市场条件调整组合权重，使信号提取与投资组合构建连接起来。摘要显示，论文在中国和美国市场状态下与已有基准进行比较，报告策略具有稳健表现。最具体的结果来自 SSE50：在 2023 年 1 月至 2024 年 1 月区间，整体框架取得 53.17% 的累计收益，并展示出更好的风险调整表现和下行保护。文章的贡献在于把 LLM 生成、agent 评估、风险感知筛选和动态组合权重优化组织成可扩展架构，使语言模型不仅生成文本解释，也参与可执行金融信号和组合的构建。需要注意的是，当前摘录主要来自摘要和元数据，未提供完整交易成本、调仓频率、样本外切分、基准细节或显著性检验，因此对结果强度的判断还需结合全文实验设置。

背景: 金融策略发现中，传统深度学习模型容易在市场状态变化下表现脆弱；LLM 有机会生成和解释金融信号，但需要评估与风险控制机制。

逻辑: 先用 LLM 生成可执行 Alpha 候选，再由多模态 agent 按市场状态、预测质量和类别平衡筛选，最后用动态权重优化适应市场条件。

方法: 论文提出三阶段风险感知多智能体框架：prompt-engineered LLM 生成 Alpha 因子，多模态 agent 评估过滤，动态权重优化构建组合。

数据: 实验涉及中国和美国市场状态；明确给出的结果区间包括 SSE50 在 2023 年 1 月至 2024 年 1 月的测试。

结果: 论文报告整体框架显著优于所有基准，并在 SSE50 的 2023 年 1 月至 2024 年 1 月区间取得 53.17% 累计收益，同时体现较好的风险调整表现和下行保护。

研究启发: 可映射到我们的多 agent 因子发现：生成、批评、静态分析、回测代理、人工 review 分工更明确，提高因子代码可执行率和研究流程可追溯性。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 潜在增益是提高因子代码可执行率和研究流程可追溯性，减少人工从零构思的成本。

### IDEA-2026-W26-a544a862 — LLM 预测的防泄漏基准：以实时通胀 Nowcast 作为宏观因子排序的决策时点输入

- 优先级: `medium`
- 状态: `candidate`
- 来源: arXiv HFT Time-Series Forecasting
- 链接: http://arxiv.org/abs/2606.22719v1
- 原题: Leakage-Aware Benchmarking of LLM Forecasting: Real-Time Nowcasts as the Decision-Time Input for Macro Factor Ranking
- 研究轴: 因子生成 / 表示学习, 评估审计 / 可比性, 模型训练 / 序列预测
- 管线落点: LLM 因子生成, 回测与可比性审计
- 角色: `评估审计 / 可比性候选`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `804` 字

研究亮点:

- 把宏观变量的发布时间滞后作为基准设计核心，明确控制信息泄漏。
- 用 Cleveland Fed 归档 CPI nowcast 替代月末不可见的正式 CPI。
- 在同一决策时点信息约束下比较 LLM 与非 LLM 基线，分解信号来源。
- 结果显示 LLM 的边际优势更可能集中在极端排名和配置 sanity check。

文章摘要: 这篇文章关注检索增强 LLM 在金融预测基准中的信息泄漏问题。作者指出，许多宏观金融预测实验把带有目标月份时间戳的变量直接作为当期可观测输入，但实际决策时这些变量往往尚未发布。例如美国 CPI 的月度官方值通常要在月末之后约十天才公布，如果月末调仓或排序时直接读取该月 CPI，就会把未来信息带入回测。文章据此构建了一个严格按决策时点约束的美国股票风格因子排序基准，考察一个 7B 开源检索增强 LLM 是否能在不使用未来信息的情况下，对七个美国股票风格因子做月度排序。评估窗口为 2023-04 至 2026-03，共 36 个决策月，输入仅包括滞后一月的 FRED 宏观变量、最近宏观事件摘要，以及 Cleveland Fed 归档的每日 CPI nowcast，用来替代当月尚未正式公布的通胀值。方法上，系统先用四维标准化宏观状态进行宏观相似历史检索，并设置至少 12 个月 embargo；随后 critic LLM 将历史相似状态压缩为一条战术规则，actor LLM 再结合当前状态和近期规则，为七个风格因子输出排序分数。结果显示，完整 LLM 管线的月度 Spearman rank IC 中位数为 +0.154，三个连续且互不重叠的 12 个月子窗口均为正均值，但均值 IC 的 bootstrap 95% 置信区间包含 0，统计功效不足。非 LLM 基线显示，在同样决策时点约束下，kNN 宏观相似模型可获得相近的中位 IC，说明实时通胀信息和宏观相似检索解释了大部分中位排序信号。LLM 的优势更多体现在较高均值 IC 与 long-top-2 / short-bottom-2 的配置 sanity check 上，提示其边际贡献可能集中于极端排名而非整体排序。文章明确强调这些结果是诊断性证据，不构成可交易策略声明，样本长度、nowcast 覆盖、因子范围和交易成本处理都是重要边界。

背景: 宏观驱动的金融预测容易在回测中误用尚未发布的数据，尤其是 CPI 等带有目标月份标签但发布时间滞后的变量。检索增强 LLM 又会额外引入宏观叙事、事件摘要和历史相似案例，因此更需要严格区分时间戳标签与真实决策时点可观测性。

逻辑: 文章的核心逻辑是先消除宏观变量发布滞后导致的信息泄漏，再在同一决策时点信息集下比较 LLM 与非 LLM 基线，从而区分模型结构贡献和实时宏观信息本身的贡献。

方法: 构建月度 walk-forward 排序基准；使用滞后一月 FRED 宏观变量、Cleveland Fed 每日 CPI nowcast 和近 30 日宏观事件摘要；用宏观相似检索选取历史状态并施加至少 12 个月 embargo；critic LLM 生成单条战术规则，actor LLM 输出七个美国股票风格因子分数；与 kNN 宏观相似、nowcast-only ridge、macro+nowcast ridge 等基线比较。

数据: 评估期为 2023-04 至 2026-03 的 36 个美国股票风格因子月度决策点；数据包括七个美国股票风格因子收益、滞后校正后的 FRED 宏观变量、Cleveland Fed 归档 CPI nowcast、FOMC 与 CPI 相关事件摘要，以及 1990 年以来用于宏观相似检索的历史状态池。

结果: 完整 LLM 管线月度 Spearman rank IC 中位数为 +0.154，三个 12 个月连续子窗口均值为正，但均值 IC 的置信区间包含 0。kNN 宏观相似基线取得可比中位 IC。long-top-2 / short-bottom-2 sanity check 中，完整 LLM 年化收益 +4.2%、Sharpe +0.71、最大回撤 -4.7%，kNN 为 +1.5%、Sharpe +0.29、最大回撤 -5.1%；作者强调这不是可部署交易绩效声明。

研究启发: 启发重点是补强 baseline regime、OOS、交易成本、样本选择和风险事件识别，降低研究结论被实验口径污染的概率。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: llm_factor_pipeline, backtest_audit。

可能增益: 潜在增益在于减少不可比实验、泄露和过拟合带来的误判，让 SFT/BT 结论更可信。

## 其他研究背景

### IDEA-2026-W26-e8390db0 — SkyJEPA：用于四旋翼零样本仿真到现实控制的长视野世界模型学习

- 优先级: `medium`
- 状态: `candidate`
- 来源: arXiv HFT Time-Series Forecasting
- 链接: http://arxiv.org/abs/2606.23444v2
- 原题: SkyJEPA: Learning Long-Horizon World Models for Zero-Shot Sim-to-Real Control of Quadrotors
- 研究轴: 模型训练 / 序列预测
- 管线落点: 人工复核
- 角色: `研究背景 / 人工讨论`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `639` 字

研究亮点:

- 将 JEPA 式潜在预测用于实时四旋翼高频控制，而非仅用于低频运动规划
- 用 physics-inspired prober 将潜在滚动转化为可解释物理状态
- 强调长视野稳定性、实时性、可解释性和零样本任务泛化四个世界模型要求
- 通过领域随机化仿真降低真实飞行数据采集成本和风险

文章摘要: 本文研究四旋翼无人机实时控制中的长视野动力学建模问题。作者指出，敏捷飞行任务要求世界模型同时具备四类性质：长视野预测准确且物理上合理、能够暴露位置/速度/姿态/角速度等可解释状态、可在嵌入式硬件上的高频闭环优化中实时推理，并能跨轨迹、任务、控制器和平台配置零样本泛化。传统一阶原理模型计算高效，但难以覆盖气动阻力、执行器延迟、桨叶与机体相互作用、风扰动、硬件差异、载荷变化和传感偏差等真实飞行效应；常规神经动力学模型虽然可从数据中学习非线性效应，却多采用自回归滚动预测，单步误差会在长时域内累积，造成漂移、不稳定或不符合物理的轨迹。SkyJEPA 将 Joint Embedding Predictive Architecture 引入实时四旋翼控制，不直接逐步重构未来状态或观测，而是在结构化潜在空间中预测未来表征，以减少对噪声、偏差和任务无关细节的建模负担。为使潜在表征可用于模型控制，论文提出 physics-inspired prober，将冻结的潜在滚动映射为具有物理意义的状态变量，并将该学习到的潜在动力学模型接入采样式最优控制框架，使其能在资源受限平台上进行实时闭环控制。数据方面，作者还设计了领域随机化的自动仿真数据生成流程，以降低昂贵且存在安全风险的真实飞行数据采集需求。实验包含开环预测和室外闭环飞行评估，论文报告该方法在预测精度、零样本仿真到现实迁移和跨多种运行条件泛化方面表现稳健；输入摘录未给出具体误差数值或完整对照表，因此结果只能概括到定性结论层面。

背景: 四旋翼在配送、巡检、搜救和环境监测等场景中需要在复杂、快速变化且不确定的环境中执行敏捷机动，模型式控制依赖准确世界模型来预测未来系统演化并纳入任务目标、动力学约束和鲁棒性考虑。

逻辑: 自回归预测模型会将自身不完美输出反复作为输入，导致长视野误差累积；JEPA 式潜在预测通过直接预测未来表征并避免完整观测重构，试图获得更稳定、更任务相关的长时域动力学表示。

方法: 方法由 JEPA 式潜在动力学模型、physics-inspired prober、领域随机化仿真数据生成流程和采样式最优控制器组成。prober 将冻结潜在表征映射到位置、速度、姿态、角速度等可解释状态，控制器利用模型滚动预测进行实时优化。

数据: 论文使用自动化领域随机化仿真流程生成训练数据，并进行开环预测实验与室外闭环真实飞行评估；摘录提到板载 GPS 定位、低层飞控接收 collective thrust 和 body-rate 命令，但未给出完整数据规模。

结果: 论文报告 SkyJEPA 在开环预测、室外闭环控制、零样本仿真到现实迁移和多运行条件泛化中表现良好；输入材料未提供具体数值指标。

研究启发: 启发重点需要人工精读后补充，当前只作为研究背景候选。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: manual_review。

可能增益: 潜在增益待人工确认，当前不建议直接进入训练或回测。

## 时序预测模型与 LOB

### IDEA-2026-W26-616a0955 — TLOB：基于限价订单簿数据的双注意力 Transformer 股价趋势预测模型

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2502.15757
- 原题: A Novel Transformer Model with Dual Attention for Stock Price Trend Prediction with Limit Order Book Data
- 研究轴: 模型训练 / 序列预测, 数据坐标 / 高频状态, 评估审计 / 可比性
- 管线落点: MLP 时序预测, LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `723` 字

研究亮点:

- 把简单 MLPLOB 作为强基线，挑战复杂架构必然更优的假设
- TLOB 用双注意力同时捕捉 LOB 空间关系和时间依赖
- 提出解耦平滑窗口与预测 horizon 的标签方法
- 指出预测分数下降和交易成本会限制趋势分类的实际价值

文章摘要: 论文研究基于限价订单簿数据的价格趋势预测问题。作者指出，LOB 记录了不同价格档位的买卖报价和数量，是观察供需平衡和市场微观结构的高维时间序列，但金融市场非平稳、噪声大且不同资产和市场状态差异显著，使得许多深度模型在跨市场、跨资产泛化时表现不稳定。论文的一个重要发现是，经过适配的简单 MLP 架构 MLPLOB 已能超过部分既有方法，因此复杂模型并不必然优越；在此基础上，作者提出 TLOB，一种使用双注意力机制的 Transformer 模型，分别捕捉 LOB 档位和特征之间的空间依赖，以及时间序列上的动态依赖，使模型能够自适应关注市场微观结构中的关键部分。输入为过去 T 个 LOB 快照，包含 10 档买卖盘价格和数量。论文还提出新的趋势标签方法，将平滑窗口 k 与预测 horizon h 解耦，避免旧方法中 horizon 同时决定预测跨度和平滑强度所带来的标签偏差；同时讨论用平均 bid-ask spread 作为阈值，以把主要交易成本纳入趋势定义。实验覆盖 FI-2010 基准、NASDAQ 中 Tesla 和 Intel 股票数据，以及 Bitcoin 数据，并在四个预测 horizon 上进行比较。结果显示，TLOB 在所有数据集和 horizon 上优于已有 SoTA：FI-2010 平均 F1 提升 3.7，Tesla 和 Intel 平均提升分别为 1.3 和 7.7，Bitcoin 平均提升 1.1。论文还通过历史数据比较发现股票价格可预测性随时间下降，F1 分数下降 6.68，符合市场效率提高后可交易规律被竞争消耗的直觉。使用 spread 定义趋势后性能恶化，说明分类准确率与可盈利交易之间存在距离。

背景: 限价订单簿价格趋势预测是金融市场和高频交易中的核心问题，LOB 数据细粒度记录供需状态，但非平稳性、噪声和市场条件变化使模型泛化困难。

逻辑: 论文先证明简单 MLPLOB 可成为强基线，再用 TLOB 的双注意力结构同时建模 LOB 的空间档位关系和时间依赖，并通过更合理的标签定义减少 horizon 偏差。

方法: MLPLOB 使用 feature-mixing 和 temporal-mixing MLP；TLOB 使用 Transformer 双注意力机制建模空间与时间关系；标签方法将平滑窗口 k 与预测 horizon h 解耦，并测试以平均 spread 作为趋势阈值。

数据: 实验使用 FI-2010 基准数据、NASDAQ 中 Tesla 和 Intel 股票数据，以及 Bitcoin 限价订单簿数据，输入为 10 档 LOB 序列。

结果: TLOB 在所有数据集和预测 horizon 上超过 SoTA；FI-2010 平均 F1 提升 3.7，Tesla 和 Intel 平均 F1 分别提升 1.3 和 7.7，Bitcoin 平均 F1 提升 1.1；历史比较显示股票价格可预测性下降 6.68 F1；以平均 spread 定义趋势会导致性能下降。

高频特征工程关注点: 文章强调多档 bid/ask 价格与数量的空间结构、时间窗口序列、mid-price 平滑标签、预测 horizon、spread 阈值和交易成本感知标签对 LOB 趋势预测的重要性。

研究启发: 适合设计 MLP/GRU/Transformer 的等口径对照：相同输入窗口、相同 label horizon、相同 normalization、相同 backtest contract；可为 mlp_codeX 增加档位维 attention、时间维 attention、轻量 MLP baseline，以及模型复杂度与收益增益的可比审计。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: mlp_codeX, llm_factor_pipeline。

可能增益: 可为 mlp_codeX 增加模型结构改进路线：档位维 attention、时间维 attention、轻量 MLP baseline、以及模型复杂度与收益增益的可比审计。

### IDEA-2026-W26-75704704 — LiT：限价订单簿Transformer

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://www.frontiersin.org/journals/artificial-intelligence/articles/10.3389/frai.2025.1616485/full
- 原题: LiT: limit order book transformer
- 研究轴: 数据坐标 / 高频状态, 模型训练 / 序列预测
- 管线落点: LLM 因子生成, MLP 时序预测
- 角色: `数据坐标 / sidecar 候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `804` 字

研究亮点:

- 提出不依赖CNN的LOB Transformer，用结构化patch和自注意力建模盘口空间与时间依赖。
- 使用Binance毫秒级Level 2数据，重建超过100万条LOB快照。
- 在多个预测期限上优于传统机器学习和深度学习基线。
- 分析patch配置，并展示微调可缓解市场分布漂移影响。

文章摘要: LiT论文面向高频限价订单簿的短期市场运动预测，提出一种不依赖卷积层的Transformer架构。文章的出发点是，LOB数据虽然天然呈现类似网格的价格层和时间窗口结构，但其微观结构并不完全符合CNN的局部空间归纳偏置：靠近中间价的层级更新更频繁，深层盘口的作用不同，买卖两侧、价格层深度与时间演化之间存在复杂的层级关系。传统统计模型和手工特征难以处理高频LOB中的非线性、噪声和非平稳性；DeepLOB等CNN-LSTM模型虽能同时利用空间和时间信息，但仍依赖卷积进行特征抽取。LiT的核心贡献是用结构化patch替代卷积，把订单簿按有经济含义的价格层、时间窗口和价量通道组织成patch，再通过线性投影和位置嵌入输入Transformer自注意力层，以捕捉不同patch之间的空间与时间依赖，随后使用LSTM进一步加强长短期时间建模。数据部分，论文从Binance收集Level 2高频订单簿数据，在毫秒级重建完整订单簿，并取买卖两侧各20档作为输入，每个时间戳包含价格和聚合量信息，共80个价量特征。实验构建了四组数据：2024年9月全月数据，以及2024年10月、11月、12月各第二周数据；重建快照超过100万条，9月样本为1,077,057个时间戳，10月、11月、12月分别为177,651、130,246和233,058个时间戳。论文以中间价变化作为市场运动代理变量，在多个预测期限上评估模型，并与传统机器学习、常规深度学习和CNN类先进基线比较。结果显示，LiT在多个LOB数据集和预测期限上持续优于传统机器学习方法和已有深度学习基线；结构化patch分析表明，更窄的时间窗口和更深的空间覆盖有助于提升预测表现；在市场动态发生分布漂移时，通过微调仍能保持较强性能。文章的边界在于研究集中于LOB短期方向预测，实证环境来自加密交易所高频数据，实际部署仍需要考虑市场制度、资产类型和数据分布变化。

背景: 文章背景是自动化交易和高频市场数据快速发展，使限价订单簿成为研究市场微观结构和短期价格运动的重要对象。LOB同时包含买卖两侧、多个价格层级、价格与数量通道以及快速变化的时间序列，具有高噪声、强非平稳和深层层级结构，给特征表示和预测建模带来挑战。

逻辑: 文章认为LOB不是普通图像式网格，简单依赖CNN的局部空间卷积可能无法充分表达盘口层级和买卖两侧的结构关系。其核心逻辑是把LOB切成具有市场含义的结构化patch，让自注意力直接学习不同价格层、时间片段和价量通道之间的依赖，再结合LSTM补充序列建模能力，从而同时覆盖空间层级和时间动态。

方法: LiT由三部分组成：首先将LOB输入表示为深度H、时间窗口W、通道C的三维张量，其中通道包括价格和数量；其次将输入拆成结构化patch，通过线性投影和位置嵌入形成token，并用Transformer自注意力层编码patch之间的空间和时间依赖；最后接入LSTM层增强长期时间依赖建模。实验还包含patch配置分析和分布漂移下的微调评估。

数据: 论文使用Binance Level 2高频订单簿数据，在毫秒级重建订单簿，取买卖两侧各20档盘口，形成每个时间戳80个价格和聚合数量特征。数据集包括2024年9月全月，以及2024年10月、11月、12月各第二周，分别包含1,077,057、177,651、130,246和233,058个时间戳，重建LOB快照总数超过100万。

结果: 论文报告LiT在多个LOB数据集和不同预测期限上持续优于传统机器学习方法和先进深度学习基线；结构化patch实验显示，较窄时间窗口和更深空间覆盖能显著改善预测表现；在市场分布变化下，LiT经微调后仍保持稳健性能。

高频特征工程关注点: 文章的特征工程重点是将盘口价量矩阵按经济结构切分，而不是直接展平：买卖两侧、20档价格层、价格与数量通道、时间窗口和中间价变化标签共同构成结构化输入。其patch设计强调价格层覆盖深度、时间窗口宽度和价量通道组织方式对预测效果的影响。

研究启发: 可结合我们的OB/SF/sidecar/MLP/LGB/Linear/LLM因子管线，把LiT的结构化patch思想用于盘口输入组织：将10档或20档盘口按bid/ask、价量通道、近中间价层级、深层流动性和短时间窗口切成稳定子块，再作为MLP结构升级、LGB统计特征聚合或LLM因子描述的基础。它提示不要只把盘口列展平，而应保留价格层相对位置、买卖不对称和局部盘口形态。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline, mlp_codeX。

可能增益: 可能改善模型对价格层相对位置、bid/ask 不对称、局部盘口形态的吸收，适合作为 MLP 结构升级方向。

### IDEA-2026-W26-9cce7f91 — Deep Limit Order Book Forecasting：深度限价订单簿预测与 LOBFrame 基准

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2403.09267
- 原题: Deep Limit Order Book Forecasting
- 研究轴: 数据坐标 / 高频状态, 模型训练 / 序列预测, 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`
- 原文证据: `已读 PDF`；摘要质量: `中`；摘要长度: `585` 字；提示: 已读 PDF 但摘要少于 600 字

研究亮点:

- 发布 LOBFrame 以支持大规模 LOB 数据处理和模型评估
- 强调股票微观结构差异会影响深度模型预测能力
- 指出高预测指标不必然等于可交易信号
- 提出面向完整交易预测概率的操作性评估框架

文章摘要: 论文研究高频限价订单簿中间价变化的可预测性，并发布 LOBFrame 作为开源代码库，用于高效处理大规模 LOB 数据和评估深度学习模型。文章的核心背景是，金融市场由不同时间尺度、不同信息水平和不同交易能力的参与者共同作用，噪声高、随机性强；现代交易所通过 FIFO 等撮合规则维护限价订单簿，订单提交、成交和撤销共同形成价格变化。高频交易者会利用微观结构缺陷和速度优势，使市场可预测性与噪声持续相互作用。作者认为，现有 LOB 深度学习研究一方面受限于数据和算力成本，另一方面常把 LOB 当作普通时间序列预测任务，忽视了流动性、价差、订单执行和交易可操作性等微观结构约束。论文使用 NASDAQ 上一组异质股票的高频 LOB 数据，探索深度模型对中间价变化的预测能力，并分析股票微观结构特征如何影响模型效果。第二，传统机器学习指标不足以评价 LOB 预测质量，因为高准确率或高分类指标不一定对应可执行交易信号。为此，论文提出一个更偏操作层面的评估框架，关注模型是否能够正确预测完整交易，而不是只看静态标签分类结果。该框架试图把预测结果与订单簿可成交性、交易执行和实际可用性联系起来。文章的贡献在于提供可复现的数据处理与评估工具，并强调深度 LOB 预测应由市场微观结构指导；其适用边界是，预测指标、样本股票和执行假设必须结合具体市场结构解释，不能直接等同于盈利能力。

背景: 限价订单簿是现代电子交易所记录供需、执行优先级和形成价格的核心结构；高频市场噪声强、参与者异质且存在速度竞争，使中间价预测具有挑战。

逻辑: 深度模型的预测效果必须放在股票微观结构中解释；单纯机器学习指标无法判断预测是否可交易，因此需要把预测评价连接到完整交易和执行可操作性。

方法: 论文发布 LOBFrame，用于大规模 LOB 数据处理和深度学习模型评估；比较先进深度模型对中间价变化的预测能力，并提出关注完整交易预测概率的操作性评估框架。

数据: 文章使用 NASDAQ 交易的一组异质股票的高频限价订单簿数据，分析不同股票的流动性、价差和微观结构特征对预测表现的影响。

结果: 论文报告的主要结论是，股票微观结构特征会影响深度学习模型效果；较高预测指标不一定转化为可执行交易信号；传统机器学习指标不足以评价 LOB 预测质量。输入材料未给出具体逐项数值结果。

高频特征工程关注点: 文章关注 LOB 价格档位、挂单数量、bid-ask spread、流动性、订单提交、市场订单、撤单、FIFO 优先级和中间价变化等微观结构变量。

研究启发: 可用于把 MLP/GRU/CNN/Transformer 训练评估从单一 IC 或分类准确率扩展到交易可执行性、成交概率、预测完整交易方向等 operational metrics；也有助于解释离线指标提升为何不一定转化为收益，并为 MLP/Linear/LGB 对照建立更合理的验证口径。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline。

可能增益: 可帮助解释为什么模型离线指标提升不一定转化为收益，并为 MLP/Linear/LGB 对照建立更合理的验证口径。

### IDEA-2026-W26-5a2dfd8b — LSTM、GRU 与 Transformer 在股票价格趋势预测中的比较分析

- 优先级: `medium`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2411.05790
- 原题: Comparative Analysis of LSTM, GRU, and Transformer Models for Stock Price Trend Prediction
- 研究轴: 模型训练 / 序列预测
- 管线落点: MLP 时序预测
- 角色: `模型训练 / 融合候选`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `677` 字

研究亮点:

- 在 Tesla 2015-2024 历史数据上比较 LSTM、GRU 和 Transformer
- 包含基础探索性分析、平稳性检验和差分处理
- 报告 LSTM 在该实验中达到 94% 准确率
- 可作为深度序列模型家族对照的入门案例

文章摘要: 本文围绕 AI 驱动的股票价格预测，比较 LSTM、GRU 和 Transformer 模型在 Tesla 股票数据上的趋势预测表现。论文从金融市场预测的困难出发，指出股票价格受经济指标、地缘政治事件、市场情绪和投资者行为等因素影响，具有不确定性、非线性和高维特征，传统决策树、SVM 等方法虽然结构清晰，但难以充分处理复杂金融数据关系；深度学习方法，尤其是循环神经网络、LSTM、GRU、CNN、GNN、Transformer 和强化学习，已成为股票预测研究的重要方向。本文实验数据为 Tesla 股票 2015 年 1 月 1 日至 2024 年 1 月 16 日的历史数据，共 2274 个交易日，字段包含开盘、最高、最低、收盘和成交量等。作者先进行探索性分析，确认数据无缺失，绘制月度开盘价与收盘价比较、价格走势和成交量变化，并报告月度均值高价的 ADF 检验 p 值为 0.703，显示非平稳；差分后 ADF p 值为 0.142，平稳性有所改善。模型部分介绍 LSTM 的遗忘门、输入门、细胞状态更新和输出门公式，并说明 GRU 通过重置门和更新门以更简单结构捕捉长期依赖；Transformer 作为对照用于序列建模和金融文本情绪等方向。摘要报告实验中 LSTM 准确率达到 94%，并认为其更符合股票趋势预测任务。需要注意的是，输入摘录没有完整展示训练/验证/测试切分、标签定义、Transformer 与 GRU 的具体指标、是否存在时间泄漏控制或交易层面评估，因此结论更适合作为模型家族对照和案例性结果，而不是强可复现的金融预测基准。

背景: 股票市场预测受有效市场假说、信息反映速度、市场情绪、宏观和地缘事件等因素影响，传统模型难以处理金融数据的高维、非线性和时序依赖。

逻辑: 论文通过同一 Tesla 历史股票数据集比较 LSTM、GRU 和 Transformer，试图判断哪类深度序列模型更适合股票趋势预测。

方法: 研究流程包括 Tesla 历史数据探索性分析、缺失值检查、月度价格比较、价格和成交量可视化、ADF 平稳性检验、差分处理，以及 LSTM、GRU、Transformer 三类模型训练对比。

数据: Tesla 股票数据，时间跨度为 2015-01-01 至 2024-01-16，共 2274 个交易日，包含开盘、最高、最低、收盘和成交量等字段。

结果: 摘要称 LSTM 模型准确率为 94%；摘录没有给出 GRU 和 Transformer 的完整数值结果，也没有给出详细切分与误差统计。

高频特征工程关注点: 文章主要使用日频 OHLCV 股票数据，并进行月度统计、ADF 平稳性检验和差分处理；不涉及订单簿、主动买卖、微价格、队列状态或事件时间等高频特征。

研究启发: GRU 可作为轻量路径记忆 baseline，与 MLP、TCN、small Transformer 在相同数据切分和交易评估下比较，检验是否能以较低参数量吸收短窗口状态延续。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: mlp_codeX。

可能增益: 可用于 mlp_codeX 的低成本模型扩展：MLP vs GRU vs TCN vs small Transformer，在相同数据切分和交易评估下比较。

### IDEA-2026-W26-9a5092a6 — LENS：用于探索金融时序规律的大规模预训练 Transformer

- 优先级: `medium`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2408.10111
- 原题: LENS: Large Pre-trained Transformer for Exploring Financial Time Series
- 研究轴: 模型训练 / 序列预测
- 管线落点: MLP 时序预测
- 角色: `模型训练 / 融合候选`
- 原文证据: `已读 PDF`；摘要质量: `中`；摘要长度: `587` 字；提示: 已读 PDF 但摘要少于 600 字

研究亮点:

- 明确将低信噪比和高随机性作为金融时序基础模型的核心难题
- 使用超过 1000 亿条金融观测进行大规模预训练
- 通过可逆嵌入和对比式 patch 构造缓解噪声影响
- 同时给出理论解释和多任务实验验证的模型设计

文章摘要: 本文提出 LENS，一个面向金融时间序列的预训练基础模型。论文的出发点是，金融时序与交通、气象等具有明显周期或趋势的序列不同，受到经济环境、政治事件、市场参与者行为等多因素驱动，具有强随机性、低信噪比和高波动性；传统统计模型、一般深度学习模型以及从其他领域迁移来的通用时间序列预训练框架，往往难以直接适应金融数据。作者认为金融时序需要专门设计的基础模型和训练框架。LENS 的核心做法包括：在超过 1000 亿条金融观测上预训练；以 patch 为单位构造时间序列 token；引入可逆嵌入模块来初始化 patch 级表示并在预训练中缓解噪声影响；使用适合多变量时间序列的专门注意力机制来捕捉变量间依赖；同时结合对比学习和重构目标来学习噪声环境下的稳健表示。摘录中还描述了预处理方式：给定多通道时间序列后划分为若干 patch，对每个 patch 添加小幅高斯噪声生成正样本，并通过时间轴翻转生成负样本，配合理论分析说明在高斯白噪声下干净样本表征距离的期望边界。论文声称通过严格理论解释和广泛实验验证了模型有效性，并在多个关键下游任务上取得优异结果；摘录中还出现了以前 96 个时间步预测未来 196 个时间步的可视化设置。不过，输入材料没有给出完整任务列表、具体数据来源构成、基线名称和数值指标，因此可确认的结论主要是其大规模金融预训练、噪声鲁棒表示设计和跨任务泛化主张。

背景: 金融时间序列在投资决策、风险评估和政策分析中重要，但其低信噪比、高随机性和跨领域差异使通用时序模型和传统预训练经验难以直接迁移。

逻辑: 论文认为金融时序基础模型需要同时处理噪声、随机性和多变量依赖，因此通过大规模金融观测预训练、可逆嵌入、专门注意力机制、对比学习和重构目标来学习稳健表示。

方法: LENS 采用大规模 Transformer 式预训练框架，将多变量时间序列划分为 patch，使用可逆嵌入初始化 token 表示，并构造高斯扰动正样本与时间翻转负样本进行对比学习，同时结合重构目标和多变量注意力机制。

数据: 论文称预训练数据包含 1000 亿条金融观测；摘录未给出各市场、资产类别、频率和样本区间的完整细节。

结果: 论文声称 LENS 在广泛关键下游任务上取得优异表现，并提供理论和实验验证；输入摘录未给出具体指标表。

高频特征工程关注点: 与高频金融特征工程相关的是其 patch 级时间片表示、噪声扰动正样本、时间翻转负样本、多变量依赖建模和重构目标，可视为对高噪声金融序列状态表示的自监督构造方式。

研究启发: 可考虑在 OB/SF/sidecar 数据上做自监督预训练，例如 mask reconstruction、next-state prediction、contrastive state matching，让 MLP/GRU/Transformer 在监督 label 之外先学习盘口状态空间和跨股票共性表示。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: mlp_codeX。

可能增益: 潜在增益在于让 MLP/GRU/Transformer 不只依赖监督 label，而先学习盘口状态空间和跨股票共性表示。

## 订单簿表示与逐笔数据

### IDEA-2026-W26-ed1d1cfb — 基于注意力机制的限价订单簿阅读、突出与全簿预测

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2409.02277
- 原题: Attention-Based Reading, Highlighting, and Forecasting of the Limit Order Book
- 研究轴: 模型训练 / 序列预测, 数据坐标 / 高频状态
- 管线落点: MLP 时序预测, LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `647` 字

研究亮点:

- 把预测对象从中间价扩展到完整多层订单簿价格和数量
- 提出 compound multivariate embedding 处理订单类型、特征、层级和时间的复合依赖
- 用百分比变化和 min-max transformation 缓解高频数据非平稳性
- 强调相同中间价下订单深度和价差仍可能显著不同

文章摘要: 这篇论文关注限价订单簿在高频环境下的完整状态预测问题，认为只预测未来中间价方向不足以刻画真实市场动态。订单簿同时包含买卖方向、价格、数量、层级和时间等复合属性，且订单在毫秒级被提交、成交、修改或撤销，形成噪声强、非平稳、属性交织的多变量时序。文章指出，即使多个订单簿快照具有相同中间价，其不同层级深度、买卖价差和挂单分布也可能显著不同，因此完整预测多层 bid/ask 价格与数量对于理解市场深度、风险管理和最优执行更有意义。方法上，论文引入面向多层 LOB 的 attention-based sequence-to-sequence 预测框架，并提出 compound multivariate embedding，用于同时编码订单类型、特征维度、价格层级和时间维度之间的时空依赖。为应对高频金融数据的非平稳性，文章还采用百分比变化与 min-max transformation，以降低分布漂移对模型训练和测试的影响，而不额外增加模型复杂度。论文用 AMZN 等股票的高频订单簿示例说明短时间尺度下 best bid、best ask 和 bid-ask spread 的剧烈变化会被长窗口平均掩盖，并强调时间分辨率选择对 LOB 分析至关重要。实验部分将所提出方法与其他多变量预测方法比较，摘要和结论显示该方法取得最低预测误差，并能较好保持订单簿价格层级的有序结构。文章的核心贡献在于把 LOB 预测从单一价格方向扩展到整本多层订单簿重构，并用复合嵌入显式处理高频订单簿的时空复合属性。

背景: 高频限价订单簿持续记录不同价格层级上的买卖挂单、数量和时间信息，是市场供需与流动性状态的实时快照。传统低频金融建模中常用的平稳性、独立增量或固定买卖价差假设，在毫秒级订单流环境下往往不足。

逻辑: 中间价只能提供粗略趋势信号；相同中间价下，订单深度、价差和多层挂单结构仍可能完全不同。因此，若要理解订单簿演化、市场深度和执行风险，需要同时预测多层价格与数量，并保留层级之间的有序关系。

方法: 文章使用 attention-based sequence-to-sequence 模型预测整本多层 LOB，并提出 compound multivariate embedding 来编码订单类型、特征、层级和时间等复合属性之间的时空依赖；同时使用百分比变化和 min-max transformation 缓解高频数据非平稳性。

数据: 论文摘录展示了 AMZN 股票 best bid、best ask 在 1 秒到 2 小时不同滚动窗口下的变化，以及 GOOG、AAPL、AMZN 在某交易日的 bid-ask spread 变化，用于说明高频 LOB 的短时波动和价差非恒定特征。

结果: 摘要和结论称，所提出的复合多变量嵌入方法在经验实验中优于其他多变量预测方法，取得最低预测误差，并能保持 LOB 的有序层级结构；输入材料未给出具体数值表格。

高频特征工程关注点: 文章强调多层 bid/ask 价格、对应深度、买卖价差、层级有序结构、短时间尺度波动和百分比变化转换等高频订单簿表征。

研究启发: 启发可以把 OB 预测目标从短 horizon return 或 mid-price direction 扩展为 next-state / book-shape reconstruction，并将订单簿重构损失作为 MLP 时序预测或 LLM 因子生成后的辅助训练目标。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: mlp_codeX, llm_factor_pipeline。

可能增益: 可能提升模型对盘口状态演化的理解，辅助短 horizon return label 的弱信号学习。

## 评估审计与风险控制

### IDEA-2026-W26-fb8e1c23 — 双分支自监督学习检测市场操纵：融合频域异常合成与领域特征

- 优先级: `high`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://doi.org/10.1016/j.ipm.2026.104961
- 原题: Detecting market manipulation with dual-branch self-supervised learning: A unified framework integrating frequency-informed anomaly synthesis and domain-specific features
- 研究轴: 评估审计 / 可比性, 模型训练 / 序列预测, 数据坐标 / 高频状态
- 管线落点: 回测与可比性审计, Linear/Ridge baseline, LLM 因子生成
- 角色: `评估审计 / 可比性候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `746` 字

研究亮点:

- 针对信号隐蔽、标签稀缺和边界模糊提出统一自监督检测框架
- 结合市场微观结构领域特征与频域异常合成
- 双分支对比网络同时关注局部操纵边界和整体时间依赖
- 在股票操纵与加密货币 pump-and-dump 数据上均报告显著效果

文章摘要: 这篇文章研究金融市场操纵检测，出发点是实际监管和风控场景中存在三类困难：操纵信号往往被正常交易噪声掩盖，可用标注案例稀缺，正常交易与操纵行为之间的边界模糊。论文提出 SD-FMM，即面向金融市场操纵的自监督检测框架，试图在缺少大量标注数据的条件下提升检测灵敏度、降低误报并缩短发现延迟。框架包含三个主要组件。第一是 amplification component，基于市场微观结构理论抽取并融合领域特征，用于放大原本隐蔽的操纵迹象。第二是 synthesis component，通过 few-shot learning 与动态频率分析生成更真实的合成异常，其中频率分析使用 Discrete Wavelet Transform，从而为自监督训练提供异常样本来源。第三是 detection component，采用 dual-branch contrastive detection neural network：一支通过局部对比学习增强对操纵边界的敏感性，另一支建模整体时间依赖，以同时处理局部异常边界和全局时序模式。实验使用两个市场的数据：一个是新收集的 25 起中国股票市场操纵案例的专有数据集，另一个是包含 338 起加密货币 pump-and-dump schemes 的公开基准。论文称，在 12 个先进基线对比中，SD-FMM 在股票数据上平均精度相对次优方法提升 47.61%，误报率降低 47.46%，平均检测延迟缩短 25.05%；在加密货币数据上，Hit Rate@3 达到 83.13%，Hit Rate@20 达到 97.93%。文章的亮点在于把微观结构领域特征、频域异常合成和双分支对比检测合成一个统一框架，并在股票与加密市场两个不同操纵场景中验证泛化检测能力。

背景: 市场操纵检测面对信号隐蔽、标注稀缺和边界模糊三类难题，传统监督学习方法容易受少量标签和噪声交易行为影响。

逻辑: 文章认为，需要先用领域特征增强弱操纵信号，再用频域方法合成接近真实市场行为的异常样本，最后通过兼顾局部边界和整体时序依赖的双分支网络完成检测。

方法: SD-FMM 包含领域特征放大组件、基于 few-shot learning 和 Discrete Wavelet Transform 的异常合成组件，以及 dual-branch contrastive detection neural network。检测网络结合局部对比学习和整体时间依赖建模。

数据: 实验使用 25 起中国股票市场操纵案例的专有数据集，以及包含 338 起加密货币 pump-and-dump schemes 的公开基准。

结果: 相对 12 个先进基线，SD-FMM 在股票数据上平均精度较次优基线提升 47.61%，误报率降低 47.46%，平均检测延迟缩短 25.05%；在加密货币数据上 Hit Rate@3 为 83.13%，Hit Rate@20 为 97.93%。

高频特征工程关注点: 文章提到基于市场微观结构理论抽取并融合领域特征，但输入材料未列出具体特征名称；频域侧使用 Discrete Wavelet Transform 进行动态频率分析和异常合成。

研究启发: 可把异常成交、盘口异动、价格跳跃和订单流不一致设计成 event/reliability sidecar，过滤或降权异常状态下的预测信号。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: backtest_audit, linear_codeX, llm_factor_pipeline。

可能增益: 潜在增益是减少操纵/异常事件对训练和回测结论的污染，提升 tail 风险控制。

### IDEA-2026-W26-cd66d4c6 — 金融科技系统中的自适应风险评估：基于强化学习的连续策略优化

- 优先级: `medium`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://doi.org/10.62762/jse.2026.605759
- 原题: Adaptive Risk Evaluation in FinTech Systems via Reinforcement-Based Continuous Policy Optimization
- 研究轴: 因子生成 / 表示学习, 模型训练 / 序列预测
- 管线落点: LGB 融合与筛选, MLP 时序预测
- 角色: `模型训练 / 融合候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `667` 字

研究亮点:

- 将实时风险评分建模为连续动作 MDP
- 同时提出学习算法和可部署的软件架构
- 通过异步更新循环实现在线学习与推理服务解耦
- 在模拟 FinTech 数据上报告较高准确率、趋势适应率和长期奖励指标

文章摘要: 本文研究金融科技系统中实时、自适应风险评分问题。作者认为，现代 FinTech 软件系统需要在高吞吐信息流上进行低延迟风险判断，同时具备对概念漂移的鲁棒性，并能在不中断服务的情况下更新模型。论文将风险评估建模为连续动作 Markov Decision Process，提出 ARL-CPO，即基于强化学习的连续策略优化框架，通过流式交易数据、行为事件和结果驱动的奖励反馈持续优化风险策略。与只强调模型算法不同，论文还把 ARL-CPO 描述为可部署的软件架构：将在线学习与推理服务解耦，推理侧可作为微服务运行，外层由异步更新循环持续刷新模型，从而避免周期性批量重训对服务造成干扰。作者认为这种连续更新能力是 Random Forest、Gradient Boosting 和 Transformer 等基线不具备的。实验任务包括信用违约预测和自适应资产配置，数据来自自定义 FinTech 环境模拟器生成的 850 万条信用记录。论文以 precision、F1 score 等分类表现为基础，并报告 ARL-CPO 相比基线取得 97.4% 分类准确率、98.8% 趋势适应率和 96.1% 累计长期表现指数，其中趋势适应率用于衡量对分布变化的响应，累计长期表现指数为归一化长视野奖励。文章结论是，基于强化学习的连续策略更新可以成为实时风险系统中可实现的自适应组件，适用于市场和用户条件持续变化的环境。边界方面，输入材料显示数据由自定义模拟器生成，数据可按请求提供，未展示完整特征构成、模拟机制、基线配置和独立外部真实数据验证细节。

背景: FinTech 风险系统需要在高容量、低延迟的数据流上实时评估信用、交易或资产配置风险，并应对市场与用户行为变化带来的概念漂移。

逻辑: 论文将风险评分视为序贯决策问题，通过连续动作 MDP 和结果奖励反馈持续优化风险策略；架构上将推理服务与在线学习更新分离，以支持不中断服务的连续适应。

方法: ARL-CPO 使用强化学习进行连续策略优化，输入包括流式交易、行为事件和结果反馈；部署形态包括推理微服务与异步在线更新循环，并与 Random Forest、Gradient Boosting、Transformer 基线比较。

数据: 实验使用自定义 FinTech 环境模拟器生成的 850 万条信用记录，任务包括信用违约预测和自适应资产配置；页面声明数据可按请求提供。

结果: 论文报告 ARL-CPO 达到 97.4% 分类准确率、98.8% 趋势适应率和 96.1% 累计长期表现指数，并优于 Random Forest、Gradient Boosting 和 Transformer 基线。

高频特征工程关注点: 文章涉及流式交易事件、行为事件、结果反馈奖励和概念漂移响应指标，强调在线风险状态随时间更新；未提供订单簿或盘口微观结构特征细节。

研究启发: 可借鉴为高频预测中的动态可信度评分：在流动性、波动、拥挤交易或市场结构变化时调整因子的使用强度。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: lgb_codeX, mlp_codeX。

可能增益: 潜在收益不是直接提高 raw IC，而是减少状态不适配时期的尾部损失和 SFT/BT 不稳定。

## 高频数据特征工程

### IDEA-2026-W26-bc3ab97e — 中信建投：市场微观结构系列研究，从分钟频到 Level2 的探索与发现

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://view.inews.qq.com/a/20251217A01V3A00
- 原题: CSC market microstructure research from minute frequency to Level2
- 研究轴: 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态
- 管线落点: LLM 因子生成, 高频数据特征工程
- 角色: `高频数据特征工程候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `723` 字；提示: 摘要可能缺少方法/模型描述

研究亮点:

- 把分钟频因子和 Level2 订单流放在同一微观结构框架下讨论
- 强调市场结构漂移会改变高频因子的有效性边界
- 提出时间重心算子刻画日内资金和价格变化的集中位置
- 用撤单、彩票委托、废单等逐笔委托信息解释交易意图

文章摘要: 文章汇总中信建投过去四年高频因子开发经验，主题分为分钟频高频因子挖掘和 Level2 数据应用两部分。报告的出发点是：高频数据能够揭示日频和中低频行情无法观察的微观交易细节，但也带来存储、算力、噪音、过拟合和市场微观结构漂移问题；因此，高频 Alpha 不能只依赖历史统计拟合，而要理解订单流、成交时间、投资者结构和流动性来源。分钟频部分先给出三类因子开发路径：一是挖掘变量分布规律，如单笔成交金额分位数因子 QUA，用分位数和比值处理股价差异、低流动性异常值及极端成交；二是捕捉日内时序异质性，如隔夜、早盘、盘中、尾盘涨跌幅在动量和反转上的差异，并据此改进收益率偏度因子 CSKEW；三是利用多指标联动，例如用成交量、大单买入笔数、主动买卖金额、振幅与涨跌幅等指标对的相关性解释不同资金行为。文章还提出时间重心算子，用分钟时间戳与成交量或涨跌幅做加权，刻画资金或价格变化在日内的集中位置，由此构造短线交易拥挤度 STC 和时间重心偏离 TGD。Level2 部分围绕逐笔成交、逐笔委托和 Tick 订单簿快照，讨论订单生命周期、撤单、部分撤回、彩票委托、废单、收盘参与度等信息如何反映投资者交易意图。报告给出多项实证结果：QUA、CSKEW、MTS、SR、LOTTERY、PTO 等因子在全市场或中证1000样本中具有不同程度的 IC、多空收益和指数增强效果，同时也强调部分因子收益与流动性、市值、波动等风格暴露高度相关，且早盘成交拥挤、尾盘成交减少等微观结构变化会削弱部分历史规律。文章的边界在于不少结论依赖 A 股制度、样本期和交易者结构，且一些因子更接近 Half-Alpha 或风格收益载体，需要结合中性化、分阶段稳定性和经济解释评估。

背景: 高频数据开发速度加快，分钟频和 Level2 数据提供比日频行情更细的交易过程信息，但市场微观结构变化会影响历史统计规律的一致性。

逻辑: 有效高频 Alpha 应从数据分布、日内时序异质性、多指标联动和订单流行为机制中寻找，并用微观交易逻辑解释统计结果。

方法: 报告构造单笔成交金额分位数 QUA、修正收益率偏度 CSKEW、时间重心算子、短线交易拥挤度 STC、时间重心偏离 TGD、主力交易强度 MTS、强反转 SR、彩票委托 LOTTERY、收盘参与度 PTO 等指标，并进行中性化、分组、IC、多空收益和指数增强测试。

数据: 文章使用 A 股分钟行情、Level2 逐笔成交、逐笔委托和 Tick 行情，样本中多处覆盖 2013-2025 或 2018-2025 区间，并包括全市场和中证1000成分股测试。

结果: QUA 因子 IC 为 -0.054、Rank IC 为 -0.078，但流动性暴露较强；CSKEW 多空年化收益超过 30.4%、信息比率 3.3；STC 在中证1000优选中超额夏普 2.19、最大回撤 6.23%；TGD 超额夏普 1.52；MTS 全样本 IC 均值 0.06、多空年化收益超 32%、信息比率 2.6；LOTTERY 全样本 IC 均值 0.06、多空年化收益超 20%；PTO 多空年化收益超 32%。

高频特征工程关注点: 重点特征包括单笔成交金额分位数、分钟收益率偏度、日内分时涨跌幅、早盘/盘中/尾盘成交占比、成交量时间重心、大单买入笔数、主动买卖金额同步性、逐笔委托撤回类型、极端价彩票委托、收盘废单和订单流生命周期。

研究启发: 与 OB/SF 预测较契合，可把 Level2 指标对、主动买卖同步性、大单交易行为、尾盘废单、彩票委托、分钟频到秒级的状态迁移纳入 sidecar taxonomy；也可为 LLM 因子生成提供中文机制模板，并帮助 MLP/LGB 构造更可解释的 order-flow interaction 特征。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: llm_factor_pipeline, hft_feature_engineering。

可能增益: 可能为 LLM 因子生成提供中文机制模板，也能帮助 MLP/LGB 侧构造更可解释的 order-flow interaction 特征。

### IDEA-2026-W26-3f512fff — 国信证券：高频订单成交数据蕴含的 Alpha 信息

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://www.fxbaogao.com/detail/4095774
- 原题: Guosen Securities alpha information in high-frequency order transaction data
- 研究轴: 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态
- 管线落点: 高频数据特征工程, LLM 因子生成, 数据 sidecar / 高频衍生数据
- 角色: `高频数据特征工程候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `656` 字

研究亮点:

- 从逐笔成交数据拆解日频 K 线无法表达的日内路径差异
- 发现传统大单交易占比因子内部子因子方向不一致
- 把订单大小和成交时长组合成稳定性更强的复合因子
- 提出基于订单属性分类的成交量占比统一框架

文章摘要: 报告从日频行情数据的信息损失出发，说明两只股票即使具有完全相同的日 K 线，也可能对应完全不同的日内走势和资金博弈过程，因此逐笔成交数据能够补充日频 OHLCV 无法表达的交易细节。逐笔成交数据记录每笔成交的数量、价格、时间，以及本次成交涉及的买卖双方订单数量、价格和订单号。报告认为，高频订单可从订单大小、成交时长、成交时间、出价高低等维度考察，并围绕这些属性构造成交量占比类选股因子。首先，报告用分位点定义大单并构造传统大单交易占比因子；该因子有一定选股能力但稳定性较差。进一步拆解后发现，按委买单和委卖单是否为大单划分的子因子方向并不一致，简单合成会相互抵消，因此作者调整子因子方向，构造改进后大单交易占比因子。其次，报告研究订单成交时长，认为成交耗时较长的订单反映不同的交易状态和流动性环境，并同样用分位点划分漫长订单，构造漫长订单交易占比因子。随后报告还讨论早尾盘属性和高低价属性，并将改进大单交易占比与漫长订单交易占比等权合成，形成大单及漫长订单复合因子。最后，报告提出统一框架：基于委买单和委卖单的“大单属性”和“漫长属性”对成交记录分类，分别检验不同订单类型成交量占比的选股能力，并筛选出精选复合因子。结果显示，改进大单交易占比、漫长订单交易占比、复合因子和精选复合因子均有较稳定的 RankIC 与胜率表现；复合因子更偏向低估值、大市值、低波动、低换手股票，在剥离传统选股因子后仍保留一定纯净选股能力。报告边界在于结论依赖订单数据定义、分位阈值、样本环境和市场交易制度，并提示市场环境变动风险。

背景: 传统日频量价因子难以表达日内交易路径和资金博弈，高频逐笔成交数据能够记录更细的成交数量、价格、时间和订单关联信息。

逻辑: 订单大小、成交时长、成交时间和出价高低反映了不同交易状态；按这些属性拆分成交记录，再计算各类成交量占比，可以提取日频行情中缺失的 Alpha 信息。

方法: 报告用分位点划分大单和漫长订单，构造传统与改进大单交易占比、漫长订单交易占比、早尾盘和高低价属性因子，并用等权合成与精选分类形成复合因子；测试月频和周频调仓表现、RankIC、RankICIR、胜率、自相关和风格暴露。

数据: 使用 A 股逐笔成交数据，字段包括成交数量、成交价格、成交时间、买卖双方订单数量、价格和订单号，并结合不同股票样本空间做因子检验。

结果: 改进后大单交易占比 RankIC 均值 7.6%、年化 RankICIR 3.73、月胜率 88.1%、月度自相关 0.81；漫长订单交易占比 RankIC 均值 7.1%、年化 RankICIR 3.88、月胜率 84.5%、月度自相关 0.82；大单及漫长订单复合因子 RankIC 均值 8.4%、年化 RankICIR 4.39、月胜率 88.1%；精选复合因子 RankIC 均值 8.5%、年化 RankICIR 5.06、月胜率 90.5%，周频调仓年化 RankICIR 6.57、周胜率 82.6%。

高频特征工程关注点: 核心特征包括大单交易占比、按委买单/委卖单拆解的大单属性、订单成交时长、漫长订单交易占比、早尾盘属性、高低价属性，以及基于订单类别的成交量占比统一框架。

研究启发: 可映射到 Stream/OB 数据：订单大小、成交耗时、早尾盘属性、高低价属性可以成为可审计的 sidecar 字段或 LLM 因子模板；也可能提供比普通成交量 rolling 更细的行为分解，用于识别拆单、被动吸收、流动性消耗和延迟成交状态。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: hft_feature_engineering, llm_factor_pipeline, data_processing_sidecar。

可能增益: 可能提供比普通成交量 rolling 更细的行为分解，帮助识别拆单、被动吸收、流动性消耗和延迟成交状态。

### IDEA-2026-W26-759776b6 — 挂单方向长期记忆性的讨论与应用

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://www.fxbaogao.com/detail/4339762
- 原题: KYSEC order flow long memory of order submission direction
- 研究轴: 数据坐标 / 高频状态, 高频特征工程
- 管线落点: 数据 sidecar / 高频衍生数据, 高频数据特征工程, LLM 因子生成
- 角色: `高频数据特征工程候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `759` 字

研究亮点:

- 用逐笔委托方向编码和自相关函数实证检验A股挂单方向长期记忆。
- 指出长期记忆在2022年以来增强，且靠近盘口、小额委托更明显。
- 将长期记忆转化为LMS、MEMO、OST和订单小岛等Alpha特征。
- 比较树模型和LSTM特征合成，强调泛化、共线性和惩罚项的重要性。

文章摘要: 开源证券这篇市场微观结构报告从逐笔委托的时间序列出发，研究A股订单流中“挂单方向是否具有长期记忆性”以及这一现象能否转化为Alpha信号。报告将每笔买入委托编码为1、卖出委托编码为-1，形成连续的订单方向序列，并用自相关系数、ACF和PACF来刻画不同滞后阶下订单方向之间的联系。实证部分显示，A股挂单方向的自相关在较长滞后范围内显著不为零，后续订单方向与当前方向存在持续关联；这种长期记忆性在大小市值股票中普遍存在，但2022年以前并不显著，且高低股价股票的偏好在不同时期呈现差异。微观分解进一步指出，连续竞价阶段的长期记忆性自2022年以来明显增强，强度优于集合竞价；越靠近盘口、委托数量越小的订单，其方向相似度越高。报告认为，这种长期记忆并非由价格趋势直接导致，而更可能来自委托行为的连续性。关于成因，报告讨论了羊群效应和算法拆单两类解释，并结合机构持仓、股东户数、因子跟踪和订单微观视角，倾向于认为长期记忆更像是某种或多种算法交易共同作用下形成的表象特征，而非散户在时间上的简单拥挤。策略开发部分，报告基于三类方法构造因子：一是用1至100阶自相关系数对滞后阶对数做回归，得到长期记忆强度LMS和高维记忆MEMO；二是用傅里叶变换等频谱方法从时域转向频域，构造分拆痕迹OST；三是统计同类订单连续重复次数，讨论“订单小岛”式的行为片段。机器学习部分比较了XGBoost、LightGBM和LSTM等特征合成方式，指出XGBoost样本内多头超额收益显著但样本外泛化较弱，样本外超额收益约8.6%、胜率由98%降至70%；LightGBM在分组单调性和样本外衰减上相对更稳；LSTM在损失函数中加入负IC绝对值惩罚后预测效果明显改善。报告边界在于所有模型和因子均基于历史数据测试，未来市场结构变化可能影响有效性。

背景: 报告属于开源证券市场微观结构研究系列，背景是利用逐笔委托等高频数据观察投资者交易行为。此前研究关注单笔成交金额、订单执行速度、撤单行为等微观变量，本篇转向订单方向序列的时间依赖，讨论挂单方向长期记忆在A股中的存在性、形成机制和Alpha应用。

逻辑: 核心逻辑是将逐笔委托方向转化为可度量的数值序列，通过自相关结构观察相邻及远距离订单方向是否持续相似。如果长期滞后下仍存在显著相关，说明订单流中包含持续性的交易行为痕迹；进一步按市场阶段、盘口距离、订单大小和股票属性分解，可判断这种痕迹更接近算法拆单等连续委托行为，而非单纯价格趋势或随机噪声。

方法: 报告将买入委托记为1、卖出委托记为-1，计算订单方向序列在不同滞后阶上的自相关系数，并用ACF、PACF和自相关系数对滞后阶对数的回归刻画长期记忆强度与衰减速度。因子构造包括长期记忆强度LMS、高维记忆MEMO、基于傅里叶变换的分拆痕迹OST，以及同类订单连续重复次数统计；特征合成部分测试了XGBoost、LightGBM和LSTM，并讨论惩罚项与共线性控制。

数据: 报告使用深市逐笔委托数据，并在示例中引用2024年3月15日的个股订单流观测；研究对象包括A股不同市值、换手率、价格水平、交易阶段、盘口距离和委托金额分组下的订单方向序列。

结果: 报告发现A股挂单方向长期记忆性普遍存在，连续竞价阶段自2022年以来增强，靠近盘口和小额委托的长期记忆更强。因子层面，LMS十分组不完全单调且ICIR偏低，偏度、峰度和MEMO等改进指标表现更优，OST在2022年以来增强但2024年初有较大回撤。机器学习中，XGBoost样本外泛化弱，LightGBM相对稳健，加入负IC绝对值惩罚的LSTM预测效果明显改善。

高频特征工程关注点: 文章的高频特征工程重点在于把逐笔委托方向从单点状态扩展为路径状态：订单方向自相关、不同滞后阶衰减、价优/价次委托差异、小额/大额委托差异、连续同向订单片段、频域强波占比和分拆痕迹，都属于从订单流连续性中提取行为特征的思路。

研究启发: 可结合我们的OB/SF/sidecar/MLP/LGB/Linear/LLM因子管线，把挂单方向长期记忆拆成默认关闭的高频衍生sidecar特征：例如按bid/ask方向、价格层距离、委托金额分桶、事件时间滞后阶计算自相关衰减、同向连续长度、频域分拆痕迹，再交给LLM生成候选因子或作为MLP/LGB输入。它尤其适合补充PriceLevelMemory、PathMemory和jump decay类因子的行为依据。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: data_processing_sidecar, hft_feature_engineering, llm_factor_pipeline。

可能增益: 可能为当前 PLM、jump decay、path memory 提供中文实证机制，帮助 LLM 生成更贴近订单行为而非普通 rolling 的候选因子。

### IDEA-2026-W26-39e21387 — 开源证券：市场微观结构观察与2023年以来的高频因子回顾

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://www.fxbaogao.com/detail/4984776
- 原题: KYSEC market microstructure observation and high-frequency factor review since 2023
- 研究轴: 因子生成 / 表示学习, 数据坐标 / 高频状态
- 管线落点: LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `611` 字

研究亮点:

- 从资金结构、盘口流动性和程序化交易三个层面解释放量行情中的微观结构变化
- 用早盘集中度、单笔委托金额、筹码充足率和高频撤单比例刻画投资者行为状态
- 系统回顾MEMO、SR、LOTTERY三个高频因子2023年以来的表现
- 明确提示历史回测因子在市场结构变化下可能继续衰减

文章摘要: 报告围绕2024年9月24日以后A股放量上涨背景下的市场微观结构变化展开分析，并回顾开源证券此前发布的若干高频因子在2023年以来的表现。报告认为，本轮行情受到被动投资、杠杆资金和量价齐升三类力量共同推动：ETF持仓占比上升为指数上涨提供流动性，融资融券余额快速增长并在2025年8月4日超过1.99万亿元，赚钱效应放大又提升了散户参与意愿，从而使市场参与者结构和量价规律发生变化。微观层面，报告选取四个观察视角：一是早盘9:30-10:00成交量占全天成交量的集中度，用来衡量交易急迫性和拥挤程度；二是平均单笔委托金额，用以间接观察机构、游资和散户参与比例的动态变化；三是订单簿筹码充足率，通过盘口厚度和冲击成本观察流动性供给；四是程序化交易比例，特别关注高频撤单比例在监管约束和放量环境下的变化。报告指出，2024年9月以来订单簿逐渐增厚，冲击成本下降，微盘股流动性供给相对充足；程序化交易在“新国九条”等政策后更为克制，但活跃行情仍给高频策略提供空间。因子回顾部分，报告用20日滚动均值并在全市场测试分组效果，跟踪高维记忆_MEMO、强反转_SR和彩票委托_LOTTERY三个高频因子。结果显示，三者2023年以来仍有多空收益，但有效性均有不同程度减弱，其中MEMO多空收益29.3%，SR多空收益19.7%，LOTTERY多空收益32.9%。报告最后提示，相关模型基于历史数据测试，未来市场环境变化可能影响有效性。

背景: 报告背景是2024年9月24日后A股在政策、ETF被动资金、两融杠杆资金和赚钱效应推动下出现放量行情，市场参与者结构、交易活跃度和微观交易特征都可能发生变化。

逻辑: 报告的核心逻辑是先用市场资金结构和量价状态解释A股行情变化，再从早盘集中度、委托金额、订单簿厚度、程序化交易比例四个微观指标观察投资者结构与流动性状态，最后检验既有高频因子在新市场阶段下的持续有效性。

方法: 报告通过统计早盘成交集中度、平均单笔委托金额、订单簿筹码充足率、冲击成本、高频撤单比例等指标刻画微观结构，并对既有高频因子取20日滚动均值，在全市场中检验分组效果和多空收益。

数据: 报告使用A股市场交易与微观结构数据，包括ETF持仓占比、融资融券余额、成交规模、早盘成交量占比、单笔委托金额、盘口订单簿厚度、冲击成本、高频撤单比例，以及2023年以来高频因子的跟踪表现。

结果: 2023年以来，高维记忆_MEMO因子多空收益29.3%，强反转_SR因子多空收益19.7%，彩票委托_LOTTERY因子多空收益32.9%；报告同时指出这些因子均有不同程度减弱。2024年9月以来订单簿逐渐增厚，冲击成本降低，融资融券余额截至2025年8月4日超过1.99万亿元。

高频特征工程关注点: 文章强调把高频状态拆成市场活跃度、早盘交易拥挤度、单笔委托金额、订单簿厚度、冲击成本、高频撤单比例、程序化交易占比等微观结构变量；因子层面涉及订单关联性、高维记忆、分钟单笔成交金额切割日内涨跌幅、彩票式挂单占比等特征。

研究启发: 可作为我们的 market-state/context sidecar 参考：将市场活跃度、订单簿厚度、冲击成本、撤单率、程序化交易比例等作为状态条件，而不是只依赖单股票 rolling 量价特征，用于识别放量、拥挤、流动性改善或高频策略容量变化等 regime shift。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline。

可能增益: 可能提升因子在不同市场阶段的稳定性，尤其是识别放量、拥挤、流动性改善或高频策略容量变化时的 regime shift。

### IDEA-2026-W26-874bfa0c — 国信金工：基于主动买卖特征的高频订单因子改进

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://finance.sina.com.cn/roll/2024-08-20/doc-inckfzcs5651129.shtml
- 原题: Guosen Securities high-frequency order factor improvement via active buy-sell features
- 研究轴: 高频特征工程, 数据坐标 / 高频状态, 因子生成 / 表示学习
- 管线落点: 高频数据特征工程, 数据 sidecar / 高频衍生数据, LLM 因子生成
- 角色: `高频数据特征工程候选`
- 原文证据: `已读网页`；摘要质量: `中`；摘要长度: `871` 字

研究亮点:

- 系统比较委托时间法和成交价格法的主动买卖方向识别缺陷
- 提出结合成交价格与委托时间的Price-Time Based方向修正方法
- 将主动方向与大单、漫长订单交叉，构造成交量占比统一框架
- 用迭代分裂法只保留有效拆分后的子因子，提升复合因子稳定性

文章摘要: 报告研究逐笔成交数据中的主动买卖方向如何提升高频订单因子的选股能力。文章从订单数据到行情数据的形成过程出发，指出逐笔成交记录保留了成交数量、价格、时间以及买卖双方委托订单信息，能够比分钟或日频行情更直接刻画交易者结构和交易意图。此前高频订单研究已经从订单大小、成交时长、成交时间、出价高低等维度提取Alpha信息，本文进一步关注每笔成交是由买方主动促成还是卖方主动促成，以及不同主动方向是否对未来收益有不同影响。报告首先梳理两类常见主动买卖划分方法：基于委托时间的方法将委托时间更晚的一方视为主动方，逻辑是后到订单主动消耗流动性；基于成交价格的方法根据当前成交价相对上一笔成交价的升降判断主买或主卖，能够较好处理涨跌停情形。文章指出两种方法各有缺陷：时间法在涨停大买单持续成交时可能把后续成交误判为主卖，价格法在同一笔委托订单多次成交且价格冲高回落时可能把同一订单划成相反方向。为此，报告提出结合成交价格和委托时间的Price-Time Based方法，先用成交价格进行初始方向判断，再记录首次出现时方向鲜明的主买委买单和主卖委卖单，并在重复出现订单与首次出现对手方成交时进行方向修正。随后，文章将主动买卖方向引入大单交易占比因子，把大单属性与主买/主卖属性交叉拆分，发现部分子因子方向和强度差异明显。改进大单因子自2017年以来月度RankIC均值为9.09%，年化RankICIR为4.27，月胜率89.01%，多头月均超额0.84%，空头月均超额-1.73%；正交检验显示其相对原始改进大单因子具有较强增量信息。进一步地，报告把订单大小、成交时长和主动买卖方向纳入成交量占比因子统一框架，形成32类成交类型，并提出“迭代分裂法”：只有当进一步拆分后有效性明显提升时才保留子因子，否则沿用父因子。最终精选复合因子在月频调仓下RankIC均值8.93%、年化RankICIR 5.21、月胜率93.41%，周频调仓下周度RankIC均值5.59%、年化RankICIR 6.85、周胜率83.72%，并在宽基指数和多类风格股票池中表现稳定。

背景: 文章背景是量价研究的数据频率不断提升，逐笔成交数据能够记录每笔成交的数量、价格、时间及买卖双方订单信息，因此可以从订单大小、成交时长、成交时间、成交价格和主动买卖方向等维度更细致地刻画交易者行为。

逻辑: 文章的核心逻辑是：主动成交方向包含交易者主动消耗流动性的意图信息；单纯用订单大小或成交时长构造因子会混合不同方向的交易影响；将主买、主卖与大单、漫长订单等属性交叉拆分，可以分离出方向更清晰、预测能力更稳定的成交类型。

方法: 报告比较Time Based和Price Based主动买卖划分法，并提出Price-Time Based方法：先按成交价格变化给出初始方向，再根据订单首次出现时的方向识别主买委买单和主卖委卖单，对重复出现订单进行修正。因子构建上，将同类型成交记录成交量加总并除以全天成交量，取过去20天平均值；再用迭代分裂法筛选有效子因子构建复合因子。

数据: 报告使用A股逐笔成交数据，样例包括贵州茅台、中际旭创、工业富联等股票的逐笔交易记录。回测区间主要为2016年12月30日至2024年7月31日，并在全市场、沪深300、中证500、中证1000、国证2000以及小市值、公募基金重仓、高股息、高ROE等股票池中测试。

结果: 引入主动买卖特征的改进大单因子月度RankIC均值9.09%，年化RankICIR 4.27，月胜率89.01%，多头月均超额0.84%，空头月均超额-1.73%；多头年化超额收益9.23%，空头年化超额收益-20.73%。精选复合因子月频调仓RankIC均值8.93%，年化RankICIR 5.21，月胜率93.41%；周频调仓周度RankIC均值5.59%，年化RankICIR 6.85，周胜率83.72%。纯净因子在剥离常见因子和行业后RankIC均值3.90%，年化RankICIR 4.66，月胜率90.11%。

高频特征工程关注点: 文章的特征工程重点是将逐笔成交拆成订单大小、成交时长、主动买卖方向三类属性，并用成交量占比表达不同成交类型的强弱；主动买卖方向识别同时考虑成交价格变化、委托时间、订单首次出现方向和重复订单连续性，避免涨跌停和价格回落场景下的方向误判。

研究启发: 适合给我们的成交流增加主动方向、主动强度和方向可靠度字段，并对Time Based、Price Based、Price-Time Based等识别方法建立一致性 gate；在OB/SF/sidecar/MLP/LGB/Linear/LLM因子管线中，可把trade flow从简单量价序列拆成主动/被动、方向/强度、方法置信度三层特征。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: hft_feature_engineering, data_processing_sidecar, llm_factor_pipeline。

可能增益: 潜在增益在于把 trade flow 从简单量价序列拆成主动/被动、方向/强度、方法置信度三层，提高短 horizon 预测解释性。

## 高频订单流与微观结构

### IDEA-2026-W26-f639fe4e — RAVEN：用于金融时间序列预测的状态感知可变上下文专家网络

- 优先级: `medium`
- 状态: `candidate`
- 来源: arXiv HFT Time-Series Forecasting
- 链接: http://arxiv.org/abs/2606.24062v1
- 原题: RAVEN: A Regime-Aware Variable-context Expert Network for Financial Time Series Forecasting
- 研究轴: 因子生成 / 表示学习, 模型训练 / 序列预测, 数据坐标 / 高频状态
- 管线落点: MLP 时序预测
- 角色: `数据坐标 / sidecar 候选`
- 原文证据: `已读 PDF`；摘要质量: `高`；摘要长度: `924` 字

研究亮点:

- 明确指出固定上下文窗口与非平稳金融收益过程存在结构性错配。
- 用 CIT 机制从数据中学习样本级有效回看长度。
- 同时引入局部尺度专家、全局压缩表示和去相关加权聚合。
- 在股票收益、基金销量和交通流预测任务上都报告了较强实验结果。

文章摘要: 这篇文章提出 RAVEN，即 Regime-Aware Variable-context Expert Network，用于解决金融时间序列预测中固定历史窗口与非平稳市场状态不匹配的问题。作者认为，金融收益序列不同于交通、电力、天气等常规时间序列基准：对数收益虽然比价格水平更适合建模，但仍具有低信噪比、厚尾、非平稳和状态依赖的时间结构。传统树模型可处理手工特征的非线性关系，却把每次预测视为静态表格问题；RNN、LSTM、GRU 等模型恢复了时间记忆，但容易偏向近期观测；Transformer 系列模型能捕捉长距离依赖，却通常依赖固定长度上下文。固定窗口在金融场景中存在结构性矛盾：窗口过短会错过跨越状态切换的长期记忆，窗口过长又会把上一状态的陈旧信息混入当前预测，变成噪声。RAVEN 的核心思路是让模型为每个样本自适应决定有效回看长度。它先将历史序列切成 patch，按逆时间顺序学习每个 patch 的重要性分数，再通过 Cumulative Importance Thresholding 形成一组嵌套的连续前缀窗口；这些不同长度窗口分别送入对应时间尺度的专家网络，形成 mixture-of-experts 结构。为避免局部专家只看到片段而丢失全局一致性，模型并行加入 Global Compressed Representation 分支，在完整上下文上提取压缩的全局表示。由于嵌套窗口之间天然高度重叠，文章进一步提出 Correlation-Aware Weighting，对不同专家输出做形状对齐，并在聚合前惩罚成对余弦相似度，以减少冗余噪声。实验覆盖 HS300 与 S&P500 累积对数收益预测、基金销量预测，以及四个 PEMS 交通流基准。结果显示，RAVEN 在金融任务上达到 SOTA，HS300 上 Pearson correlation 提升 9.2%，S&P500 上提升 20.2%，基金销量预测 MSE 降低 18.2%；在 PEMS 交通任务中也在 16 个指标中的 14 个取得最佳结果。文章的边界在于其证据主要来自给定金融与交通数据集，摘要未展开具体交易可部署性、成本约束或更细粒度市场微观结构变量。

背景: 金融时间序列通常非平稳、低信噪比、厚尾，并且时间依赖随市场状态变化。固定长度上下文难以同时处理短期噪声、长期状态记忆和状态切换，因而成为深度时间序列模型在金融预测中的结构性限制。

逻辑: 文章认为最优回看窗口应随样本和市场状态变化，而不是由研究者预先固定。RAVEN 通过学习历史 patch 的重要性，动态构造多尺度嵌套窗口，再由不同专家处理不同上下文长度，并用全局分支和去相关聚合保证整体一致性与低冗余。

方法: RAVEN 采用 mixture-of-experts 框架。模型先对历史 patch 学习重要性分数，使用 Cumulative Importance Thresholding 生成嵌套连续窗口；每个窗口路由到尺度专属专家；Global Compressed Representation 分支在完整上下文上并行运行；Correlation-Aware Weighting 对可变长度专家输出进行对齐，并通过余弦相似度惩罚降低重叠专家表示的冗余。

数据: 实验包括 HS300 与 S&P500 的累积对数收益预测、基金销量预测，以及四个 PEMS 交通流预测基准。文中示例还展示了 HS300 成分股 600176.SS 日度对数收益与 PEMS03 五分钟交通流的连续小波变换 scalogram，用于说明金融序列能量分布不稳定、交通序列周期性更强。

结果: RAVEN 在金融预测任务上达到 SOTA：HS300 累积对数收益预测 Pearson correlation 提升 9.2%，S&P500 提升 20.2%，基金销量预测 MSE 降低 18.2%。在四个 PEMS 交通基准上，RAVEN 在 16 个指标中的 14 个取得最佳结果。

高频特征工程关注点: 文章没有直接讨论订单簿、主动买卖、微价格或队列状态等高频微观结构特征；与高频特征工程较相关的是其“样本级可变上下文长度”和“多尺度嵌套窗口”思想，可用于描述非平稳序列中不同历史片段的重要性差异。

研究启发: 对 OB/SF/sidecar/MLP/LGB/Linear/LLM 因子管线的启发主要在建模坐标而非具体变量：可把固定回看窗口替换为样本级动态窗口选择，把短中长不同事件时间或盘口状态窗口交给不同专家，并在聚合前显式降低重叠窗口表示的冗余；但文章本身没有验证订单簿或横截面因子场景。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: mlp_codeX。

可能增益: 潜在增益在于提供 baseline 186 因子没有表达的状态变量，帮助筛出在特定微观结构状态下更可靠的短周期预测信号。

## 本周高分来源

- `34` [中信建投：市场微观结构系列研究，从分钟频到 Level2 的探索与发现](https://view.inews.qq.com/a/20251217A01V3A00) — 中文券商高频与市场微观结构精选; 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态; LLM 因子生成, 高频数据特征工程
- `32` [TLOB：基于限价订单簿数据的双注意力 Transformer 股价趋势预测模型](https://arxiv.org/abs/2502.15757) — 模型与金融时序预测精选; 模型训练 / 序列预测, 数据坐标 / 高频状态, 评估审计 / 可比性; MLP 时序预测, LLM 因子生成
- `29` [国信证券：高频订单成交数据蕴含的 Alpha 信息](https://www.fxbaogao.com/detail/4095774) — 中文券商高频与市场微观结构精选; 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态; 高频数据特征工程, LLM 因子生成, 数据 sidecar / 高频衍生数据
- `29` [Deep Limit Order Book Forecasting：深度限价订单簿预测与 LOBFrame 基准](https://arxiv.org/abs/2403.09267) — 模型与金融时序预测精选; 数据坐标 / 高频状态, 模型训练 / 序列预测, 因子生成 / 表示学习; LLM 因子生成
- `29` [挂单方向长期记忆性的讨论与应用](https://www.fxbaogao.com/detail/4339762) — 中文券商高频与市场微观结构精选; 数据坐标 / 高频状态, 高频特征工程; 数据 sidecar / 高频衍生数据, 高频数据特征工程, LLM 因子生成
- `29` [LiT：限价订单簿Transformer](https://www.frontiersin.org/journals/artificial-intelligence/articles/10.3389/frai.2025.1616485/full) — 模型与金融时序预测精选; 数据坐标 / 高频状态, 模型训练 / 序列预测; LLM 因子生成, MLP 时序预测
- `28` [开源证券：市场微观结构观察与2023年以来的高频因子回顾](https://www.fxbaogao.com/detail/4984776) — 中文券商高频与市场微观结构精选; 因子生成 / 表示学习, 数据坐标 / 高频状态; LLM 因子生成
- `27` [国信金工：基于主动买卖特征的高频订单因子改进](https://finance.sina.com.cn/roll/2024-08-20/doc-inckfzcs5651129.shtml) — 中文券商高频与市场微观结构精选; 高频特征工程, 数据坐标 / 高频状态, 因子生成 / 表示学习; 高频数据特征工程, 数据 sidecar / 高频衍生数据, LLM 因子生成
- `27` [基于注意力机制的限价订单簿阅读、突出与全簿预测](https://arxiv.org/abs/2409.02277) — 模型与金融时序预测精选; 模型训练 / 序列预测, 数据坐标 / 高频状态; MLP 时序预测, LLM 因子生成
- `23` [双分支自监督学习检测市场操纵：融合频域异常合成与领域特征](https://doi.org/10.1016/j.ipm.2026.104961) — OpenAlex 语义论文检索; 评估审计 / 可比性, 模型训练 / 序列预测, 数据坐标 / 高频状态; 回测与可比性审计, Linear/Ridge baseline, LLM 因子生成
- `21` [Chain-of-Alpha：基于 LLM 的自动公式化 Alpha 挖掘框架](https://www.researchgate.net/publication/394426875_Chain-of-Alpha_Unleashing_the_Power_of_Large_Language_Models_for_Alpha_Mining_in_Quantitative_Trading) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习, 评估审计 / 可比性; LLM 因子生成, 回测与可比性审计
- `20` [LLM 驱动的自动稳健特征工程](https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5124841) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习, 高频特征工程; LLM 因子生成, 高频数据特征工程
- `20` [FactorMAD：基于 LLM 多智能体辩论的可解释 Alpha 因子挖掘](https://dl.acm.org/doi/10.1145/3768292.3770377) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习; LLM 因子生成
- `19` [AlphaAgent：带正则化探索的 LLM Alpha 挖掘以对抗 Alpha 衰减](https://arxiv.org/abs/2502.16789) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习; LLM 因子生成
- `19` [面向稀疏投资组合优化的 LLM 进化式 Alpha 因子发现](https://openreview.net/forum?id=Zs3ZXwfaIu) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习; LLM 因子生成
- `17` [量化投资中的 LLM 自动策略发现](https://aclanthology.org/2025.findings-emnlp.1005/) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习, 评估审计 / 可比性; LLM 因子生成
- `10` [SkyJEPA：用于四旋翼零样本仿真到现实控制的长视野世界模型学习](http://arxiv.org/abs/2606.23444v2) — arXiv 高频时序预测; 模型训练 / 序列预测; 
- ` 9` [LENS：用于探索金融时序规律的大规模预训练 Transformer](https://arxiv.org/abs/2408.10111) — 模型与金融时序预测精选; 模型训练 / 序列预测; MLP 时序预测
- ` 9` [LSTM、GRU 与 Transformer 在股票价格趋势预测中的比较分析](https://arxiv.org/abs/2411.05790) — 模型与金融时序预测精选; 模型训练 / 序列预测; MLP 时序预测
- ` 9` [金融科技系统中的自适应风险评估：基于强化学习的连续策略优化](https://doi.org/10.62762/jse.2026.605759) — OpenAlex 语义论文检索; 因子生成 / 表示学习, 模型训练 / 序列预测; LGB 融合与筛选, MLP 时序预测

## 人工 Review Checklist

- 是否明确 `t` 时刻可见信息和预测 horizon？
- 是否只是已有 OB/SF/PLM/CS 的 rolling-window 变体，还是新增了观察坐标？
- 是否能沉淀为高频数据特征工程模板，例如订单不平衡、主动买卖、价格层记忆、事件时间或盘口形态？
- 应作为 predictor、gate/context、normalizer 还是 evaluation audit？
- 是否存在版权、付费源或全文再分发风险？