# 高频时序预测研究 Idea 周报 2026-W25

- 周期: `2026-06-15` 至 `2026-06-21`
- 生成时间: `2026-06-16T04:22:18+00:00`
- source registry version: `2026-06-16.v4`
- 来源条目: `65`
- 候选想法: `26`

## 本周结论

本周候选只代表研究启发，不代表可直接上线。每篇文章由 LLM 或人工 notes 尽量总结背景、逻辑、方法、数据、结果和启发；没有依据的字段留空，不再硬写固定模板。本轮特别关注高频数据特征工程，优先识别能转化为订单流、盘口形态、价格层记忆、事件时间、主动买卖和 sidecar 字段的想法。

## 本周汇总导航

本周共 `26` 条候选 idea，分布在 `8` 个板块。

- **AI 辅助因子生成**：8 条
  - Chain-of-Alpha：基于 LLM 的公式化 Alpha 自动挖掘框架：把 LLM 因子生成做成闭环流程
  - FactorMAD：基于 LLM 多智能体辩论的可解释 Alpha 因子挖掘：用多智能体辩论提升 Alpha 候选审查质量
  - LLM 驱动的稳健自动特征工程：从单因子生成扩展到候选特征池维护
- **加密市场与跨资产信息**：1 条
  - 阳光下还是阴影中交易：Hyperliquid 上的市场冲击与逆向选择：利用 Hyperliquid 可见 TWAP 检验 sunshine trading
- **时序模型训练与融合**：1 条
  - 面向时间序列的生成式预测分布建模：从点预测扩展到完整预测分布
- **时序预测模型与 LOB**：5 条
  - TLOB / MLPLOB：基于 LOB 数据的 MLP 与双注意力 Transformer 趋势预测：把 MLP 作为强基线而非只追求 Transformer
  - LiT：用结构化 patch 捕捉 LOB 空间与时间依赖的 Transformer：用结构化 patch 保留 LOB 层级信息
  - Deep Limit Order Book Forecasting：深度限价订单簿预测与 LOBFrame 基准：强调预测指标不等于可交易信号
- **订单簿表示与逐笔数据**：1 条
  - 基于注意力的限价订单簿阅读、突出与预测：预测对象从中间价扩展到整本订单簿
- **评估审计与风险控制**：2 条
  - 双分支自监督学习识别市场操纵：融合频域异常合成与领域特征：面向操纵检测的自监督框架
  - 金融科技系统中的自适应风险评估：基于强化学习的连续策略优化：面向实时风险评分和概念漂移
- **金融时序预测模型**：2 条
  - 宏观感知时序预测：层次化混频注意力模型：用层次化混频注意力融合宏观与市场序列
  - 基于 Shifted Data Augmentation 的稳健 Transformer 单步股票指数预测：把稳健性提升重点放在数据增强和学习率调度，而非增加模型复杂度
- **高频数据特征工程**：6 条
  - 中信建投：从分钟频到 Level2 的市场微观结构研究：从分钟频扩展到 Level2 微观结构视角
  - 国信证券：高频订单成交数据中的 Alpha 信息：从逐笔成交行为中挖掘 Alpha
  - 开源证券订单流系列：挂单方向长期记忆性的讨论与应用：将订单流建模从快照扩展到历史记忆

### 重点亮点

- **高频数据特征工程** / 中信建投：从分钟频到 Level2 的市场微观结构研究：从分钟频扩展到 Level2 微观结构视角
- **时序预测模型与 LOB** / TLOB / MLPLOB：基于 LOB 数据的 MLP 与双注意力 Transformer 趋势预测：把 MLP 作为强基线而非只追求 Transformer
- **高频数据特征工程** / 国信证券：高频订单成交数据中的 Alpha 信息：从逐笔成交行为中挖掘 Alpha
- **时序预测模型与 LOB** / LiT：用结构化 patch 捕捉 LOB 空间与时间依赖的 Transformer：用结构化 patch 保留 LOB 层级信息
- **高频数据特征工程** / 开源证券订单流系列：挂单方向长期记忆性的讨论与应用：将订单流建模从快照扩展到历史记忆

## 按类别整理的候选想法

## AI 辅助因子生成

### IDEA-2026-W25-a27f038b — Chain-of-Alpha：基于 LLM 的公式化 Alpha 自动挖掘框架

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://www.researchgate.net/publication/394426875_Chain-of-Alpha_Unleashing_the_Power_of_Large_Language_Models_for_Alpha_Mining_in_Quantitative_Trading
- 原题: Chain-of-Alpha: LLM-based framework for automated formulaic alpha mining
- 研究轴: 因子生成 / 表示学习, 评估审计 / 可比性
- 管线落点: LLM 因子生成, 回测与可比性审计
- 角色: `评估审计 / 可比性候选`

研究亮点:

- 把 LLM 因子生成做成闭环流程
- 强调回测反馈和先验知识共同约束候选 Alpha
- 适合用于周报 idea 到实验管线的转化
- 输入未提供具体实证结果，需单独审计有效性

机制摘要: 这项研究关注如何把 LLM 生成公式化 Alpha 的过程做成闭环，而不是停留在一次性候选因子生成。输入信息显示，其核心是“因子生成链”和“因子优化链”：先利用先验知识生成候选公式，再通过回测反馈迭代改进 Alpha 表达。对量化研究周报而言，最值得看的地方不是某个单一模型或单一因子，而是它把外部 idea、候选表达、回测评估和后续优化串成连续研究流程。适用边界也比较清晰：该思路依赖回测反馈和先验知识质量，适合用于公式化因子生成与研究流程编排；输入材料没有提供具体数据集、收益结果或实验细节，因此不能推断其实证有效性。

背景: 传统 AI 辅助因子生成容易停留在单轮 prompt 产出候选表达，缺少从回测失败、先验知识和经验库中持续学习的机制。

逻辑: 通过把候选因子生成、回测反馈和因子优化连接成链式流程，LLM 可以在已有研究经验和评估结果约束下迭代改进公式化 Alpha。

方法: 输入材料提到因子生成链和因子优化链，并使用回测反馈与先验知识迭代改进公式化 Alpha。

高频特征工程关注点: 对高频特征工程的启发在于，可以把订单不平衡、主动买卖、微价格、价格层记忆、队列状态、成交时长、事件时间等候选表达纳入同一生成-评估-优化链，而不是零散尝试单个特征。

研究启发: 可映射到我们的 idea -> LLM prompt -> factor card -> L0-L4 -> SFT/BT -> 经验库闭环。周报中的外部研究不只作为归档，而是转化为下一轮 LLM 因子生成的结构化约束：哪些字段允许使用，哪些机制值得变异，哪些表达在 SFT/BT 中失败，哪些候选需要进入 OB/SF/sidecar/MLP/LGB/Linear 的不同评估路线。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: llm_factor_pipeline, backtest_audit。

可能增益: 可能提升周报 idea 与实际因子实验之间的转化率，让外部研究不只是归档，而能形成下一轮 prompt 的结构化约束。

### IDEA-2026-W25-bfce6abb — FactorMAD：基于 LLM 多智能体辩论的可解释 Alpha 因子挖掘

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://dl.acm.org/doi/10.1145/3768292.3770377
- 原题: FactorMAD: A Multi-Agent Debate Framework Based on Large Language Models for Interpretable Alpha Factor Mining
- 研究轴: 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`

研究亮点:

- 用多智能体辩论提升 Alpha 候选审查质量
- 强调可解释性和机制讨论
- 适合接入 LLM 因子生成后的 reviewer 阶段
- 输入没有实证结果，重点应看流程启发

机制摘要: FactorMAD 关注用 LLM 多智能体辩论框架进行 Alpha 因子挖掘，输入信息特别强调可解释性和候选因子的机制讨论。其核心价值在于把因子生成从单个模型直接产出表达，改造成多个角色围绕机制、风险、可执行性和解释性进行审查的流程。对研究周报而言，这篇更像是流程设计启发：候选因子不仅要能运行，还要能说明为什么可能有效、是否使用了不合规字段、是否存在泄露或不可交易问题。输入没有给出具体实验结果和数据细节，因此应重点吸收其多智能体审查思想，而不是推断其性能。

背景: LLM 生成的 Alpha 候选常见问题包括机制含糊、表达复杂但不可解释、字段使用不合规或交易含义不足。

逻辑: 通过多智能体辩论，让不同角色分别审视候选因子的机制、可解释性和潜在问题，可以提升 Alpha 挖掘过程中的研究质量控制。

方法: 研究把多智能体辩论用于 Alpha 因子挖掘，重点是可解释性和候选因子的机制讨论。

高频特征工程关注点: 对高频特征工程的启发是，可以让不同 reviewer 分别检查订单不平衡、微价格、队列状态、事件时间、成交时长等特征是否有清晰市场微观结构含义，而不是只看表达复杂度。

研究启发: 可在我们的 LLM 因子 pipeline 中增加 debate/reviewer 阶段：一个 agent 提机制假设，一个 agent 查泄露和未来函数，一个 agent 查字段合同和 sidecar 可用性，一个 agent 查经济含义和可交易性。对于 OB/SF/sidecar 因子，这能帮助过滤看似复杂但实际不可解释或不可执行的表达。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 可能提升候选因子机制质量，减少看似复杂但实际不可解释或不可交易的表达式。

### IDEA-2026-W25-e82cae75 — LLM 驱动的稳健自动特征工程

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5124841
- 原题: LLM-Driven Automated Robust Feature Engineering
- 研究轴: 因子生成 / 表示学习, 高频特征工程
- 管线落点: LLM 因子生成, 高频数据特征工程
- 角色: `高频数据特征工程候选`

研究亮点:

- 从单因子生成扩展到候选特征池维护
- LLM 与进化优化结合用于稳健特征发现
- 适合服务 LGB、Linear、MLP 的高频特征工程
- 输入未提供实验结果，不能判断实际收益

机制摘要: 这项研究关注用 LLM 结合进化优化进行自动特征工程，目标是发现更稳健、可解释的特征。输入信息显示，它的重点从“让 LLM 写一个因子”转向“让 LLM 参与维护候选特征池”，并通过进化优化推动特征表达的搜索和改进。对高频时序预测而言，这类方法的价值在于把人工构造特征的经验转化为可迭代的候选生成机制，尤其适合服务 LGB、Linear、MLP 等模型侧的特征工程。边界是：输入没有给出具体模型结构、进化算子、数据集或实验结果，因此只能把它作为稳健特征发现流程的启发，不能直接判断收益提升。

背景: 高频预测中的有效特征往往需要大量人工经验筛选，且候选表达容易重复、过拟合或缺乏解释。

逻辑: LLM 负责生成或改写可解释候选特征，进化优化负责在候选空间中迭代搜索，从而把手工特征工程扩展为自动化、可反馈的发现流程。

方法: 研究把 LLM 与进化优化结合，用于自动发现稳健、可解释的特征。

高频特征工程关注点: 可直接启发高频特征池建设：让 LLM 生成订单不平衡、主动买卖压力、微价格偏离、盘口层级形态、队列状态、成交时长和事件时间类候选，再通过静态分析、相关性去重、稳定性 proxy 和模型侧验证筛掉低质量表达。

研究启发: 适合接入我们的 LGB/Linear/MLP 特征工程侧。LLM 生成的候选表达先经过 static analyzer、字段合同检查、相关性去重和稳定性 proxy，再决定进入 SFT/BT 或传统模型训练。它也可以沉淀失败经验库，减少 invented field、重复 rolling-window 表达和不可解释组合。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: llm_factor_pipeline, hft_feature_engineering。

可能增益: 潜在增益是把 AI 从“写单个因子”升级为“维护候选特征池和失败经验库”。

### IDEA-2026-W25-31e382a1 — AlphaAgent：带正则化探索的 LLM Alpha 挖掘

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://arxiv.org/abs/2502.16789
- 原题: AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration
- 研究轴: 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`

研究亮点:

- 强调正则化探索而不是无约束生成
- 把历史经验和反馈纳入 LLM Alpha 挖掘
- 有助于减少重复因子和不可用表达
- 输入未提供具体实验结论

机制摘要: AlphaAgent 关注用 LLM 进行 Alpha 挖掘，并强调正则化探索、历史经验和反馈机制。输入信息显示，它试图解决 LLM 因子生成中的一个关键问题：如果没有约束，模型容易产出大量冗余、重复或不可用的候选因子。其研究亮点在于把探索过程纳入历史经验和反馈约束，使 LLM 不只是随机扩展表达空间，而是更有纪律地寻找新候选。对我们的高频因子管线而言，它尤其适合用于减少重复 rolling-window 因子、降低 invented field 风险，并把 L0-L4、SFT、BT 的失败原因反哺到下一轮 prompt。输入没有具体实验结果，因此不能判断其实际 Alpha 表现。

背景: LLM Alpha 挖掘面临候选表达冗余、不可执行、字段幻觉和重复探索的问题。

逻辑: 通过正则化探索、历史经验和反馈机制约束 LLM 的候选生成方向，可以减少无效搜索并提高有效探索率。

方法: 研究把 LLM 用于 Alpha 挖掘，并强调正则化探索、历史经验和反馈机制。

高频特征工程关注点: 对高频特征工程的启发是，不应让 LLM 反复生成相似的 rolling-window 盘口特征，而应对订单不平衡、主动买卖、微价格、价格层记忆、队列状态、事件时间等特征族设置探索约束和失败记忆。

研究启发: 与我们的 llm_factor_pipeline 高度契合。可以把 L0-L4 检查、SFT 表现、BT 失败原因、字段合同错误、sidecar 缺失、机制弱解释等信息写回经验库，作为下一轮 LLM prompt 的负样本和约束条件。这样 LLM 因子生成会更少重复旧模式，更聚焦尚未充分探索的 OB/SF/sidecar 特征空间。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 潜在增益是减少重复 rolling-window 因子、降低 invented field 风险，提高 LLM 因子生成的有效探索率。

### IDEA-2026-W25-7c9e1e60 — 面向稀疏组合优化的进化式 LLM Alpha 因子发现

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://openreview.net/forum?id=Zs3ZXwfaIu
- 原题: Evolutionary Alpha Factor Discovery with Large Language Models for Sparse Portfolio Optimization
- 研究轴: 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`

研究亮点:

- 把 LLM 因子发现与组合选择反馈连接
- 强调进化式迭代优化因子池
- 适合构建带记忆的持续研究系统
- 输入没有具体组合优化结果

机制摘要: 这项研究关注用 LLM 自动生成并迭代优化 Alpha 因子，并把因子信号与投资组合选择反馈结合起来。输入信息显示，它的重点是进化式因子发现和反馈循环：不是只评估单个因子的统计表现，而是把因子池如何服务组合选择也纳入优化方向。对研究管线的启发在于，LLM 因子生成可以从一次性 prompt 发展为带记忆、带变异和带淘汰机制的持续系统。适用边界是：输入没有提供稀疏组合优化的具体算法、数据集、回测结果或组合约束，因此不能推断其投资表现，只能总结其流程思想。

背景: 单个 Alpha 候选的好坏不一定等同于组合层面的贡献，因子发现需要考虑因子池与组合选择反馈。

逻辑: 将 LLM 生成的因子信号与投资组合选择反馈结合，可形成进化式优化流程：保留有价值机制，变异候选表达，淘汰低质量模式。

方法: 研究用 LLM 自动生成并迭代优化 Alpha 因子，把因子信号和投资组合选择反馈结合起来。

高频特征工程关注点: 对高频特征工程的启发是，可以不只按单特征 IC 或局部回测筛选，而是观察订单不平衡、微价格、成交节奏、队列状态、盘口形态等特征族在组合或模型特征池中的边际贡献。

研究启发: 可把我们的 discovery -> SFT -> BT 结果转化为进化反馈：保留机制描述，变异表达形式，约束可用字段，淘汰低质量模式。对于 OB/SF/sidecar/MLP/LGB/Linear 管线，可以把单因子表现、模型侧贡献和组合层反馈分开记录，形成持续更新的候选池和失败经验库。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 可能让 LLM 因子生成从一次性 prompt 变成带记忆的持续研究系统。

### IDEA-2026-W25-9dfdbf58 — LLM 自动策略发现：风险感知多智能体生成可执行 Alpha 因子

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated AI Factor Generation and Backtest Method Research
- 链接: https://aclanthology.org/2025.findings-emnlp.1005/
- 原题: Automate Strategy Finding with LLM in Quant Investment
- 研究轴: 因子生成 / 表示学习, 评估审计 / 可比性
- 管线落点: LLM 因子生成
- 角色: `因子生成 / prompt 候选`

研究亮点:

- 多阶段、多智能体自动策略发现框架
- 强调可执行 Alpha、风险感知和评估反馈
- 适合提升因子代码可执行率和流程可追溯性
- 输入未提供实证收益或稳定性结果

机制摘要: 这项研究提出多阶段、多智能体框架，用 LLM 生成可执行 Alpha 候选，并加入风险感知与评估反馈。输入信息显示，它关注的不只是候选因子的生成，还包括执行性、风险意识和评估反馈，因此更接近完整的策略发现流程。对高频时序预测研究而言，其价值在于把生成、批评、静态分析、回测代理和人工 review 分工明确化，使 LLM 产出的候选更容易进入真实研究管线。边界是：输入未提供具体 agent 角色定义、风险度量、数据集或实验结果，因此不能推断其收益或稳定性。

背景: 自动策略发现需要同时考虑候选生成、可执行性、风险约束和评估反馈，单轮 LLM 生成难以覆盖完整研究流程。

逻辑: 通过多阶段、多智能体框架，将生成、风险感知和评估反馈拆分为不同环节，可以提高 Alpha 候选进入实盘研究流程前的可追溯性和质量控制。

方法: 研究提出多阶段、多智能体框架，用 LLM 生成可执行 Alpha 候选，并加入风险感知与评估反馈。

高频特征工程关注点: 对高频特征工程的启发是，可以把盘口特征生成、字段合法性检查、泄露检查、风险暴露检查和回测代理拆开处理，避免订单不平衡、主动买卖、微价格、队列状态等特征只凭直觉进入模型。

研究启发: 可映射到我们的多 agent 因子发现流程：generator 负责提出 OB/SF/sidecar 候选，critic 检查机制和可交易性，static analyzer 检查字段与表达，backtest proxy 负责早期筛选，human review 决定是否进入 SFT/BT。对 MLP/LGB/Linear 管线，也可以把风险感知和评估反馈前置，减少不可执行因子和不可追溯实验。

管线落点: 可作为 LLM prompt、taxonomy 或人工研究背景；候选 routes: llm_factor_pipeline。

可能增益: 潜在增益是提高因子代码可执行率和研究流程可追溯性，减少人工从零构思的成本。

### IDEA-2026-W25-3885b664 — 人机混合金融：从 AI 工具到决策系统

- 优先级: `medium`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://doi.org/10.1186/s40854-026-00941-w
- 原题: Human–AI hybrid finance: from AI tools to decision systems
- 研究轴: 数据坐标 / 高频状态, 评估审计 / 可比性, 因子生成 / 表示学习
- 管线落点: 人工复核
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 将金融 AI 从工具视角提升到决策系统视角
- 强调人机互补依赖任务、反馈、激励和治理条件
- 提出 delegation frontier、reliance wedge 等综合框架
- 提醒 AI 决策会反向改变未来市场数据

机制摘要: 这是一篇关于 AI 在金融中角色转变的综合性概念综述。文章认为，金融 AI 的核心问题正在从单纯的模型性能，转向金融决策架构：在人机共同参与的信息获取、预测、推荐、审批、执行、监控和学习流程中，如何分配权限、监督和责任。研究强调，人机互补不是自动成立的，而取决于任务结构、私有信息、反馈质量、激励机制、解释设计和治理安排。文章还指出，AI 介入金融决策会产生反身性影响，即它不仅使用市场数据，也会改变组织流程、价格、流动性、信用分配以及未来训练数据。

背景: 现有金融 AI 综述通常按方法、数据类型或应用领域分类，但这些视角容易低估 AI 从预测工具转向人机混合金融决策系统组件的深层变化。

逻辑: 文章的核心逻辑是，金融 AI 的研究对象不应只看模型是否预测得准，而应看人、模型、流程、监督、责任和反馈如何共同构成一个可运行的决策系统。

方法: 综述整合金融、管理学、人机交互和 AI 文献，并提出由 delegation frontier、reliance wedge、decision-useful XAI、meaningful oversight、reflexive AI loop 五个构念组成的决策系统框架。

数据: 基于跨金融、管理、人机交互和 AI 领域的既有文献。

研究启发: 对我们的 LLM 因子管线和人工复核流程有直接启发：LLM 不应只被看作生成因子的工具，而应纳入一个带权限边界、解释要求、人工监督和反馈审计的决策系统。对于 OB/SF/sidecar 因子发现，可以把模型建议、人工筛选、SFT、回测、上线监控拆成可审计节点，明确哪些环节允许自动化，哪些环节必须保留人工判断与归因检查。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: manual_review。

可能增益: 潜在增益是减少人工遗漏、提高失败经验复用率，并让每周外部研究稳定转化为可验证候选。

### IDEA-2026-W25-572e9fa1 — 从知道到做到：面向股票市场 LLM 交易智能体的记忆控制基准

- 优先级: `medium`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://openalex.org/W7162818638
- 原题: From Knowing to Doing: A Memory-Controlled Benchmark for LLM Trading Agents on Stock Markets
- 研究轴: 因子生成 / 表示学习, 评估审计 / 可比性
- 管线落点: LLM 因子生成, 回测与可比性审计
- 角色: `评估审计 / 可比性候选`

研究亮点:

- 直指 LLM 金融回测中的记忆泄漏问题
- 用 masking 区分历史记忆和投资推理
- 用 Barra 风格归因拆解收益来源
- 发现收益多由市场和风格暴露解释

机制摘要: KTD-Fin 针对 LLM 交易智能体评估中的两个核心问题：一是长回测可能与前沿 LLM 的知识截止时间重叠，使模型利用记忆中的股票、日期、价格或市场叙事，而不是真正进行投资推理；二是组合原始收益是有噪声的能力指标，正收益可能来自市场 beta、风格暴露或有利市场环境，而不是选股 alpha。该基准通过数据侧 masking 协议匿名化关键标识和日历信息，并引入 Barra 风格绩效归因，把收益拆解为市场、风格和选股 alpha 成分。

背景: 越来越多研究用端到端历史市场交易来评估 LLM agent 是否能赚钱，但这种设置容易受到历史记忆泄漏和收益来源不可解释的影响。

逻辑: 如果不控制模型记忆和收益归因，LLM agent 的回测收益无法证明其具备可迁移的投资能力；需要同时评估是否赚钱以及收益来自哪里。

方法: 提出 KTD-Fin 基准，使用数据侧 masking 协议在 prompts 和工具中一致匿名化关键标识与日历信息，并结合 Barra 风格绩效归因框架分解组合收益。

数据: 在中国 CSI300、2024--2026 窗口上评估十个前沿 LLM agents。

结果: 摘要称，masking 会显著改变 agent 的推理理由，使其转向匿名化因子推理；归因分析显示，在泄漏控制评估下，LLM agents 的累计收益大多由被动市场和风格暴露解释，持续选股 alpha 证据有限。

高频特征工程关注点: 与高频特征工程的直接关系较弱，但其 masking 和归因思想可迁移到因子评估：避免模型利用股票身份、日期或已知行情叙事，并将收益拆成市场、风格、行业、横截面状态和真正信号贡献。

研究启发: 对我们的 LLM 因子生成和回测审计非常关键：LLM 生成因子时要防止 ticker/date/事件记忆泄漏，评估时不能只看回测收益或 IC。可以在 OB/SF/sidecar 因子管线中加入匿名化 prompt、日期屏蔽、股票标识屏蔽、风格暴露归因和 baseline-matched 对照，判断 LLM 因子是否真的贡献了可迁移的高频 alpha。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: llm_factor_pipeline, backtest_audit。

可能增益: 潜在增益在于减少不可比实验、泄露和过拟合带来的误判，让 SFT/BT 结论更可信。

## 加密市场与跨资产信息

### IDEA-2026-W25-7890a32f — 阳光下还是阴影中交易：Hyperliquid 上的市场冲击与逆向选择

- 优先级: `high`
- 状态: `candidate`
- 来源: arXiv HFT Time-Series Forecasting
- 链接: http://arxiv.org/abs/2606.15715v1
- 原题: Trading in the Sunshine or in the Shade: Market Impact and Adverse Selection on Hyperliquid
- 研究轴: 数据坐标 / 高频状态, 评估审计 / 可比性
- 管线落点: LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 利用 Hyperliquid 可见 TWAP 检验 sunshine trading
- 比较隐藏 metaorder 与公开 TWAP 执行成本
- 把逆向选择成本和盘口流动性供给联系起来
- 对大单执行状态 sidecar 有直接启发

机制摘要: 该研究利用 Hyperliquid 这一链上限价订单簿市场，研究公开披露交易意图的 TWAP 订单与隐藏 metaorder 的执行差异。论文背景来自 sunshine trading 理论：如果大额订单从开始就公开交易条款，可能降低逆向选择并吸引流动性供给。研究重建了 430 万个隐藏 metaorder，并与 46.5 万个可见 TWAP 执行进行比较。摘要显示，两类执行方式存在明显差异：隐藏 metaorder 更接近前置、U 型的执行节奏，而 TWAP 近似均匀执行；可见 TWAP 的执行成本低于可比隐藏 metaorder，永久价格冲击更小；隐藏 metaorder 若与已公开的同向 TWAP 流同时执行，会承担更高永久成本；可见 TWAP 活跃期间，盘口深度上升且订单簿向吸收方向倾斜。适用边界是：研究对象是加密永续合约的链上 LOB，市场机制和参与者结构与 A 股或传统期货不同，需要谨慎迁移。

背景: 传统市场中大额订单显式预告较少，导致 sunshine trading 理论难以获得直接证据；Hyperliquid 的协议原生 TWAP 从开始即披露条款并在执行期间可见，为研究公开交易意图提供了自然场景。

逻辑: 公开 TWAP 订单降低了其他参与者对交易者私人信息的疑虑，并给流动性提供者明确的吸收需求信号，因此可能降低执行成本；相反，隐藏 metaorder 的信息不透明可能带来更高逆向选择成本，且当同向公开流已经存在时，非公开交易者可能承担更多永久冲击。

方法: 基于地址级数据重建隐藏 metaorder，并与可见 TWAP 执行进行比较；分析执行节奏、执行成本、永久价格冲击以及 TWAP 活跃期间的订单簿深度和倾斜变化。

数据: Hyperliquid 加密货币永续期货链上限价订单簿与地址级数据；摘要提到 430 万个隐藏 metaorder 和 46.5 万个可见 TWAP 执行。

结果: 摘要报告可见 TWAP 相比可比隐藏 metaorder 执行成本更低、永久价格冲击更小；隐藏 metaorder 与已可见同向 TWAP 流同时执行时永久成本更高；可见 TWAP 活跃期间显示深度上升，订单簿向吸收方向倾斜，且公告订单越大该现象越强。

高频特征工程关注点: 可借鉴构造可见大单状态、同向公开流强度、隐藏流估计、执行节奏形态、盘口吸收侧深度变化、永久冲击 proxy、逆向选择状态等事件时间特征。

研究启发: 对我们的 OB/SF/sidecar/LLM 因子管线，最有价值的是把“大额执行是否可见、是否同向拥挤、盘口是否出现吸收性补深”作为事件状态 sidecar。即使在 A 股没有完全相同的链上 TWAP 披露，也可以寻找类似 proxy：大单拆单痕迹、持续同向主动流、盘口吸收层补量、价格层记忆中的挂单恢复速度。MLP/LGB/Linear 可使用这些字段预测短期冲击和反转，LLM 因子生成可围绕“公开流吸收”和“隐藏流冲击”生成微观结构因子。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline。

可能增益: 潜在增益在于提供 baseline 186 因子没有表达的状态变量，帮助筛出在特定微观结构状态下更可靠的短周期预测信号。

## 时序模型训练与融合

### IDEA-2026-W25-ec934083 — 面向时间序列的生成式预测分布建模

- 优先级: `medium`
- 状态: `candidate`
- 来源: arXiv HFT Time-Series Forecasting
- 链接: http://arxiv.org/abs/2606.16773v1
- 原题: Generative Predictive Distributions for Time Series
- 研究轴: 因子生成 / 表示学习, 模型训练 / 序列预测
- 管线落点: MLP 时序预测
- 角色: `模型训练 / 融合候选`

研究亮点:

- 从点预测扩展到完整预测分布
- 可统一计算均值、方差、VaR、ES 和联合尾部风险
- 使用 conditional GAN 估计生成式表示并给出一致性分析
- 对金融风险型标签和尾部状态 sidecar 有启发

机制摘要: 这篇研究提出一个用于非线性、可能多变量时间序列的预测分布建模框架。它不是只输出点预测，而是用一种基于测度论概率中常见结果的生成式表示来表达一般预测分布，从而可以通过模拟直接近似条件预测分布。这个设计的价值在于，预测目标可以自然扩展到条件均值、条件方差、fan charts、VaR、expected shortfall、联合尾部风险等风险量，而不局限于单一均值预测。论文使用 conditional generative adversarial networks 的一个版本来估计该生成式表示，并在弱时间依赖条件下给出形式化统计分析：估计被表述为一个 minimax 问题，并证明近似解在 Hausdorff distance 下具有一致性。实证部分覆盖 equity returns、realized variance 和 realized covariances，摘要还强调该方法计算上可管理，应用中的估计在标准笔记本上约一分钟完成。适用边界上，这篇更偏预测分布与风险刻画框架，而非专门的高频盘口 Alpha 模型；它对我们最有价值的不是直接替代 MLP/LGB/Linear 点预测，而是提供不确定性、尾部风险和联合风险的建模接口。

背景: 传统时间序列预测常聚焦条件均值或单一点预测，但金融场景中条件方差、尾部损失、联合尾部风险等分布信息同样重要。

逻辑: 如果能够用生成式表示直接近似条件预测分布，就可以通过模拟统一计算均值、方差、VaR、expected shortfall 和联合尾部风险等多个预测量，避免为每类风险指标单独设计模型。

方法: 方法将一般预测分布表达为一种合适的生成式表示，并用 conditional generative adversarial networks 的变体估计该表示。理论上，估计被写成 minimax 问题，并在弱时间依赖条件下证明近似解在 Hausdorff distance 下的一致性。

数据: 摘要提到实证应用包括 equity returns、realized variance 和 realized covariances。

结果: 摘要称该方法具有实证相关性，并且计算上可管理，应用中的估计在标准笔记本上约一分钟完成。摘要未提供具体预测精度、收益或风险指标数值。

高频特征工程关注点: 对高频特征工程的启发在于从点预测特征扩展到“条件分布状态”特征。OB/SF 中的订单不平衡、主动买卖、微价格偏离、价格层记忆、队列状态、成交时长和事件时间变量，不只可以预测下一期收益均值，也可以用于预测条件方差、尾部下跌风险、上下行不对称和横截面联合尾部风险。对于高频盘口形态，生成式预测分布还可帮助识别某些盘口状态是否主要提升均值预测，还是主要改变风险分布和尾部形态。

研究启发: 对我们的管线，最直接的启发是把 MLP/LGB/Linear 的单点标签之外，增加分布型 sidecar 目标或审计输出，例如条件方差、分位数、VaR/ES proxy、上尾/下尾不对称、横截面联合尾部状态。MLP 可以承担分布参数或模拟式输出的实验入口，LGB/Linear 可先做轻量分位数或风险 proxy 基线，LLM 因子管线则可把“解释尾部风险而非均值收益”的候选因子单独分组。回测与可比性审计中，应把均值预测收益、尾部风险改善和运行成本分开评价，避免把风险分布建模的价值错误压缩成单一 IC 或单一收益指标。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: mlp_codeX。

可能增益: 潜在增益在于提升多 horizon 序列预测稳定性，或改善 MLP/LGB/Linear 对 sidecar/context 特征的吸收方式。

## 时序预测模型与 LOB

### IDEA-2026-W25-616a0955 — TLOB / MLPLOB：基于 LOB 数据的 MLP 与双注意力 Transformer 趋势预测

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2502.15757
- 原题: A Novel Transformer Model with Dual Attention for Stock Price Trend Prediction with Limit Order Book Data
- 研究轴: 模型训练 / 序列预测, 数据坐标 / 高频状态, 评估审计 / 可比性
- 管线落点: MLP 时序预测, LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 把 MLP 作为强基线而非只追求 Transformer
- 适合建立 LOB 模型等口径对照框架
- 提示模型复杂度增益需要做可比性审计

机制摘要: 这项研究围绕多档限价订单簿序列的股票价格趋势预测，比较简单 MLPLOB 与双注意力 Transformer TLOB。它最值得关注的地方不是单纯提出更复杂的 Transformer，而是把简单 MLP 作为强基线纳入比较，这对高频预测研究尤其重要：如果模型复杂度提高，但输入窗口、label horizon、normalization 或回测 contract 不一致，就很难判断收益来自结构改进还是实验口径漂移。该研究适合作为我们设计 LOB 模型对照实验的参照。

背景: LOB 序列包含多档买卖盘口信息，可用于短期股票价格趋势预测。

逻辑: 用 MLPLOB 代表轻量基线，用双注意力 Transformer TLOB 建模更复杂的盘口序列依赖，从而比较模型结构复杂度对趋势预测的影响。

方法: 比较简单 MLPLOB 与双注意力 Transformer TLOB，输入为多档 LOB 序列，用于股票价格趋势预测。

数据: 多档 LOB 序列数据。

高频特征工程关注点: 启发在于不要只把 LOB 列展平为普通表格特征，还可以区分档位维、时间维和买卖两侧结构；同时保留轻量 MLP baseline，便于判断复杂结构是否真的带来增益。

研究启发: 适合用于 mlp_codeX 或我们的 MLP/GRU/Transformer 对照设计：固定输入窗口、label horizon、normalization、样本切分和 backtest contract，再比较档位维 attention、时间维 attention、轻量 MLP baseline 的边际贡献。对 LLM 因子生成，也可把“档位维交互”和“时间维依赖”拆成明确机制，让生成的因子不只是普通 rolling 变体。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: mlp_codeX, llm_factor_pipeline。

可能增益: 可为 mlp_codeX 增加模型结构改进路线：档位维 attention、时间维 attention、轻量 MLP baseline、以及模型复杂度与收益增益的可比审计。

### IDEA-2026-W25-75704704 — LiT：用结构化 patch 捕捉 LOB 空间与时间依赖的 Transformer

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://www.frontiersin.org/journals/artificial-intelligence/articles/10.3389/frai.2025.1616485/full
- 原题: LiT: limit order book transformer
- 研究轴: 数据坐标 / 高频状态, 模型训练 / 序列预测
- 管线落点: LLM 因子生成, MLP 时序预测
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 用结构化 patch 保留 LOB 层级信息
- 同时关注空间层级与时间依赖
- 适合作为 MLP 输入表示升级方向

机制摘要: LiT 面向高频限价订单簿短期市场运动预测，强调用结构化 patch 与 Transformer 建模订单簿的空间层级和时间依赖。它的主要启发是输入表示：10 档盘口、价量层级、买卖两侧和时间窗口不应总是被直接展平成一组普通列，而可以按照价格层、bid/ask 侧和时间片组织成结构化 patch，使模型更容易学习局部盘口形态、层级位置和时间演化。

背景: LOB 数据天然具有空间层级和时间依赖，包括不同价格档位、买卖两侧和连续时间窗口。

逻辑: 将 LOB 输入组织为结构化 patch，有助于 Transformer 同时捕捉价格层空间结构和时间依赖，而不是把所有字段视为无结构列。

方法: 使用结构化 patch 和 Transformer 建模高频 LOB 的空间层级与时间依赖，用于短期市场运动预测。

数据: 高频 LOB 数据。

高频特征工程关注点: 可把 10 档盘口、价量层级、bid/ask 两侧和时间窗口拆成结构化 patch，显式保留价格层相对位置、买卖侧不对称和局部盘口形态。

研究启发: 对 MLP 时序预测，这是结构升级方向：在展平输入之外，尝试档位块、买卖侧块和时间块的 patch 表示，再与普通 MLP baseline 做等口径比较。对 LLM 因子管线，可把“局部盘口形态”“bid/ask 不对称”“价格层相对位置”转成因子生成坐标；对 LGB/Linear，也可以先把 patch 内的局部统计压缩成可解释特征。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline, mlp_codeX。

可能增益: 可能改善模型对价格层相对位置、bid/ask 不对称、局部盘口形态的吸收，适合作为 MLP 结构升级方向。

### IDEA-2026-W25-9cce7f91 — Deep Limit Order Book Forecasting：深度限价订单簿预测与 LOBFrame 基准

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2403.09267
- 原题: Deep Limit Order Book Forecasting
- 研究轴: 数据坐标 / 高频状态, 模型训练 / 序列预测, 因子生成 / 表示学习
- 管线落点: LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 强调预测指标不等于可交易信号
- LOBFrame 提供大规模 LOB 处理参照
- 适合改造高频模型评估口径

机制摘要: 这项研究使用 LOBFrame 处理大规模限价订单簿数据，并比较深度模型对 NASDAQ 股票中间价变化的预测能力。它最关键的启发是评估层面：高预测指标不一定等于可交易信号，传统机器学习指标不足以完整评价 LOB 预测。对于高频研究，这意味着离线分类准确率、IC 或其他预测分数可能无法直接说明策略能否执行、能否成交、交易方向是否完整，以及是否能在真实交易约束下转化为收益。

背景: 大规模 LOB 数据可用于中间价变化预测，但高频预测任务的离线指标与真实可交易性之间可能存在落差。

逻辑: 通过 LOBFrame 组织和处理大规模订单簿数据，再比较深度模型的预测能力，同时强调预测指标与交易可执行性之间不能直接画等号。

方法: 使用 LOBFrame 处理大规模限价订单簿数据，并比较深度模型对 NASDAQ 股票中间价变化的预测能力。

数据: NASDAQ 股票的限价订单簿数据。

结果: 输入明确指出其重要结论是：高预测指标不一定等于可交易信号，传统 ML 指标不足以评价 LOB 预测。

高频特征工程关注点: 特征工程启发不只在输入构造，也在标签和评估口径：应结合成交概率、交易方向完整性、可执行价格和盘口状态，避免只优化离线预测指标。

研究启发: 对我们的 MLP/GRU/CNN/Transformer、Linear/LGB 和 LLM 因子评估，应从单一 IC、分类准确率扩展到 operational metrics，例如可交易方向、成交概率、滑点敏感性和回测 contract 下的收益可实现性。它也能解释为什么模型离线指标提升不一定转化为收益，并帮助建立更严格的模型与因子可比审计框架。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline。

可能增益: 可帮助解释为什么模型离线指标提升不一定转化为收益，并为 MLP/Linear/LGB 对照建立更合理的验证口径。

### IDEA-2026-W25-5a2dfd8b — LSTM、GRU 与 Transformer 在股票价格趋势预测中的对照分析

- 优先级: `medium`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2411.05790
- 原题: Comparative Analysis of LSTM, GRU, and Transformer Models for Stock Price Trend Prediction
- 研究轴: 模型训练 / 序列预测
- 管线落点: MLP 时序预测
- 角色: `模型训练 / 融合候选`

研究亮点:

- 提供 LSTM、GRU、Transformer 的模型家族对照视角
- 提醒轻量 GRU 可作为高频短路径记忆 baseline
- 适合纳入同口径模型消融实验
- 输入未给出可直接引用的实验结论

机制摘要: 该研究比较 LSTM、GRU 和 Transformer 在股票价格趋势预测任务中的表现。输入没有提供具体数据频率、标的、实验结论或收益表现，因此更适合作为模型家族对照提醒，而不是可直接迁移的结果依据。它的价值在于提醒我们，在金融时序预测中应把轻量循环模型和 Transformer 放在同一切分、同一评估口径下比较。

逻辑: 不同序列模型对路径记忆、局部状态延续和长依赖的建模能力不同，因此需要在同一预测任务中进行可比评估。

方法: 比较 LSTM、GRU 和 Transformer 三类序列模型用于股票价格趋势预测。

数据: 股票价格趋势预测数据；输入未提供具体市场、频率或样本范围。

高频特征工程关注点: 对高频预测的启发是，120 tick 内的盘口不平衡、主动买卖、队列状态和成交节奏可能需要路径记忆 baseline，而不应只依赖静态 MLP 截面输入。

研究启发: GRU 值得作为 mlp_codeX 的低成本路径记忆 baseline：参数量通常小于 Transformer，但比纯 MLP 更容易吸收短窗口内状态延续。建议在完全相同的 OB/SF/sidecar 特征、数据切分、label 和交易评估下比较 MLP、GRU、TCN、小型 Transformer，避免模型改动与样本口径混在一起。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: mlp_codeX。

可能增益: 可用于 mlp_codeX 的低成本模型扩展：MLP vs GRU vs TCN vs small Transformer，在相同数据切分和交易评估下比较。

### IDEA-2026-W25-9a5092a6 — LENS：面向金融时序探索的大规模预训练 Transformer

- 优先级: `medium`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2408.10111
- 原题: LENS: Large Pre-trained Transformer for Exploring Financial Time Series
- 研究轴: 模型训练 / 序列预测
- 管线落点: MLP 时序预测
- 角色: `模型训练 / 融合候选`

研究亮点:

- 把金融时序建模推向预训练基础模型方向
- 针对低信噪比和高随机性金融数据
- 适合作为 OB/SF 状态表示学习参考
- 可启发监督模型前的自监督预训练阶段

机制摘要: LENS 关注金融时序中的大规模预训练问题，目标是在低信噪比、高随机性金融数据上训练可迁移的 Transformer 表示。输入摘要没有给出具体实验设置和结果，但明确指出该研究把金融时序建模从纯监督预测扩展到预训练框架，适合作为金融基础模型方向的参考。

背景: 金融时序通常具有低信噪比和高随机性，直接用监督标签训练容易受标签稀疏、噪声和市场状态变化影响。

逻辑: 通过大规模预训练先学习金融时序的状态结构，再服务于下游预测任务，可能比只依赖单一监督目标更稳健。

方法: 提出面向金融时序的预训练 Transformer；输入未提供更具体的预训练任务或模型细节。

数据: 金融时序数据；输入未提供具体市场、频率或数据集名称。

高频特征工程关注点: 启发点在于把 OB/SF/sidecar 中的盘口状态、成交状态和跨股票状态当作可自监督学习的序列，而不只是手工构造后直接喂给监督模型。

研究启发: 可在我们的 OB/SF/sidecar 数据上尝试自监督预训练，例如 mask reconstruction、next-state prediction、contrastive state matching，再把学到的状态表示接入 MLP、GRU 或 Transformer 预测头。潜在价值是让模型先学习盘口状态空间、路径延续和跨股票共性，再用有限监督 label 微调。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: mlp_codeX。

可能增益: 潜在增益在于让 MLP/GRU/Transformer 不只依赖监督 label，而先学习盘口状态空间和跨股票共性表示。

## 订单簿表示与逐笔数据

### IDEA-2026-W25-ed1d1cfb — 基于注意力的限价订单簿阅读、突出与预测

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Model and Financial Time-Series Research
- 链接: https://arxiv.org/abs/2409.02277
- 原题: Attention-Based Reading, Highlighting, and Forecasting of the Limit Order Book
- 研究轴: 模型训练 / 序列预测, 数据坐标 / 高频状态
- 管线落点: MLP 时序预测, LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 预测对象从中间价扩展到整本订单簿
- 强调多层价格与数量的动态表示
- 适合作为盘口重建辅助任务
- 有助于学习 book-shape 与价格层记忆

机制摘要: 该研究使用 seq2seq 模型预测多层限价订单簿的价格和数量，而不只预测中间价方向。其重点是把预测目标从单一 mid-price movement 扩展到整本订单簿的 next-state 或 book-shape 变化，使模型学习盘口深度、价格层和数量分布的动态演化。适用边界是：输入只提供了研究目标层面的摘要，没有给出具体模型结构、数据集、评估指标或实验结论，因此只能确认其任务设定对订单簿表示学习有启发，不能评价效果强弱。

背景: 传统 LOB 预测常以中间价方向为目标，可能无法充分利用多层盘口价格和数量的结构信息。

逻辑: 如果模型需要重建或预测多层盘口状态，就必须学习价格层之间、买卖盘之间以及数量分布随时间变化的关系，这可能比单独预测方向更能约束盘口表示。

方法: 使用 seq2seq 模型预测多层 LOB 的价格和数量。

数据: 多层限价订单簿数据；输入未给出具体市场、频率或样本范围。

高频特征工程关注点: 启发构造 book-shape reconstruction、next-state delta、价格层数量迁移、盘口形态变化、微价格偏移和队列状态演化等辅助目标或派生特征。

研究启发: 对我们的 OB/MLP 管线，可以将 return label 之外增加盘口重建或下一状态预测辅助任务，让 MLP 不只拟合短期收益弱标签，也学习价格层记忆和盘口形态的动态约束。对 LLM 因子管线，可把“预测整本订单簿”转化为因子生成提示：关注哪些价格层数量正在被补充、消耗、迁移或失衡，并将 reconstruction residual 作为潜在异常状态 sidecar。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: mlp_codeX, llm_factor_pipeline。

可能增益: 可能提升模型对盘口状态演化的理解，辅助短 horizon return label 的弱信号学习。

## 评估审计与风险控制

### IDEA-2026-W25-fb8e1c23 — 双分支自监督学习识别市场操纵：融合频域异常合成与领域特征

- 优先级: `high`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://doi.org/10.1016/j.ipm.2026.104961
- 原题: Detecting market manipulation with dual-branch self-supervised learning: A unified framework integrating frequency-informed anomaly synthesis and domain-specific features
- 研究轴: 评估审计 / 可比性, 模型训练 / 序列预测, 数据坐标 / 高频状态
- 管线落点: 回测与可比性审计, Linear/Ridge baseline, LLM 因子生成
- 角色: `评估审计 / 可比性候选`

研究亮点:

- 面向操纵检测的自监督框架
- 结合微观结构领域特征与频域异常合成
- 双分支网络同时建模局部边界和整体时序
- 适合作为高频样本审计和风险 sidecar

机制摘要: 该论文提出 SD-FMM，一个面向金融市场操纵检测的自监督框架，针对操纵信号隐蔽、标注数据稀缺、边界模糊三个问题。框架包含三部分：Amplification Component 基于市场微观结构理论提取并融合领域特征，以放大隐蔽操纵信号；Synthesis Component 使用少样本学习和基于离散小波变换的动态频率分析生成逼真的合成异常，以减少对稀缺标签的依赖；Detection Component 使用双分支对比检测神经网络，通过局部对比学习和整体时序依赖建模增强对操纵边界的敏感性。摘要报告其在 25 个中国股票市场操纵案例的专有数据集和 338 个加密 pump-and-dump 公共基准上相对 12 个 baseline 有显著提升。适用边界是：该研究目标是操纵检测和风险控制，不是常规收益预测；且部分数据为专有案例，复现性和迁移到普通 alpha 预测需要单独审计。

背景: 市场操纵检测受到信号隐蔽、标签稀缺和异常边界模糊的限制，传统监督学习很难获得足够可靠的标注样本。

逻辑: 通过微观结构领域特征放大异常痕迹，通过频域方法合成少见异常样本，再用局部对比和整体时序建模同时识别边界与持续模式，可以提升对操纵行为的敏感度。

方法: 提出 SD-FMM，包括领域特征放大组件、基于少样本学习与离散小波变换的异常合成组件，以及双分支对比检测神经网络。

数据: 摘要提到一个包含 25 个中国股票市场操纵案例的专有数据集，以及一个包含 338 个加密货币 pump-and-dump scheme 的公共基准。

结果: 摘要称在股票数据集上，SD-FMM 相比第二好 baseline 的 average precision 提高 47.61%，误报率降低 47.46%，平均检测延迟缩短 25.05%；在加密数据集上，Hit Rate@3 为 83.13%，Hit Rate@20 为 97.93%。

高频特征工程关注点: 可借鉴其领域特征放大思路，构造异常订单不平衡、盘口快速倾斜、成交频率突变、频域能量变化、主动买卖异常同步、队列状态非自然变化和事件时间边界特征。

研究启发: 对我们的因子管线，该研究更适合作为风险控制和样本审计 sidecar，而不是直接作为 alpha 模型。可以用微观结构异常检测结果过滤训练样本、标记可疑交易日或构造 manipulation-risk context，避免 LLM/MLP/LGB/Linear 在异常操纵片段上学习到不可交易或不可泛化的模式。频域异常合成也可用于压力测试因子：检查订单不平衡、微价格、主动流和价格层记忆因子在异常成交节奏下是否产生过度暴露。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: backtest_audit, linear_codeX, llm_factor_pipeline。

可能增益: 潜在增益是减少操纵/异常事件对训练和回测结论的污染，提升 tail 风险控制。

### IDEA-2026-W25-cd66d4c6 — 金融科技系统中的自适应风险评估：基于强化学习的连续策略优化

- 优先级: `medium`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://doi.org/10.62762/jse.2026.605759
- 原题: Adaptive Risk Evaluation in FinTech Systems via Reinforcement-Based Continuous Policy Optimization
- 研究轴: 因子生成 / 表示学习, 模型训练 / 序列预测
- 管线落点: LGB 融合与筛选, MLP 时序预测
- 角色: `模型训练 / 融合候选`

研究亮点:

- 面向实时风险评分和概念漂移
- 把风险评估建模为连续动作 MDP
- 强调在线学习与推理服务分离
- 提供可部署的异步连续更新架构

机制摘要: 该研究把实时风险评估建模为连续动作 Markov Decision Process，并提出 ARL-CPO，用强化学习在流式交易、行为事件和结果反馈中持续优化风险评分策略。文章不仅关注算法，也把 ARL-CPO 描述为可部署的软件架构：将在线学习和推理服务分离，用推理微服务配合异步更新循环，使模型可以连续更新，而不依赖周期性批量重训。应用场景包括信用违约预测和自适应资产配置。

背景: FinTech 系统需要在高吞吐、低延迟信息流上实时评估风险，并且要能适应概念漂移、在不中断服务的情况下更新模型。

逻辑: 静态或周期性重训模型难以及时响应分布变化；把风险评估转化为带反馈的连续策略优化问题，可以让模型随市场和用户条件变化持续调整。

方法: 将风险评估建模为连续动作 MDP，通过流式交易数据、行为事件和结果驱动 reward feedback 持续优化策略；系统架构上分离在线学习和推理服务，使用异步更新循环。

数据: 使用自定义 FinTech 环境模拟器生成的 850 万条信用记录，并评估信用违约预测和自适应资产配置任务。

结果: 摘要称 ARL-CPO 与 Random Forest、Gradient Boosting、Transformer baseline 对比，在 precision 和 F1 相关评估中表现更好，并报告 97.4% classification accuracy、98.8% trend adaptation rate、96.1% cumulative long-term performance index。

高频特征工程关注点: 对高频研究的启发在于把特征和模型都看作随流式状态更新的系统：订单不平衡、主动买卖、微价格、队列状态、成交时长和横截面状态可能存在概念漂移，需要在线监控状态分布和预测误差，而不是只做离线批量训练。

研究启发: 对我们的 MLP/LGB/Linear 融合和 sidecar 管线，最可借鉴的是架构思想而不是直接套用 RL：推理服务保持稳定，学习或权重更新走异步通道；对高频因子可增加 drift monitor、状态分桶表现跟踪和定期轻量更新。若引入连续更新，必须保留严格的回测切分、延迟约束和上线回滚机制，避免在线反馈造成不可比或泄漏。

管线落点: 优先作为 MLP/LGB/Linear 的训练或融合实验，不直接改变因子数据；候选 routes: lgb_codeX, mlp_codeX。

可能增益: 潜在收益不是直接提高 raw IC，而是减少状态不适配时期的尾部损失和 SFT/BT 不稳定。

## 金融时序预测模型

### IDEA-2026-W25-18fc4205 — 宏观感知时序预测：层次化混频注意力模型

- 优先级: `high`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://openalex.org/W7163598426
- 原题: Macro-aware time series forecasting via hierarchical mixed-frequency attention models
- 研究轴: 模型训练 / 序列预测, 因子生成 / 表示学习, 数据坐标 / 高频状态
- 管线落点: MLP 时序预测
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 用层次化混频注意力融合宏观与市场序列
- 将 regime selection 表达为宏观上下文注意力
- 消融强调结构化条件化而非朴素拼接
- 适合启发高频 sidecar 的状态条件设计

机制摘要: 该研究提出 HANET，一种层次化注意力网络，用于在金融预测中整合低频宏观信息和高频市场动态。研究问题是：金融深度学习模型常受小样本、噪声和非平稳影响，而宏观金融预测还面临可观察宏观 regime 数量稀缺的问题。HANET 采用混频层次结构，将日度资产收益信号嵌套在月度宏观窗口中，并用 Hierarchical Cross-Attention 在不丢弃日度细节的情况下对齐低频宏观上下文与高频收益序列。摘要报告，在 55 个高流动性期货、多个资产类别上，HANET 相比忽略宏观信息的神经预测模型表现更好，尤其在动荡期提升风险调整收益并减轻损失；消融显示收益来自结构化宏观条件化，而不是简单拼接宏观特征。适用边界是：该研究面向日度收益与月度宏观混频，不是直接的毫秒或 tick 级 LOB 预测，但其 regime attention 思路可迁移到高频市场状态条件化。

背景: 金融预测面临数据少、信号噪声高、非平稳和宏观 regime 稀缺等问题；简单使用深度模型或朴素宏观特征拼接可能无法稳定泛化。

逻辑: 宏观状态变化会影响资产收益生成机制，但宏观变量频率低、regime 样本少；将高频市场动态嵌入低频宏观上下文，并通过注意力选择相似历史宏观环境，可以让模型在不同 regime 下调整预测。

方法: 提出 HANET，采用混合 LSTM 架构、层次化混频结构和 Hierarchical Cross-Attention，将日度资产收益嵌套在月度宏观窗口中，并通过宏观上下文注意力进行 regime selection。

数据: 摘要提到 55 个高流动性期货，覆盖多个资产类别；包含日度资产收益与月度宏观经济信息。

结果: 摘要称 HANET 稳定优于忽略宏观信息的神经预测模型，尤其在动荡期改善风险调整收益并减轻损失；消融显示结构化宏观条件化是收益来源，使用相同宏观表示的 LSTM 表现较差，打乱宏观上下文会显著降低表现。

高频特征工程关注点: 对高频特征工程的启发是把低频 regime、市场波动状态或流动性状态作为条件层，而不是直接与订单不平衡、微价格、主动买卖等 tick 特征平铺拼接。

研究启发: 对我们的 MLP/LGB/Linear/LLM 管线，可以把宏观或市场状态 sidecar 设计成层次条件：低频 regime 选择上层样本权重或专家路径，高频 OB/SF 特征负责局部预测。虽然输入研究不是纯高频 LOB，但其“结构化条件化优于朴素特征追加”的结论对 sidecar 接入很重要：市场状态、宏观状态、横截面状态应作为 gate、attention context 或分组归一化条件，而不是简单加入一列特征后期待模型自动学会 regime。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: mlp_codeX。

可能增益: 可能改善跨频率状态对短 horizon 预测的调制，尤其是市场状态变化和高频信号失效阶段。

### IDEA-2026-W25-634c8a08 — 基于 Shifted Data Augmentation 的稳健 Transformer 单步股票指数预测

- 优先级: `medium`
- 状态: `candidate`
- 来源: arXiv HFT Time-Series Forecasting
- 链接: http://arxiv.org/abs/2606.15701v1
- 原题: Robust Transformer-Based One-Step Stock Index Forecasting via Shifted Data Augmentation
- 研究轴: 模型训练 / 序列预测, 评估审计 / 可比性
- 管线落点: MLP 时序预测, 回测与可比性审计
- 角色: `评估审计 / 可比性候选`

研究亮点:

- 把稳健性提升重点放在数据增强和学习率调度，而非增加模型复杂度
- SDA 用于降低预测误差和运行间波动
- cosine annealing with warmup 在摘要中表现优于 generalized inverse-power scheduler
- 对高噪声金融序列的一步预测训练审计有直接参考价值

机制摘要: 这篇研究关注 Transformer 直接用于金融时序单步预测时面临的几个核心问题：金融信号噪声大、短记忆特征明显、分布漂移频繁，导致模型训练和超参数选择容易不稳定。论文提出一个改造后的 Transformer 架构，并结合更合适的学习率调度和一种 Shifted Data Augmentation（SDA）数据增强方法，用于股票指数的一步预测。摘要中最值得关注的是，作者把提升稳健性的重点放在训练策略和数据增强上，而不是单纯增加模型复杂度；实验显示 cosine annealing with warmup 相比 generalized inverse-power scheduler 能更稳定地提升预测精度，SDA 还能降低预测误差、减少不同运行之间的波动，并增强对超参数选择的鲁棒性。适用边界上，这项工作证据来自 VN30 和 S&P 500 两个股票指数基准数据集，目标是指数级别的一步预测，因此不能直接等同于个股高频盘口预测或交易收益提升，但其关于噪声环境下稳健训练的结论对高频序列建模有直接参考价值。

背景: Transformer 在序列建模中表现突出，但金融时序存在高噪声、短记忆和分布漂移，使其直接应用于金融预测时容易不稳定。

逻辑: 如果金融时序预测误差和运行波动主要来自噪声、局部位移和训练不稳定，那么通过学习率调度和时间序列位移增强改善训练分布覆盖，可能比简单堆叠更复杂的 Transformer 更有效。

方法: 论文提出改造后的 Transformer 架构，结合 advanced learning-rate scheduling，并引入 Shifted Data Augmentation。摘要明确比较了 cosine annealing with warmup 与 generalized inverse-power scheduler，并评估 SDA 对误差、运行波动和超参数鲁棒性的影响。

数据: 使用 VN30 和 S&P 500 两个股票指数基准数据集。

结果: 实验结果显示，cosine annealing with warmup 相比 generalized inverse-power scheduler 能持续提升预测精度；SDA 显著降低预测误差和 run-to-run variability，并提高对超参数选择的鲁棒性；cosine annealing 调度与 SDA 的组合在两个数据集上取得最佳表现。摘要未提供具体收益或误差数值。

高频特征工程关注点: 对高频特征工程的启发主要在“时间位移增强”和“短记忆稳健性”上。对于 OB/SF 数据，可以考虑在严格避免未来信息的前提下，对盘口序列、成交序列、订单不平衡、微价格、主动买卖强度、队列状态等特征做小幅事件时间或采样窗口位移增强，用于检验模型是否过度依赖某个固定对齐点。SDA 的思想也适合用于审计价格层记忆、盘口形态和成交时长特征是否只是对某个偶然时间切片过拟合。

研究启发: 对我们的 OB/SF/sidecar/MLP/LGB/Linear/LLM 因子管线，主要启发是把“稳健训练”作为独立实验轴。MLP 时序预测可以加入默认关闭的 SDA 训练开关，比较相同特征、相同标签、相同回测口径下是否降低 seed 间波动；LGB/Linear 可以把位移后的特征样本作为稳健性审计，而不是直接混入正式训练；sidecar 可以先产出 shifted alignment 版本的订单不平衡、主动买卖、微价格、价格层记忆、队列状态等特征，用于检验因子对时间对齐扰动的敏感度。对于 LLM 因子发现，也可把“位移后仍稳定”的特征族作为筛选信号，优先保留不是靠单点对齐偶然有效的候选因子。

管线落点: 优先进入审计/评估方法库，服务 baseline 可比性和 SFT/BT 可信度；候选 routes: mlp_codeX, backtest_audit。

可能增益: 潜在增益在于减少不可比实验、泄露和过拟合带来的误判，让 SFT/BT 结论更可信。

## 高频数据特征工程

### IDEA-2026-W25-bc3ab97e — 中信建投：从分钟频到 Level2 的市场微观结构研究

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://view.inews.qq.com/a/20251217A01V3A00
- 原题: CSC market microstructure research from minute frequency to Level2
- 研究轴: 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态
- 管线落点: LLM 因子生成, 高频数据特征工程
- 角色: `高频数据特征工程候选`

研究亮点:

- 从分钟频扩展到 Level2 微观结构视角
- 强调市场结构变化会削弱历史统计规律一致性
- 主动买卖金额和大单行为适合转为高频特征模板

机制摘要: 这篇券商微观结构研究系统整理了从分钟频高频因子挖掘到 Level2 数据应用的经验。核心问题是：在市场微观结构持续变化的背景下，历史统计规律是否仍能稳定解释高频 Alpha。文章强调，微观结构变化会影响历史统计规律的一致性，因此高频因子不能只依赖静态历史相关性，还需要结合成交量、大单买入笔数、主动买卖金额等更贴近交易行为的指标来解释短周期价格变化。适用边界上，它更像是高频特征工程和研究框架总结，而不是单一模型或严格可复现实验论文。

背景: 市场微观结构变化会影响历史统计规律的一致性，分钟频和 Level2 数据为更细粒度解释高频 Alpha 提供了信息来源。

逻辑: 用更贴近交易过程的 Level2 指标刻画订单流和主动交易行为，从而补充传统分钟频统计因子对高频 Alpha 的解释。

方法: 围绕分钟频高频因子和 Level2 指标进行系统整理，关注成交量、大单买入笔数、主动买卖金额等变量。

数据: 分钟频高频数据与 Level2 数据。

高频特征工程关注点: 可关注成交量、大单买入笔数、主动买卖金额、主动买卖同步性、大单交易行为，以及分钟频到秒级状态迁移。这些特征比普通 rolling 统计更贴近订单流机制。

研究启发: 对我们的 OB/SF 预测最直接的启发是把 Level2 指标对、主动买卖同步性、大单行为和分钟频到秒级状态迁移纳入 sidecar taxonomy。对 LLM 因子管线，可作为中文机制模板，帮助生成更可解释的 order-flow interaction 因子；对 MLP/LGB/Linear 侧，可构造主动买卖金额、成交量冲击和大单交易行为的交互特征，并在相同 label horizon 与 normalization 下做等口径比较。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: llm_factor_pipeline, hft_feature_engineering。

可能增益: 可能为 LLM 因子生成提供中文机制模板，也能帮助 MLP/LGB 侧构造更可解释的 order-flow interaction 特征。

### IDEA-2026-W25-3f512fff — 国信证券：高频订单成交数据中的 Alpha 信息

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://www.fxbaogao.com/detail/4095774
- 原题: Guosen Securities alpha information in high-frequency order transaction data
- 研究轴: 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态
- 管线落点: 高频数据特征工程, LLM 因子生成, 数据 sidecar / 高频衍生数据
- 角色: `高频数据特征工程候选`

研究亮点:

- 从逐笔成交行为中挖掘 Alpha
- 强调成交时长和订单大小等非传统维度
- 适合转化为 Stream/OB sidecar 字段

机制摘要: 这篇报告围绕逐笔成交数据挖掘 Alpha 信息，重点不是传统成交量汇总，而是从订单大小、成交时长、成交时间、出价高低等更细的交易行为维度构造因子。报告提出大单交易占比、漫长订单交易占比以及复合因子框架，说明逐笔成交数据可以用于识别不同交易行为状态，例如大单冲击、延迟成交、流动性消耗或被动吸收。它对高频特征工程的价值在于提供了一套可直接映射到 Stream/OB sidecar 的行为字段。

背景: 逐笔成交数据比普通分钟级量价数据更接近真实交易过程，可能包含订单大小、成交耗时和成交时点等 Alpha 信息。

逻辑: 将成交记录拆解为订单大小、成交时长、成交时间和出价高低等行为维度，再用比例类和复合类因子刻画交易状态。

方法: 基于逐笔成交数据构造订单大小、成交时长、成交时间、出价高低等维度的因子，并提出大单交易占比、漫长订单交易占比和复合因子框架。

数据: 逐笔成交数据。

高频特征工程关注点: 可将订单大小、成交耗时、早尾盘属性、高低价属性、大单交易占比、漫长订单交易占比转为 sidecar 字段。相比普通成交量 rolling，这些字段更能分解拆单、延迟成交、流动性消耗和被动吸收状态。

研究启发: 对我们的 Stream/OB 管线，可把订单大小、成交时长、成交时间和出价高低设计成可审计 sidecar 字段，并让 LLM 因子模板围绕“谁在主动消耗流动性”“大单是否集中出现”“成交是否被拉长”生成候选因子。对 MLP/LGB/Linear，可把这些字段作为行为分解后的输入特征，测试其相对普通成交量 rolling 的增量。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: hft_feature_engineering, llm_factor_pipeline, data_processing_sidecar。

可能增益: 可能提供比普通成交量 rolling 更细的行为分解，帮助识别拆单、被动吸收、流动性消耗和延迟成交状态。

### IDEA-2026-W25-759776b6 — 开源证券订单流系列：挂单方向长期记忆性的讨论与应用

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://www.fxbaogao.com/detail/4339762
- 原题: KYSEC order flow long memory of order submission direction
- 研究轴: 数据坐标 / 高频状态, 高频特征工程
- 管线落点: 数据 sidecar / 高频衍生数据, 高频数据特征工程, LLM 因子生成
- 角色: `高频数据特征工程候选`

研究亮点:

- 将订单流建模从快照扩展到历史记忆
- 关注靠近盘口与远离盘口委托差异
- 非常适合 PriceLevelMemory 和 PathMemory sidecar

机制摘要: 这篇报告利用逐笔委托数据研究挂单方向是否存在长期记忆，关注订单方向自相关、拆单行为，以及靠近盘口和远离盘口委托之间的差异。它的核心价值在于把订单流从“当前盘口快照”扩展到“历史路径和价格层记忆”：如果挂单方向存在延续性，那么不同价格层上的买卖方向、衰减速度和持续时间都可能成为高频预测变量。该思路非常适合转化为 PriceLevelMemory / PathMemory 类 sidecar。

背景: 逐笔委托数据可以观察挂单方向、价格层位置和订单流延续性，适合研究订单方向是否具有长期记忆。

逻辑: 若挂单方向存在自相关或长期记忆，则历史委托方向在不同价格层的延续和衰减可能反映拆单、持续买卖压力或流动性供给变化。

方法: 利用逐笔委托数据研究订单方向自相关、拆单行为，以及靠近盘口和远离盘口委托之间的差异。

数据: 逐笔委托数据。

高频特征工程关注点: 可构造不同价格层的历史挂单方向记忆、方向自相关、靠近盘口与远离盘口的方向差异、路径衰减和 jump decay 特征。这类特征比只看当前 bid/ask 或 rolling imbalance 更强调路径信息。

研究启发: 对我们的 PriceLevelMemory、PathMemory、jump decay 和 OB sidecar 最直接：不仅记录当前盘口，还要记录历史挂单方向在不同价格层的延续性、衰减速度和层级迁移。对 LLM 因子生成，可提供中文实证机制模板，让候选因子围绕“订单方向长期记忆”“拆单延续”“远近盘口压力差”展开，而不是生成普通 rolling 均值。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: data_processing_sidecar, hft_feature_engineering, llm_factor_pipeline。

可能增益: 可能为当前 PLM、jump decay、path memory 提供中文实证机制，帮助 LLM 生成更贴近订单行为而非普通 rolling 的候选因子。

### IDEA-2026-W25-39e21387 — 开源证券：市场微观结构观察与 2023 年以来的高频因子回顾

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://www.fxbaogao.com/detail/4984776
- 原题: KYSEC market microstructure observation and high-frequency factor review since 2023
- 研究轴: 因子生成 / 表示学习, 数据坐标 / 高频状态
- 管线落点: LLM 因子生成
- 角色: `数据坐标 / sidecar 候选`

研究亮点:

- 从市场状态角度整理 A 股高频微观结构
- 覆盖早盘集中度、盘口筹码和程序化交易比例
- 适合转化为 context sidecar 或 regime gate
- 强调高频因子表现需要结合市场阶段理解

机制摘要: 该报告围绕 A 股市场微观结构变化展开观察，关注早盘交易集中度、单笔委托金额、订单簿筹码充足率、程序化交易比例等维度，并回顾 2023 年以来高维记忆、强反转、彩票委托等高频因子的表现。其价值不在于提出单一新模型，而在于把高频因子研究从单股票 rolling 量价统计扩展到市场状态、订单簿厚度、交易活跃度和程序化交易占比等上下文条件。适用边界是：输入信息只说明了观察维度和因子回顾方向，未提供具体因子构造、回测口径或收益数字，因此不能据此判断单个因子的稳定收益能力。

背景: 报告关注 A 股微观交易特征，并将 2023 年以来的高频因子研究作为回顾对象。

逻辑: 早盘成交集中度、委托金额、订单簿筹码充足率和程序化交易比例等变量可以刻画市场流动性、拥挤度和交易行为结构，从而为高频因子的分阶段有效性提供状态解释。

方法: 从多个市场微观结构指标观察交易状态，并回顾高维记忆、强反转、彩票委托等高频因子。

数据: A 股高频交易与订单簿相关数据；输入未给出具体样本区间、股票池或频率细节。

高频特征工程关注点: 可将早盘交易集中度、单笔委托金额、订单簿筹码充足率、程序化交易比例、冲击成本、撤单率等转化为 market-state/context 特征，作为高频因子的条件变量，而不只是作为独立预测因子。

研究启发: 对我们的 OB/SF/sidecar/MLP/LGB/Linear/LLM 因子管线，最直接的启发是构建默认可关闭的 market-state sidecar：在每个截面或时段上输出市场活跃度、盘口厚度、流动性改善、拥挤程度、程序化交易强度等上下文状态，再让 LLM 因子生成、LGB/Linear baseline 或 MLP 时序模型使用这些状态做条件化建模或 regime gate。这样可以把同一订单不平衡、反转、微价格或价格层记忆因子放到不同市场阶段下解释，减少把 regime shift 误判为因子失效。

管线落点: 优先判断是否能成为 OB 1s exact-axis sidecar；候选 routes: llm_factor_pipeline。

可能增益: 可能提升因子在不同市场阶段的稳定性，尤其是识别放量、拥挤、流动性改善或高频策略容量变化时的 regime shift。

### IDEA-2026-W25-874bfa0c — 国信金工：基于主动买卖特征的高频订单因子改进

- 优先级: `high`
- 状态: `candidate`
- 来源: Curated Chinese Broker Microstructure Research
- 链接: https://finance.sina.com.cn/roll/2024-08-20/doc-inckfzcs5651129.shtml
- 原题: Guosen Securities high-frequency order factor improvement via active buy-sell features
- 研究轴: 高频特征工程, 数据坐标 / 高频状态, 因子生成 / 表示学习
- 管线落点: 高频数据特征工程, 数据 sidecar / 高频衍生数据, LLM 因子生成
- 角色: `高频数据特征工程候选`

研究亮点:

- 把成交流拆成主动买卖方向
- 比较委托时间法与成交价格法
- 方向一致性可作为信号置信度
- 适合增强短 horizon 订单流特征

机制摘要: 文章聚焦逐笔成交中的主动买卖方向识别，比较基于委托时间和基于成交价格的划分方法，并讨论不同主动成交方向对未来收益的差异。该思路的核心是把 trade flow 从普通成交量和价格变化中拆解出来，识别成交是主动买入、主动卖出还是方向不确定，并进一步区分方向强度与识别可靠度。适用边界是：输入只说明了研究主题和方法比较，没有给出具体识别规则、样本、回测结果或收益统计，因此不能外推其在其他市场或 horizon 上一定有效。

背景: 高频订单因子中，逐笔成交方向是刻画短期买卖压力和订单流冲击的重要信息。

逻辑: 主动买入和主动卖出反映了交易者急迫性与即时流动性需求，不同方向的主动成交可能对未来短期收益产生不同影响；不同方向识别方法之间的一致性也可作为信号可靠度。

方法: 比较基于委托时间和基于成交价格的主动买卖方向划分方法，并分析不同主动成交方向与未来收益的关系。

数据: 逐笔成交及相关委托信息；输入未给出具体市场、样本期或股票池。

高频特征工程关注点: 可构造主动买入量、主动卖出量、主动净流、主动成交占比、主动强度、方向识别一致性、方向置信度等字段，并将价格法与委托时间法的分歧作为噪声或 gate。

研究启发: 对我们的 OB/SF/sidecar 管线，可以在成交流 sidecar 中新增主动方向、主动强度和方向可靠度字段，再为 LGB/Linear/MLP 提供短 horizon 的 trade-flow 输入。对 LLM 因子生成，可以把主动/被动、方向/强度、方法置信度三层结构显式写入可用字段说明，让模型生成更接近微观结构逻辑的因子，而不是只在成交量、收益率和盘口不平衡上做滚动组合。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: hft_feature_engineering, data_processing_sidecar, llm_factor_pipeline。

可能增益: 潜在增益在于把 trade flow 从简单量价序列拆成主动/被动、方向/强度、方法置信度三层，提高短 horizon 预测解释性。

### IDEA-2026-W25-756b0787 — 基于 GAN-Diffusion 框架的高质量合成金融时序

- 优先级: `medium`
- 状态: `candidate`
- 来源: OpenAlex Semantic Works Search
- 链接: https://openalex.org/W7162700508
- 原题: High-Quality Synthetic Financial Time-Series using a GAN-Diffusion Framework
- 研究轴: 高频特征工程, 模型训练 / 序列预测
- 管线落点: MLP 时序预测
- 角色: `高频数据特征工程候选`

研究亮点:

- 结合 GAN 与扩散模型生成金融时序
- 显式建模相关股票的资产间相关结构
- 联合生成 mid-price 和 volume
- 强调 stylized facts 作为合成质量标准

机制摘要: 该研究关注金融合成数据生成，目标是缓解数据稀缺并生成反事实市场场景。文章指出，金融时序的 stylized facts 很难被通用生成模型完整复现，因此提出一个质量感知的生成框架，把 CoMeTS-GAN 与扩散模型结合起来。CoMeTS-GAN 用于联合生成相关股票的中间价和成交量序列，并显式建模资产间相关结构；随后将 GAN 的 Critic 作为质量评估模块引入扩散过程，引导扩散模型生成更符合已学习相关结构的金融时序。

背景: 金融机构越来越多使用合成数据来缓解数据稀缺和构造反事实市场场景，但许多通用生成架构仍难以复现金融时序的 stylized facts。

逻辑: 单一生成模型可能难以同时保持时间序列真实性和资产间相关结构，因此用 GAN 学习相关结构，再用其 Critic 引导扩散过程，提高合成数据质量。

方法: 提出 CoMeTS-GAN，即用于相关多变量时间序列的条件 GAN，联合生成相关股票的 mid-price 和 volume；再将 GAN 的 Critic 作为质量评估模块嵌入扩散模型，引导扩散过程保持相关结构。

数据: 相关股票的 mid-price 和 volume 时间序列；输入未提供具体市场、频率或样本区间。

结果: 摘要称实验与领先生成架构对比后，该框架更有效捕捉股票市场 stylized facts，并更好建模资产间相关性。

高频特征工程关注点: 对高频特征工程的启发在于，合成数据质量不应只看单资产价格路径，还要检查中间价、成交量、资产间相关结构和 stylized facts 是否同时成立。可扩展到盘口不平衡、微价格、队列状态、成交时长和横截面状态的联合生成与一致性检查。

研究启发: 对我们的 OB/SF/sidecar/MLP 管线，合成数据可作为压力测试和反事实场景生成工具，而不是直接替代真实训练样本。更实际的路径是先在 mid-price、volume、订单不平衡、主动买卖、微价格和横截面状态上定义 stylized-fact 审计指标，再评估合成序列是否能保持单标的路径统计和跨股票相关结构。

管线落点: 优先进入高频 feature pool / sidecar taxonomy，同时服务 LGB/Linear/MLP 和 LLM factor prompt；候选 routes: mlp_codeX。

可能增益: 潜在增益在于提升特征池的信息密度和可解释性，让 LGB/Linear/MLP/LLM 因子管线都能共享同一套高频行为表达。

## 本周高分来源

- `34` [中信建投：从分钟频到 Level2 的市场微观结构研究](https://view.inews.qq.com/a/20251217A01V3A00) — 中文券商高频与市场微观结构精选; 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态; LLM 因子生成, 高频数据特征工程
- `32` [TLOB / MLPLOB：基于 LOB 数据的 MLP 与双注意力 Transformer 趋势预测](https://arxiv.org/abs/2502.15757) — 模型与金融时序预测精选; 模型训练 / 序列预测, 数据坐标 / 高频状态, 评估审计 / 可比性; MLP 时序预测, LLM 因子生成
- `29` [国信证券：高频订单成交数据中的 Alpha 信息](https://www.fxbaogao.com/detail/4095774) — 中文券商高频与市场微观结构精选; 因子生成 / 表示学习, 高频特征工程, 数据坐标 / 高频状态; 高频数据特征工程, LLM 因子生成, 数据 sidecar / 高频衍生数据
- `29` [Deep Limit Order Book Forecasting：深度限价订单簿预测与 LOBFrame 基准](https://arxiv.org/abs/2403.09267) — 模型与金融时序预测精选; 数据坐标 / 高频状态, 模型训练 / 序列预测, 因子生成 / 表示学习; LLM 因子生成
- `29` [开源证券订单流系列：挂单方向长期记忆性的讨论与应用](https://www.fxbaogao.com/detail/4339762) — 中文券商高频与市场微观结构精选; 数据坐标 / 高频状态, 高频特征工程; 数据 sidecar / 高频衍生数据, 高频数据特征工程, LLM 因子生成
- `29` [LiT：用结构化 patch 捕捉 LOB 空间与时间依赖的 Transformer](https://www.frontiersin.org/journals/artificial-intelligence/articles/10.3389/frai.2025.1616485/full) — 模型与金融时序预测精选; 数据坐标 / 高频状态, 模型训练 / 序列预测; LLM 因子生成, MLP 时序预测
- `28` [开源证券：市场微观结构观察与 2023 年以来的高频因子回顾](https://www.fxbaogao.com/detail/4984776) — 中文券商高频与市场微观结构精选; 因子生成 / 表示学习, 数据坐标 / 高频状态; LLM 因子生成
- `27` [国信金工：基于主动买卖特征的高频订单因子改进](https://finance.sina.com.cn/roll/2024-08-20/doc-inckfzcs5651129.shtml) — 中文券商高频与市场微观结构精选; 高频特征工程, 数据坐标 / 高频状态, 因子生成 / 表示学习; 高频数据特征工程, 数据 sidecar / 高频衍生数据, LLM 因子生成
- `27` [基于注意力的限价订单簿阅读、突出与预测](https://arxiv.org/abs/2409.02277) — 模型与金融时序预测精选; 模型训练 / 序列预测, 数据坐标 / 高频状态; MLP 时序预测, LLM 因子生成
- `26` [阳光下还是阴影中交易：Hyperliquid 上的市场冲击与逆向选择](http://arxiv.org/abs/2606.15715v1) — arXiv 高频时序预测; 数据坐标 / 高频状态, 评估审计 / 可比性; LLM 因子生成
- `24` [宏观感知时序预测：层次化混频注意力模型](https://openalex.org/W7163598426) — OpenAlex 语义论文检索; 模型训练 / 序列预测, 因子生成 / 表示学习, 数据坐标 / 高频状态; MLP 时序预测
- `23` [双分支自监督学习识别市场操纵：融合频域异常合成与领域特征](https://doi.org/10.1016/j.ipm.2026.104961) — OpenAlex 语义论文检索; 评估审计 / 可比性, 模型训练 / 序列预测, 数据坐标 / 高频状态; 回测与可比性审计, Linear/Ridge baseline, LLM 因子生成
- `21` [Chain-of-Alpha：基于 LLM 的公式化 Alpha 自动挖掘框架](https://www.researchgate.net/publication/394426875_Chain-of-Alpha_Unleashing_the_Power_of_Large_Language_Models_for_Alpha_Mining_in_Quantitative_Trading) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习, 评估审计 / 可比性; LLM 因子生成, 回测与可比性审计
- `20` [LLM 驱动的稳健自动特征工程](https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5124841) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习, 高频特征工程; LLM 因子生成, 高频数据特征工程
- `20` [FactorMAD：基于 LLM 多智能体辩论的可解释 Alpha 因子挖掘](https://dl.acm.org/doi/10.1145/3768292.3770377) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习; LLM 因子生成
- `19` [AlphaAgent：带正则化探索的 LLM Alpha 挖掘](https://arxiv.org/abs/2502.16789) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习; LLM 因子生成
- `19` [面向稀疏组合优化的进化式 LLM Alpha 因子发现](https://openreview.net/forum?id=Zs3ZXwfaIu) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习; LLM 因子生成
- `17` [LLM 自动策略发现：风险感知多智能体生成可执行 Alpha 因子](https://aclanthology.org/2025.findings-emnlp.1005/) — AI 辅助因子生成与回测方法精选; 因子生成 / 表示学习, 评估审计 / 可比性; LLM 因子生成
- `13` [人机混合金融：从 AI 工具到决策系统](https://doi.org/10.1186/s40854-026-00941-w) — OpenAlex 语义论文检索; 数据坐标 / 高频状态, 评估审计 / 可比性, 因子生成 / 表示学习; 
- ` 9` [LENS：面向金融时序探索的大规模预训练 Transformer](https://arxiv.org/abs/2408.10111) — 模型与金融时序预测精选; 模型训练 / 序列预测; MLP 时序预测

## 人工 Review Checklist

- 是否明确 `t` 时刻可见信息和预测 horizon？
- 是否只是已有 OB/SF/PLM/CS 的 rolling-window 变体，还是新增了观察坐标？
- 是否能沉淀为高频数据特征工程模板，例如订单不平衡、主动买卖、价格层记忆、事件时间或盘口形态？
- 应作为 predictor、gate/context、normalizer 还是 evaluation audit？
- 是否存在版权、付费源或全文再分发风险？