00:00 / 07:26
连播
清屏
智能
倍速
点赞1725
00:00 / 11:13
连播
清屏
智能
倍速
点赞1409
00:00 / 04:25
连播
清屏
智能
倍速
点赞36
从0到 1 搭建一套真正可用的因子体系🪜 很多量化同学一提因子库,第一反应是: 👉 我现在有多少个因子? 但做得越久你会越发现: 因子库的核心,从来不是数量,而是体系。 🔹 什么才是真正的因子库? 因子库 ≠ 一堆 Excel / Python 脚本 一个合格的因子库,至少要回答 4 个问题: 因子是怎么来的? 有没有未来函数? 不同市场环境下是否稳定? 能不能被长期维护和复现? 如果答不上来,那更像是「研究素材」,而不是「生产系统」。 🔹 因子库一定要分层 从零搭建,我强烈建议把因子库拆成三层: 1️⃣ 数据层 行情、财务、行业、停复牌、交易日历…… 👉 所有数据,必须严格对齐“当时是否可得”。 2️⃣ 特征层 收益率、波动率、换手、估值、财务比率等 目标是:干净、稳定、可复用 3️⃣ 因子层 因子 = 特征 + 规则 + 变换 去极值、标准化、中性化、参数版本 👉 因子一定是“有定义、有版本”的对象 🔹 因子工程的关键,不是多,而是统一 很多人一开始就想造 500 个因子, 但更重要的是先做这两件事: ✅ 每个因子都能一句话说清楚 ✅ 所有因子走同一套后处理流水线 否则因子之间根本不可比。 🔹 评估因子,别只盯着收益 一个因子能不能进因子库, 不是看某次回测赚不赚钱,而是看: IC 是否长期稳定、牛熊阶段是否有效、是否过度暴露行业/市值、换手和交易成本是否可接受、是否和已有因子高度相关 收益好但不可控的因子,更像研究样本,而不是生产因子。 🔹 因子库不是终点,而是开始 真正成熟的因子库,还一定包括: 因子注册表(谁做的、用的什么、什么版本)、严格的版本管理、覆盖率、分布、IC 的持续监控和回滚机制。 因子是资产,是要长期维护的。 ✅ 一句话总结 搭建因子库,本质上不是在找“神因子”,而是在构建一套让普通因子也能长期发挥价值的系统。 #量化投资 #因子研究 #因子库 #量化工程 #系统化投资
00:00 / 02:37
连播
清屏
智能
倍速
点赞538
00:00 / 00:50
连播
清屏
智能
倍速
点赞1
玉鼎5天前
1. 确立投资理念与市场机会 · 量化投资经理基于公开信息,运用因子模型构建未来收益预测框架。 · 识别并定义可捕捉的具体市场机会是投资经理的核心职责。 2. 数据获取与处理 · 此环节通常最为耗时,核心工作包括:建立数据库、对不同来源的数据进行映射与整合、评估数据可用性、实施数据清洗与质量校验,并将原始数据转化为可分析的结构化格式。 数据类别概览 最常用的数据类型通常包括: · 公司映射数据:用于长期、跨数据供应商地追踪公司标识与信息。 · 公司基本面数据:如财务报表数据。 · 调查数据:如分析师预测、消费者信心指数等。 · 另类数据: · 包括卫星图像、新闻情绪分析、供应链关系等非结构化信息。 · 机器学习的进步显著提升了对各类传统及另类数据的处理与分析能力,有助于策略绩效的提升。 3. 策略回测 · 目的:检验历史数据是否支持投资逻辑或因子假设。 · 方法:通常通过分析一组证券的因子暴露度与其后续投资组合收益之间的相关性,来评估因子的历史表现。 · 逻辑:若因子暴露与未来收益存在稳定且显著的相关性,则表明该因子具备预测能力。 · 关键指标:该相关性系数被称为因子的信息系数,是量化评估因子预测能力的关键指标,其计算存在不同方法。 4. 策略评估 · 进行样本外测试,将模型应用于构建模型时未使用的数据,以验证模型的稳健性与泛化能力。 · 评估时需综合考察收益指标(如收益率)与风险指标(如风险价值、最大回撤等)。 5. 投资组合构建 · 在量化框架下构建投资组合,需特别关注以下两点: · 风险模型:用于估算组合整体风险,需纳入各资产持仓的个体风险(方差)以及资产间的相关性。 · 交易成本:需全面考量包括佣金、税费在内的显性成本,以及买卖价差、市场冲击等隐性成本。
00:00 / 02:06
连播
清屏
智能
倍速
点赞2
00:00 / 03:00
连播
清屏
智能
倍速
点赞20