00:00 / 02:00
连播
清屏
智能
倍速
点赞22
00:00 / 04:00
连播
清屏
智能
倍速
点赞0
00:00 / 00:42
连播
清屏
智能
倍速
点赞16
第4集:数据清洗与异常处理——量化策略的“地基” 很多人写量化策略,一上来就写指标、写模型。 结果回测很好,实盘全翻车。 最大的问题不是策略不好, 而是——数据不干净。 今天用 1 分钟讲清楚: 数据清洗怎么做,才能避免踩坑。 ⸻ ⭐ 第一步:先把“坏数据”捞出来 数据会出错: •缺失 •跳点 •闪崩 •价格、成交量突然异常 这些如果不处理, 模型会出现 虚假信号。 一句话判断: 数据看起来不正常,模型就不正常。 ⸻ ⭐ 第二步:怎么修正?三种实用方法 ✔ 缺失值处理 •用前一条数据填补,别留空 ✔ 异常点处理 •如果是单点跳动 → 用邻近值替换 •如果是连续异常 → 直接剔除那段 ✔ 闪崩/极端 •检查是否真实行情 •不真实 → 去掉 •真实 → 保留 关键不是完美,而是保持数据真实合理。 ⸻ ⭐ 第三步:不要过度修补 常见错误: 🚫 把数据修得“太好” 🚫 平滑到没有波动 🚫 正常极端波动被抹掉 结果是: 回测看着很完美,实盘不现实。 你的目标是: 数据干净,但保持真实市场性格。 ⸻ 量化策略的第一层地基是干净的数据。 数据不对,再好的模型也白搭。 先清洗,再建模。 明天第 5 集: 《如何做回测?最容易犯的几个大坑》 关注我,继续把量化系统搭完整。 本视频为原创作品,转载请注明出处 #期货 #交易认知 #趋势跟踪 #量化交易 #金融
00:00 / 01:45
连播
清屏
智能
倍速
点赞11
00:00 / 02:38
连播
清屏
智能
倍速
点赞NaN
垚垚20261周前
二、第二个信徒:矿机的运维日志与死亡警告 周雨薇第一次听说 “梦算力” 理论时,以为自己遇到了疯子。 她是斯坦福大学的睡眠神经科学博士,在《自然》子刊上发表过三篇关于梦境记忆编码的论文,是学界公认的年轻翘楚。那天她在旧金山参加学术会议,茶歇时被一个眼窝深陷、头发凌乱的中年男人拦住。 “周博士,我需要十分钟。” 男人递过来一张皱巴巴的名片,上面印着 “李昂,深蓝算法高级架构师”。 “如果是工作邀约,可以联系我的 ——” “不是工作。” 李昂打断她,声音压得很低,“是关于 REM 睡眠期脑电波同步异常的研究。我有数据,能证明人类的梦不是无序的,而是某种分布式计算的一部分。” 周雨薇的第一反应是荒唐。但出于学术礼貌(以及名片上 “深蓝算法” 这个金字招牌),她同意晚饭后在大堂吧 “聊十分钟”。 结果一聊就是三个小时。 李昂带来的不是论文,而是一个加密 U 盘,里面装着那个神经网络模型的全部数据、代码、以及他长达十一年的个人梦境记录 —— 精确到分钟的睡眠周期、心率变异、脑电采集(他用改装后的 VR 设备做成了简易脑电仪)、以及每次醒来后残存的梦境碎片。 “你看这里,” 李昂指着屏幕上的一段波形,“这是我女儿三岁时的梦话录音频谱。这个 17 赫兹的脉冲,在四个月里出现了十一次,每次都对应全球至少三个射电望远镜的异常信号。概率学上,这种巧合的可能性低于十亿分之一。” 周雨薇起初是抱着 “拆穿民科” 的心态,但越看越心惊。 数据太干净了,干净得不像造假。而且李昂提出的假说虽然惊世骇俗,逻辑链却异常完整:如果人类的梦真的是某种 “算力任务”,那么很多睡眠之谜就迎刃而解了。
00:00 / 01:49
连播
清屏
智能
倍速
点赞1