核查方法论
预测如何被提取、分级、判定 — 全流程透明说明。
1️⃣ 数据来源
所有预测均来自财经 YouTuber 与微博大V 公开发布的内容:
- 下载频道公开视频音频与微博文本(仅用于内部分析,不二次分发)
- 用 Whisper / 字幕文件转写为文字稿
- 由大模型(Anthropic Claude Opus + OpenAI GPT)识别带时间+价格目标的预测语句
所有预测卡片都附带原视频/微博链接 + 时间戳,读者可自行回到原始内容核对。
2️⃣ 什么算"股票预测"
我们只收录满足以下条件的语句:
- 具体标的(个股代码、ETF、指数、加密货币、商品)
- 方向或目标价(看涨/看跌/中性 OR 明确价格目标)
- 时间窗口(具体日期或"年底前"、"半年内"等)
- 可核实(能用历史行情数据自动核对)
- 归属(主持人本人的前瞻判断,而非转述他人)
不收录:
- 无具体标的的泛泛之谈("科技股表现会好")
- 条件式预测("如果 Fed 转向,那么...")— 触发条件不可核实
- 纯规范性建议("你应该买黄金")— 无前瞻判断
- 无时间锚的"末日论"("美元终将崩溃")
3️⃣ 预测分级(按时间周期)
每条预测按持有时长分为三档:
- 短线(<60天):周-月级别的技术面快速判断
- 中线(60-360天):季度到年度的基本面/估值判断
- 长线(>360天):多年成长股或宏观主题判断
分档保证不同评论员之间的可比性:一个技术派的短线胜率 ≠ 一个价值派的长线胜率。同档对比才公平。
4️⃣ 判定流程:四阶段
每条候选预测需通过四阶段才会公开发布:
- 提取(Opus):Claude Opus 从字幕中识别候选预测,按 schema 填入 ticker / 方向 / 目标价 / 时限
- 复核(Opus):二次审阅,剔除不符合"预测"定义的候选
- 对手审(GPT):OpenAI GPT 从对立模型视角再次审阅,质疑提取结果
- 严格共识:只有两个模型都判同一结果的条目才会发布;分歧条目进入人工复核
这套流程的设计目的是降低单一模型偏见。
5️⃣ 行情自动核对
到期后,系统自动通过 yfinance API 拉取:
- 入场价:视频发布当日收盘价(或最接近的交易日)
- 出场价:到期日收盘价
- 盈亏百分比:(出场价 - 入场价) / 入场价(看跌方向反向计算)
- 相对基准:与 SPY 同期表现的差额(alpha)
"模拟盈亏"是一个简化的回测模型 — 假设每条预测视为 $1 仓位,在视频发布日开仓、到期日平仓。仅用于评估预测准确度,不构成投资建议。
6️⃣ 判定标签
- 🎯 应验:方向正确,到达目标价(或盈亏明显为正)
- 🤏 半应验:方向对,但程度不足或偏离目标
- 💸 翻车:方向错(亏损)或未达目标且时间已到
- 🔮 待审判:到期日尚未到
"翻车"是对预测内容的判定,不是对预测人的评价。
⚠️ 已知局限
- 语音转写可能存在错误,特别是英文混杂场景
- 大模型对"预测语义"的判断有边界 — 修辞性表达可能被误判
- "$1 等权重"回测忽略了交易成本、滑点、止损/再平衡逻辑
- 使用收盘价为入场/出场参考 — 实际执行可能偏离
- 样本覆盖随时间扩展,早期数据集体量较小
所有这些局限都是可申请纠错的。详见 📮 纠错与联系。