核查方法论

预测如何被提取分级判定 — 全流程透明说明。

1️⃣ 数据来源

所有预测均来自财经 YouTuber 与微博大V 公开发布的内容:

  1. 下载频道公开视频音频与微博文本(仅用于内部分析,不二次分发)
  2. 用 Whisper / 字幕文件转写为文字稿
  3. 由大模型(Anthropic Claude Opus + OpenAI GPT)识别带时间+价格目标的预测语句

所有预测卡片都附带原视频/微博链接 + 时间戳,读者可自行回到原始内容核对。

2️⃣ 什么算"股票预测"

我们只收录满足以下条件的语句:

  • 具体标的(个股代码、ETF、指数、加密货币、商品)
  • 方向或目标价(看涨/看跌/中性 OR 明确价格目标)
  • 时间窗口(具体日期或"年底前"、"半年内"等)
  • 可核实(能用历史行情数据自动核对)
  • 归属(主持人本人的前瞻判断,而非转述他人)

不收录:

  • 无具体标的的泛泛之谈("科技股表现会好")
  • 条件式预测("如果 Fed 转向,那么...")— 触发条件不可核实
  • 纯规范性建议("你应该买黄金")— 无前瞻判断
  • 无时间锚的"末日论"("美元终将崩溃")

3️⃣ 预测分级(按时间周期)

每条预测按持有时长分为三档:

  • 短线(<60天):周-月级别的技术面快速判断
  • 中线(60-360天):季度到年度的基本面/估值判断
  • 长线(>360天):多年成长股或宏观主题判断

分档保证不同评论员之间的可比性:一个技术派的短线胜率 ≠ 一个价值派的长线胜率。同档对比才公平。

4️⃣ 判定流程:四阶段

每条候选预测需通过四阶段才会公开发布:

  1. 提取(Opus):Claude Opus 从字幕中识别候选预测,按 schema 填入 ticker / 方向 / 目标价 / 时限
  2. 复核(Opus):二次审阅,剔除不符合"预测"定义的候选
  3. 对手审(GPT):OpenAI GPT 从对立模型视角再次审阅,质疑提取结果
  4. 严格共识:只有两个模型都判同一结果的条目才会发布;分歧条目进入人工复核

这套流程的设计目的是降低单一模型偏见

5️⃣ 行情自动核对

到期后,系统自动通过 yfinance API 拉取:

  • 入场价:视频发布当日收盘价(或最接近的交易日)
  • 出场价:到期日收盘价
  • 盈亏百分比:(出场价 - 入场价) / 入场价(看跌方向反向计算)
  • 相对基准:与 SPY 同期表现的差额(alpha)

"模拟盈亏"是一个简化的回测模型 — 假设每条预测视为 $1 仓位,在视频发布日开仓、到期日平仓。仅用于评估预测准确度,不构成投资建议

6️⃣ 判定标签

  • 🎯 应验:方向正确,到达目标价(或盈亏明显为正)
  • 🤏 半应验:方向对,但程度不足或偏离目标
  • 💸 翻车:方向错(亏损)或未达目标且时间已到
  • 🔮 待审判:到期日尚未到

"翻车"是对预测内容的判定,不是对预测人的评价。

⚠️ 已知局限

  • 语音转写可能存在错误,特别是英文混杂场景
  • 大模型对"预测语义"的判断有边界 — 修辞性表达可能被误判
  • "$1 等权重"回测忽略了交易成本、滑点、止损/再平衡逻辑
  • 使用收盘价为入场/出场参考 — 实际执行可能偏离
  • 样本覆盖随时间扩展,早期数据集体量较小

所有这些局限都是可申请纠错的。详见 📮 纠错与联系

🔗 更多

Maintained by · Last reviewed: · Errors: contact@truthtracking.org