核查方法论

预测如何被提取、分级、判定 — 全流程透明说明。

1️⃣ 数据来源

所有预测均来自财经 YouTuber 与微博大V 公开发布的内容：

下载频道公开视频音频与微博文本（仅用于内部分析，不二次分发）
用 Whisper / 字幕文件转写为文字稿
由大模型（Anthropic Claude Opus + OpenAI GPT）识别带时间+价格目标的预测语句

所有预测卡片都附带原视频/微博链接 + 时间戳，读者可自行回到原始内容核对。

2️⃣ 什么算"股票预测"

我们只收录满足以下条件的语句：

具体标的（个股代码、ETF、指数、加密货币、商品）
方向或目标价（看涨/看跌/中性 OR 明确价格目标）
时间窗口（具体日期或"年底前"、"半年内"等）
可核实（能用历史行情数据自动核对）
归属（主持人本人的前瞻判断，而非转述他人）

不收录：

无具体标的的泛泛之谈（"科技股表现会好"）
条件式预测（"如果 Fed 转向，那么..."）— 触发条件不可核实
纯规范性建议（"你应该买黄金"）— 无前瞻判断
无时间锚的"末日论"（"美元终将崩溃"）

3️⃣ 预测分级（按时间周期）

每条预测按持有时长分为三档：

短线（<60天）：周-月级别的技术面快速判断
中线（60-360天）：季度到年度的基本面/估值判断
长线（>360天）：多年成长股或宏观主题判断

分档保证不同评论员之间的可比性：一个技术派的短线胜率 ≠ 一个价值派的长线胜率。同档对比才公平。

4️⃣ 判定流程：四阶段

每条候选预测需通过四阶段才会公开发布：

提取（Opus）：Claude Opus 从字幕中识别候选预测，按 schema 填入 ticker / 方向 / 目标价 / 时限
复核（Opus）：二次审阅，剔除不符合"预测"定义的候选
对手审（GPT）：OpenAI GPT 从对立模型视角再次审阅，质疑提取结果
严格共识：只有两个模型都判同一结果的条目才会发布；分歧条目进入人工复核

这套流程的设计目的是降低单一模型偏见。

5️⃣ 行情自动核对

到期后，系统自动通过 yfinance API 拉取：

入场价：视频发布当日收盘价（或最接近的交易日）
出场价：到期日收盘价
盈亏百分比：(出场价 - 入场价) / 入场价（看跌方向反向计算）
相对基准：与 SPY 同期表现的差额（alpha）

"模拟盈亏"是一个简化的回测模型 — 假设每条预测视为 $1 仓位，在视频发布日开仓、到期日平仓。仅用于评估预测准确度，不构成投资建议。

6️⃣ 判定标签

🎯 应验：方向正确，到达目标价（或盈亏明显为正）
🤏 半应验：方向对，但程度不足或偏离目标
💸 翻车：方向错（亏损）或未达目标且时间已到
🔮 待审判：到期日尚未到

"翻车"是对预测内容的判定，不是对预测人的评价。

⚠️ 已知局限

语音转写可能存在错误，特别是英文混杂场景
大模型对"预测语义"的判断有边界 — 修辞性表达可能被误判
"$1 等权重"回测忽略了交易成本、滑点、止损/再平衡逻辑
使用收盘价为入场/出场参考 — 实际执行可能偏离
样本覆盖随时间扩展，早期数据集体量较小

所有这些局限都是可申请纠错的。详见 📮 纠错与联系。

🔗 更多

Maintained by VoxStar LLC · Last reviewed: 2026-05-26 · Errors: contact@truthtracking.org