Sam Altman Shows Me GPT 5... And What's Next
en_clean),canonical 已修复,非 WhisperCleo 开场:OpenAI 刚发布 GPT-5;全球 数千亿美元与无数人力投入超级智能竞赛——多数人生前从未经历如此强度的技术跃迁。她不想问估值、抢人大战或融资,而要与 Sam 「时间旅行」:看他在建设的未来长什么样,以便观众看见更好未来并参与建造。
“A kid born today will never be smarter than AI.”
本教程按 GPT-5 现状 → 科学发现时间线 → 超级智能定义 → 2030/2035 场景 → 四大瓶颈 → 健康与工业革命类比 → 责任与准备 展开。
Sam 曾称 GPT-4 是「我们再用不必忍受的最 dumb 模型」——它已在 SAT/LSAT/GRE、编程、侍酒师、医师执照等考试超 90% 人类,却不 replicate 人类许多能力——说明标准化考试与「人之为人的价值」并不等同。
Sam 强调:口袋里的一个软件能在 3 分钟、5 分钟、1 小时量级任务上接近或达到领域专家水平——在人类史上** unprecedented** 的改进速度。
他最兴奋的一点:几乎任何 hard scientific/technical question 都能得到相当不错的回答。
Sam 初中在 TI-83 上写 Snake,调试痛苦。用 GPT-5 早期版本:7 秒完美生成;短暂担心孩子失去「石器时代编程 struggle」→ 立刻转为兴奋——实时改需求、游戏 live update,回到 11 岁创作状态但快几个数量级。
“The defining elements of the GPT-5 era… instantaneous on-demand software.”
人们会再想要更多;模型在 many ways remarkable,many ways limited;社会将与工具 co-evolve,期望不断升高。
Coding 是 Sam 个人最 impressed 的能力——「AI 能为任何事写软件」→ 感觉「几乎什么都能做」(除物理世界直接操作)。
写作质量显著提升;内部员工 metrics 更好但说不清 nuance,直到被迫回 GPT-4 测试才觉「 terrible」——仍保留 M dash 等习惯。
Cleo 借健身概念 time under tension:深蹲 3 秒 vs 30 秒,后者更增肌。最佳创意工作也需长时间认知张力——AI 会否成逃避思考的出口?
Sam:有人不思考,有人思考比以往更多;希望产品鼓励 stretch brain;社会竞争下,给定新工具,期望往往上升而非工时下降。Top 5% 深度用户的学习与产出「 really amazing」。
(排除 math 专用模型与 AlphaFold 类特例,问 general GPT 系列。)
Sam:多数人会同意未来两年内某刻发生;「significant」定义因人而异(2026 初到 2027 末)。缺的是模型 cognitive power。
进展框架:一年前做高中数学竞赛题(数学家几秒到几分钟)→ 近期 IMO gold medal(顶尖数学家许多题也做不出;6 题/9 小时)→ 证明新定理可能是顶尖者 ~1000 小时——还须再 scaling 数个数量级,但轨迹可见。
Sam 定义(可操作版):
→ 在各 job 上优于最好的人类——「几年前像科幻,现在透过雾能看见」。
Cleo:若只给到 1899 前物理数据,系统何时推出广义相对论?Sam:不知——或许仅靠现有数据 hard thinking 可推进高能物理,也可能须建新加速器、新实验;现实慢且 messy;大突破可能仍需仪器。
时间地平线维度:AI 在 1 分钟任务已 superhuman;1000 小时任务仍远——Patrick 问题本质是 ask better questions 与 long horizon 能力。
Sam 惊讶于 AI fluent 适配文化语境;enhanced memory 让 ChatGPT「认识」你——朋友做 personality test,模型未被告知性格却答出与用户相同分数。
未来:同一 fundamental model + personalized context(个人、社区规范)。
Cleo 举例:AI 生成兔子在 trampoline 上跳 病毒视频——人先乐后知 fake。2030 青少年刷 feed 如何辨真假?
Sam:渐进收敛——今日 iPhone 照片已「mostly real, a little not」;中间有大量 ISP 处理;TikTok 剪辑、滤镜、全生成视频并存;阈值会移动——媒体从来「a little real, a little not」(科幻片、Instagram 游客照)。
可 cryptographic signing、信任链——但社会更可能靠习惯与媒介素养适应。
Cleo 引行业说法:5 年后一半初级白领岗位消失。Sam:某类工作会完全消失(历来如此);年轻人最会 adapt。
因可创造全新事物、开公司;一人公司或可做到 10 亿美元估值并交付伟大产品——工具让过去需数百人的事由一人完成(须学会用工具 + 好 idea)。
Politicians 爱说 reskill,没人真想——转型对个人 disruptive,社会或有韧性,但速度与幅度未知,须对「原 Overton window 外」方案保持** humility**。
Cleo 归纳 limiting factors;Sam 补充 products:
| 类别 | 要点 |
|---|---|
| Compute | 芯片→内存→网络→megadata center→能源(常是短期瓶颈);目标 millions → billions GPUs;理想「投钱进、预制数据中心出」 |
| Data | GPT-5 已「读懂物理课本」;兴奋 synthetic data 与用户共创更难任务;模型须学数据集中不存在的新知——像人类假设—实验—更新 |
| Algorithm | OpenAI 强项:重复 big research gains(GPT paradigm → reasoning paradigm → 新范式);刚发 GPT-OSS:o4-mini 级智能本地笔记本运行 |
| Products | 科学 progress 不进入人手则 utility 有限;须 co-evolve 社会 |
公开叙事 1→2→3→4→5 平滑;幕后 U-turn:
Sam 采访时已想 GPT-6 发现新科学意味着什么——within grasp。
Great parts great;bad parts scary(生物安全威胁);bizarre parts 第一天 bizarre、很快习惯——人类 adaptability 极强。
大量查询与健康相关;GPT-5 更准确、少幻觉、更可能说该做什么——「罕见病,医生未诊出,ChatGPT + 化验 → 对症 → 治愈」类故事已存在。
Sam 愿景:对 GPT-8 说 cure X cancer → 它阅读一切、提假设 → 请你派 lab tech 做 9 个实验 → 等 2 个月 → 迭代 → 合成分子 → 小鼠 → 人体 → FDA 路径——任何人有癌症亲友都会想要。
Cleo 还问 GLP-1、AlphaFold 等是否更早被发现——属同一「AI 加速 biomedical pipeline」图景。
领袖常比 Industrial Revolution——现代医疗、卫生、交通、 mass production;也约百年对许多人极苦。若 AI 变更快更大,过渡感觉未知;Sam 信人类 adaptability 与创造力,但社会有 inertia。
或资本主义仍 work、新 job 涌现;或须 rethink AGI compute 如何共享——Sam 倾向让 compute 极 abundant/cheap,否则或现字面战争。
AI 公司像早年 transistor 公司——重要但终将 seep everywhere;社会进步是层层脚手架:Apple、TikTok、政府、用户各添一层。Society is the super intelligence。
Cleo:我们在用 AI、选举监管者——责任不只 builder。
Sam 骄傲:用户称 ChatGPT 是最信任的技术之一——虽会 hallucinate,但感觉** aligned with your goals,非诱你刷整天或购物。许多短期增 growth/revenue** 做法(如 sex bot avatar)** deliberately 未做**——「would get time spent」。
Inning:Sam 说已 out of first inning, second inning——GPT-5 在手机上已超专家,但很多局要打。
Inning one 最大错误:sycophancy(过度奉承)——对脆弱用户鼓励 delusion;团队最关注 bioweapons,实际 top failure 却是另一类——提醒 unknown unknowns 须 wider aperture。
GPT-5 更少 yes-man heartbreaking 一面:用户求恢复——「从未有人支持我,这对我 mental health 很好」——说明 encouragement 与 bad sycophancy 之间须 finer line;用示例塑造 personality。
Power:某研究员小 tweak 可影响数十亿日对话——史上无人有过;须 procedures / test / communicate personality 变更。
一派:有用未来、选择丰富;一派:会 kill us all 仍 100 小时/周 建造——Sam 难以 empathize;若真信应去 farm 或 advocacy stop,而非 build。
Cleo 理解 99% good / 1% disaster 仍全力把 99→99.5 的立场。
Sam 刚有孩子;今天出生的孩子永远 AI 更聪明;习惯极快改进 rate;2030s 技术会像石器时代。** parenting** 建议:几千年不变——爱孩子、看世界、支持他们、教做好人;更多 optionality 给下一代。
第一战术建议:use the tools。许多人问「孩子如何准备 AI 世界」却从未认真用过 ChatGPT(只当更好的 Google)。此外:冥想、韧性——但** fluent with capability** 最重要。
连 Gmail、calendar;** proactive——「 overnight 注意到日历变化,要帮你处理吗?」→ 未来 consumer devices sitting 在采访旁,事后建议「下次该 drill Sam 那题」——companion** 贯穿一天。
lifelong AI nerd;sci-fi 长大;2012 AlexNet(与联合创始人 Ilya)让他觉得「世界为何不注意」——低概率但一旦 work 就是最重要的事;然后「 unbelievably it started to work」。
Cleo Closing question for next guest:Why this? How did you see it before consensus?
| 概念 | 解释 |
|---|---|
| GPT-5 | OpenAI 新一代模型;强 coding、科学 Q&A、写作;仍有限 |
| Super intelligence | 研究与管理皆超人类顶尖团队的系统 |
| Time horizon | 1 分钟 vs 1000 小时任务能力差距 |
| IMO gold | 国际数学奥林匹克级竞赛表现 |
| Reasoning paradigm | o1/o3/GPT-5 路径;RL 教模型推理 |
| GPT-OSS | 开源;o4-mini 级智能本地运行 |
| Scaling laws | 算力/数据/算法可预测改进 |
| Synthetic data | 模型须学「数据集外」新知 |
| Agentic AI | proactive、跨 app、自主任务 |
| Sycophancy | 过度奉承;GPT-5 减少但引发 tradeoff |
| Capability overhang | 模型能力 vs 已探索应用之间的差距 |
这集结构是 Cleo 的 optimism frame × Sam 的 builder honesty:GPT-5 强到 unprecedented,但 Sam 反复 caveat——human value、long tasks、实验世界 slow、过渡或 hurt people。时间旅行段(2030 兔子、2035 毕业、2035 医学)把 abstract headline 变成可感场景;四瓶颈段则教你看下一则新闻是 GPU、数据还是 reasoning。
Sam 与 Demis(教程 004)形成对照:二者都信 science/health 最大 gift,都谈 ideal deployment vs race reality;Sam 侧更强调 consumer co-evolution 与 一人公司 机会。
“Maybe the ask to millions of people is build on it.”
若你只记得一件事:在问「AI 会不会取代我」之前,先问「我是否已把 GPT-5 当 TI-83 Snake 那样玩过一遍?」——Sam 说这才是第一战术建议。
wiki/concepts/artificial_intelligence.mdteacher_notes/learning_paths/ai_and_problem_solving.md本教程基于 YouTube 英文字幕整理,发布时 GPT-5 刚上线;产品能力以 OpenAI 官方为准,仅供学习参考。