网问答>>Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser
问题
已解决

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

时间:2026-01-08 08:34:59
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser
最佳回答
Julian Schrittwieser 是谷歌 DeepMind Alpha 系列核心作者,在谷歌工作十年后宣布加入 Anthropic。 以下是关于他的详细介绍:个人背景:Julian Schrittwieser 在 DeepMind 内部地位非同寻常,是强化学习领域的大牛,也是 AlphaGo 的核心作者之一。在 DeepMind 的主要贡献:AlphaGo 相关:2016 年,参与撰写了第一篇关于 AlphaGo 的里程碑式论文,该论文记录了 AlphaGo 以 4:1 击败世界顶级围棋棋手李世石的事件。2017 年,作为 AlphaGo Zero 论文的第二作者,负责了从主搜索算法、训练框架到对新硬件的支持等工作。AlphaGo Zero 以 100:0 击败了早期的竞技版 AlphaGo。AlphaZero 相关:AlphaGo Zero 随后被拓展为 AlphaZero。2017 年底,DeepMind 正式发表了 AlphaZero,Julian Schrittwieser 参与了这一从零开始通过 Self-play 强化学习在多种任务上达到超越人类水平的算法的研发。该算法经过不到 24 小时的训练后,即可在国际象棋和日本将棋上击败此前业内顶尖的计算机程序,也轻松击败了训练 3 天时间的 AlphaGo Zero。MuZero 相关:2020 年,DeepMind 发表了 MuZero,Julian Schrittwieser 是论文《Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model》的核心作者之一。MuZero 在不具备任何底层动态知识的情况下,通过结合基于树的搜索和学得模型,不仅在国际象棋、日本将棋和围棋的精确规划任务中匹敌 AlphaZero,还在 30 多款雅达利游戏中展示出了超越人类的表现。AlphaCode 相关:2022 年 2 月,DeepMind 发布了基于 Transformer 模型的 AlphaCode,可以编写与人类相媲美的计算机程序。Julian Schrittwieser 是多位作者之一,后续又在《Science》上发表了论文。AlphaTensor 相关:2022 年 10 月,DeepMind 提出了 AlphaTensor,第一个可用于为矩阵乘法等基本任务发现新颖、高效且可证明正确的算法的人工智能系统,并揭示了 50 年来在数学领域一个悬而未决的问题。AlphaTensor 建立在 AlphaZero 的基础上,展示了 AlphaZero 从用于游戏到首次用于解决未解决的数学问题的一次转变。Julian Schrittwieser 是该项目的核心参与者之一。AlphaDev 相关:2023 年 6 月,谷歌 DeepMind 发布了 AlphaDev,这种全新的强化学习系统发现了一种比以往更快的哈希算法。Julian Schrittwieser 也是 AlphaDev 项目的核心参与者之一。AlphaProof 相关:2024 年 7 月,谷歌 DeepMind 团队研发的 AlphaProof 在 IMO 竞赛上共同实现了里程碑式的突破。AlphaProof 是一种用于形式化数学推理的强化学习系统。2016 年 AlphaGo 论文的核心成员 Julian Schrittwieser 如今也是 AlphaProof 的核心贡献者。加入 Anthropic 的原因及影响:Julian Schrittwieser 在宣布加入 Anthropic 时表示,自己被 Claude 不断提高的技能以及《Artifacts》和《Computer Use》深深震撼了。他的加入对 Anthropic 来说是一次“超值”的招聘,因为他在强化学习领域有着深厚的积累和卓越的贡献,有望带领 Claude 团队取得更多成果。有人认为,这或许就是 Claude 团队招揽 Julian Schrittwieser 的出发点,即利用他在强化学习领域的专长,进一步提升 Claude 的性能。
时间:2026-01-08 08:35:02
本类最有帮助
Copyright © 2008-2013 www.wangwenda.com All rights reserved.冀ICP备12000710号-1
投诉邮箱: