【学术快讯】alphadev 重磅亮相,打破多年计算瓶颈-z6尊龙旗舰厅

【学术快讯】alphadev 重磅亮相,打破多年计算瓶颈
415
2023-06-13 10:00:36
13
0
4
用微信扫描二维码

6月8日,deepmind 在著名学术刊物 nature 上,发表了其最新研究成果:一个名为 alphadev 的 ai 系统。alphadev不仅可以将排序算法提速70%,甚至在有的算法上,能比人类快3倍之多。十多年来,c 排序库首次更改。ai优化世界代码,又达新里程碑。

图片

从名字上便可以看出,alphadev 与 alphago、alphafold 一样,同属 deepmind 旗下的 alpha 系列,而 alphadev 的发布也同样在业界引起了广泛关注。

具体来说,alphadev 是一种通过强化学习来发现增强的计算机科学算法的 ai 系统,它发现了一种更快的排序算法,直接超越了科学家和工程师们几十年来的研究,将排序算法的速度提高了 70%!

deepmind 计算机科学家 daniel mankowitz 更是表示:“我们估计,alphadev 发现的排序算法和哈希算法每天都会被调用数万亿次。”

强化学习,打破计算瓶颈

既然 alphadev 发现的是一种全新的排序算法,那我们便先从“排序”说起。

不论是将 3 个字母按字母顺序排列、将 5 个数字从大到小排列,亦或是将一个有上百万条记录的数据库进行排列,这都是排序,是一种几乎所有关键软件的基础算法。在 20 世纪 50 年代之前,排序工作多数都依赖人工,直至后来商业计算机兴起,最早用于排序的计算机科学算法才开始出现并发展。

如今,开发者们所用的排序技术和算法,都是过去几十年计算机科学家和程序员们积累下来的研究成果。相较于几十年前的手动排序,现在的算法确实已经很高效,但也正因如此,想要将其进一步改进无疑是一项重大挑战,难度不亚于“找到一种新的节电方式”或“发现一种更有效的数学方法”。当前,gpt-4、bard等大模型的参数指数级增长,对算力等资源的需求不断增长。而过去50年里,人类不断依靠芯片的改进以跟上步伐。但随着微芯片接近物理极限,改进代码让计算更强大、更持续变得至关重要。尤其是,对每天运行数万亿次代码的算法愈重要。

因此,deepmind 在论文中提到:“人类的直觉和专业知识对于改进算法至关重要。然而,许多算法已经到了人类专家无法进一步优化它们的阶段,导致计算瓶颈不断扩大。”

alphadev发现了一种更快的排序算法,数十亿人每天都在不知不觉中使用这些算法。它们是一切的基础,从在线搜索结果,社交帖子,到计算机和手机数据处理方式。这些算法每天都要执行数万亿次。利用ai生成更好的算法,将改变我们对计算机编程的方式,并影响我们数字化社会的方方面面。根据nature论文中的数据,alphazero所创造的算法能比人类的数据排序速度快三倍。

图片

今天,google deepmind还开源了在主c 库中的最新排序算法,所有人皆可用。

开源地址:

打破传统,从汇编指令入手

为了帮助打破这一计算瓶颈,deepmind 引入了 alphadev, alphadev的创新意义在于,它并不是通过改进现有算法,而是完全从头开始发现了更快的算法。而且,它竟然着手于大多数人类并没有想到的地方——计算机汇编指令。汇编指令用于创建二进制代码。虽然开发者写代码时用的是c 等高级语言,但为了让计算机理解,这些高级语言必须翻译成「低级」的汇编指令。

图片

以此作为灵感,deepmind 认为相较于在高层次的编码语言中,在汇编指令这个较低的层次上,应该还存在许多改进空间,而这些改进在更高级的编程语言中可能很难发现。因为计算机的存储和操作会更灵活,如果再多做一些潜在的改进,对速度和能源使用也将产生更大影响。

通过玩“游戏”来发现新算法

众所周知,deepmind的强化学习模型,在围棋、国际象棋和将棋等游戏中,屡次击败世界冠军。而我们这次的主角——alphadev,基于的正是alphazero。alphadev的工作方式与之前的alphazero相似,后者结合了计算机推理和直觉,在棋盘游戏中选择每一步的走法。只不过,alphadev并不会选择下一步怎么走棋,而是选择添加哪些指令。

为了训练alphadev来发现新的算法,deepmind 让 alphadev 开始了一个单人“汇编游戏(assembly game)”。

根据论文介绍,在这个游戏中,玩家需要选择一系列低级汇编指令,以此产生一种新的高效排序算法:“这个游戏很有挑战性,因为玩家需要考虑汇编指令的组合空间,以产生一种既可证明正确又快速的算法。难度不仅来自搜索空间的大小,可能的组合数量类似于国际象棋和围棋,而且其中一条不正确的指令都可能会使整个算法无效。”

在游戏过程中,alphadev 每玩一次 assemblygame,都会从头开始构建一个汇编程序,从一组初始无序的指令开始构建,从而定义一种新的高效算法。

图片

随着游戏的进行,算法不断建立,而 alphadev 会通过比较算法的输出和预期的结果来检查它是否正确。对于排序算法,alphadev 的检验方式是:输入无序的数字后,可否输出正确排序的数字。

deepmind 将游戏的输赢作为 alphadev 的激励方式,而该游戏的输赢也很好判定:

▶ 使用汇编指令,生成正确的低延迟算法,alphadev 即赢得游戏。

▶ 生成不正确的算法或正确但低效的算法,alphadev 即输掉游戏。

新排序算法,速度提升 70%!

于是,在这样的“游戏”过程中,alphadev 发现了更快的排序算法,主要是围绕 3-5 个元素的较短序列的排序算法。

deepmind 解释道:“因为这些算法是使用最广泛的算法之一,它们经常作为较大排序函数的一部分被多次调用,改进这些算法可以加快对任意数量项目进行排序的整体速度。”

因而,alphadev 发现的这个新排序算法,对于较短的序列来说,速度可提升 70%,对于超过 25 万个元素的序列来说,速度也能提高约 1.7%。

为了让更多人用到这个新排序算法,deepmind 对算法进行了逆向工程,并以此改进了 llvm libc 标准排序库,可供全球数百万开发者和公司使用。deepmind 计算机科学家 daniel mankowitz 激动表示:“这些算法目前位于 c 标准排序库中,这是十多年来对这些子例程的首次更改!”

图片

新哈希函数,速度提升 30%!

除了新排序算法,通过研究 alphadev 的发现过程,它实际上还创造了一种新方法:其排序算法包含新的指令序列,每次应用时都会跳过一条指令——对于每天都会被使用上万亿次的排序算法来说,这无疑将产生巨大影响。

deepmind 研究人员将此称作 “alphadev 交换和复制动作(alphadev swap and copy moves):通过交换和复制移动,alphadev 跳过了一个步骤,以一种看似错误实际上很快捷的方式连接项目。“这显示了 alphadev 发现原始z6尊龙旗舰厅的解决方案的能力,并挑战了人类改进计算机科学算法的思考方式。”

如下图示例原始sort3实现,有min(a, b, c),使用alphadev swap move,alphadev发现,你只需要min(a, b)。

图片

再比如,原始实现用max(b, min(a ,c, d))中较大的排序算法对8个元素进行排序。alphadev发现使用其「swap and copy moves」时只需要max(b, min(a, c))。

图片

不仅如此,在发现了新排序算法后,deepmind 还测试了 alphadev 是否可以改进数据结构中常用的哈希算法,结果 alphadev 不负众望,确实也发现了一种新的哈希算法,将其应用于 9-16 字节范围内的哈希函数时,速度可提高 30%。而这个新哈希算法,也会在今年被发布到开源的 abseil 库中,供全球数百万开发者使用。

用 ai 来优化代码的未来

通过以上新发现的排序算法和哈希算法,alphadev 已展示出了其概括和发现新算法的能力,即用 ai 来优化世界上的代码,并朝着开发通用 ai 工具迈出了重要一步。google deepmind认为,alphadev是朝着开发agi工具迈出的一步,这些工具有助于优化整个计算生态系统,还能解决其他有益于社会的问题。

不过,研究人员也承认,目前alphadev在低级汇编指令优化能力非常强,但是随着算法的发展也存在局限性。为了让开发者更可用,alphadev用高级语言(如c )优化算法的能力正在探索中。alphadev的新发现,如「alphadev swap move」和「alphadev copy move」,不仅表明它可以改进算法,还可以找到新的z6尊龙旗舰厅的解决方案。研究人员希望,这些发现能激励研究人员和开发人员创造技术和方法,进一步优化基础算法,以创建一个更强大、更可持续的计算生态系统。

参考链接:

标签: alphadev deepmind 排序算法

scholat.com 学者网
免责声明 | 关于z6尊龙旗舰厅 | 用户反馈
联系z6尊龙旗舰厅:
网站地图