Ruby 3.3.0-preview3 已发布

我们很高兴地宣布 Ruby 3.3.0-preview3 发布。 Ruby 3.3 新增了 Prism 解析器,使用 Lrama 作为解析生成器,新增了纯 Ruby 实现的 JIT 编译器 RJIT,另有许多性能改进,尤其是 YJIT。

Prism

  • 引入 Prism 解析器 为默认 gem
    • Prism 是一个可移植、容错且可维护的 Ruby 语言递归下降解析器
  • Prism 已可用于生产环境,并得到了积极维护,您可以使用它来代替 Ripper
    • 有关于如何使用 Prism 的 详细文档
    • Prism 既是 CRuby 内部使用的 C 库,也是任何需要解析 Ruby 代码的工具可以使用的 Ruby gem
    • Prism API 中值得注意的方法有:
      • Prism.parse(source) 返回 AST 作为 ParseResult 的一部分
      • Prism.dump(source) 将序列化的 AST 以字符串形式返回
      • Prism.parse_comments(source) 返回注释
  • 如果您有兴趣贡献,可以直接在 Prism 代码库 上提出拉取请求或报告问题

使用 Lrama 替代 Bison

RJIT

  • 引入了纯 Ruby 的 JIT 编译器 RJIT 并替代 MJIT。
    • RJIT 仅支持 x86_64 架构上的 Unix 平台。
    • 不同于 MJIT,RJIT在运行时不需要 C 编译器。
  • RJIT 目前仅用于实验目的。
    • 您在生产环境中应当继续使用 YJIT。
  • 如果您有兴趣为 Ruby 开发 JIT,请查看 k0kubun 在 RubyKaigi 第 3 天 中的演讲

YJIT

  • 相对于 3.2 的主要性能提升
    • 改进了 splat 和 rest 参数支持。
    • 虚拟机的栈操作分配了寄存器。
    • 更多带有可选参数的调用被编译。
    • 错误处理也被编译。
    • 拥有复杂对象形状的实例变量不再退出到解释器执行。
    • 不支持的调用类型不再退出到解释器执行。
    • 特别优化了 Integer#!=, String#!=, Kernel#block_given?, Kernel#is_a?, Kernel#instance_of?, Module#===
    • 目前比 optcarrot 的解释器快 3 倍以上!
  • 内存利用率相交 3.2 有显著提升
    • 编译代码使用的元数据使用更少的内存。
    • 在 ARM64 中的生成更紧凑的代码。
  • 编译速度现在略快于 3.2。
  • 新增 RubyVM::YJIT.enable 可以在运行时启用 YJIT
    • 您可以在不修改命令行参数或环境变量的情况下启用 YJIT。
    • 这也可以用于在应用程序启动完成后,仅启用 YJIT 一次。当您在启动程序时禁用了 YJIT ,您可以通过 --yjit-disable 来使用其他 YJIT 选项。
  • 提供了禁用代码 GC 的选项,并视 --yjit-exec-mem-size 为硬限制。
    • 可以在使用 unicorn 和进程 forking 的服务器上产生更好的写时复制行为。
  • 发布版本中,现在可以用到通过 --yjit-stats 产生的 ratio_in_yjit 统计信息,不再需要特殊的统计信息或开发版本。
  • 退出跟踪选项现在支持采样
    • --trace-exits-sample-rate=N
  • 新增 --yjit-perf 以便于利用 Linux perf 进行性能分析。
  • 更彻底的测试及多个错误修复

M:N 线程调度器

  • 引入了 M:N 线程调度器。[Feature #19842]
    • M 个 Ruby 线程由 N 个原生线程(OS 线程)管理,从而降低线程创建和管理成本。
    • 由于可能会破坏 C 扩展的兼容性,因此在默认情况下,主 Ractor 上禁用 M:N 线程调度器。
      • 可通过环境变量 RUBY_MN_THREADS=1 在主 Ractor 上启用 M:N 线程。
      • 非主 Ractor 上启用 M:N 线程。
    • 可通过环境变量 RUBY_MAX_CPU=n 设置 N 的最大值(原生线程的最大数量)。默认值为 8。
      • 由于每个 Ractor 中只能同时运行一个 Ruby 线程,因此将使用原生线程的数量,即 RUBY_MAX_CPU 和运行中的 Ractor 数量中较小的值。因此单 Ractor 应用程序(大多数应用程序)将使用 1 个原生线程。
      • 为了支持阻塞操作,可以使用多于 N 个原生线程。

其他值得关注的新功能

语言

性能提升

  • 根据对象形状,优化 defined?(@ivar)
  • 诸如 Socket.getaddrinfo 的域名解析现在可以被中断(在 pthreads 可用的环境中)。Feature #19965
    • 为此,现在每当调用 getaddrinfo 或 getnameinfo 时都会创建一个 pthread。 这会在域名解析中产生一些开销(在我们的实验中约为 2.5 倍)。 我们预计域名解析开销不会成为大多数应用程序的问题,但如果您观察到这种情况,或者您认为此更改造成了意外的影响,请向我们报告。
  • 新增环境变量 RUBY_GC_HEAP_REMEMBERED_WB_UNPROTECTED_OBJECTS_LIMIT_RATIOFeature #19571
  • 旧对象的子对象不再立即提升到垃圾收集器中的老一代。 功能 #19678
  • 垃圾收集器中添加了对弱引用的支持。 功能 #19783

自 3.2 以来,其他值得注意的变化

IRB

IRB 进行了多项增强功能,包括但不限于:

  • 高级 irb:rdbg 集成,提供了类似 pry-byebug 的调试体验(文档)。
  • lsshow_cmds 这样的方法提供分页支持。
  • lsshow_source 方法提供更准确更有用的信息。
  • 实验性的基于类型分析的自动补全功能(文档)。
  • 现在可以通过新引入的类 Reline::Face 来更改自动补全对话框中的字体颜色和字体样式(文档)。

另外,IRB 还进行了广泛的重构,修复了数十个错误,以便未来的增强。

兼容性问题

注意:不包括 bug 修复。

移除的常量

移除了以下已废弃的常量。

移除的方法

移除了以下已废除的方法。

移除的环境变量

下列废弃方法被移除

  • 环境变量 RUBY_GC_HEAP_INIT_SLOTS 被废弃,并不再产生实际作用。请使用环境变量 RUBY_GC_HEAP_{0,1,2,3,4}_INIT_SLOTS 进行替代。 Feature #19785

Stdlib 兼容性问题

ext/readline 已退役

  • 我们有了纯 Ruby 实现的 reline,兼容 ext/readline API。未来我们将依赖 reline。如果您需要使用 ext/readline,可以通过 rubygems.org 进行安装 gem install readline-ext
  • 我们不再需要安装类似 libreadlinelibedit 这样的库了。

C API 更新

更新的 C API

更新了以下 API。

已移除的 C API

移除了以下废弃的 API。

标准库更新

当用户 require 在将来 Ruby 版本中成为绑定 gem 的库时,RubyGems 和 Bundler 会发出警告。

这些库包括:

  • abbrev
  • base64
  • bigdecimal
  • csv
  • drb
  • getoptlong
  • mutex_m
  • nkf
  • observer
  • racc
  • resolv-replace
  • rinda
  • syslog

新增以下默认 gem。

  • prism 0.15.1

更新了以下默认 gems。

  • RubyGems 3.5.0.dev
  • base64 0.2.0
  • benchmark 0.3.0
  • bigdecimal 3.1.5
  • bundler 2.5.0.dev
  • cgi 0.4.0
  • csv 3.2.8
  • date 3.3.4
  • delegate 0.3.1
  • drb 2.2.0
  • english 0.8.0
  • erb 4.0.3
  • etc 1.4.3.dev.1
  • fcntl 1.1.0
  • fiddle 1.1.2
  • fileutils 1.7.2
  • find 0.2.0
  • getoptlong 0.2.1
  • io-console 0.6.1.dev
  • irb 1.8.3
  • logger 1.6.0
  • mutex_m 0.2.0
  • net-http 0.4.0
  • net-protocol 0.2.2
  • nkf 0.1.3
  • observer 0.1.2
  • open-uri 0.4.0
  • open3 0.2.0
  • openssl 3.2.0
  • optparse 0.4.0
  • ostruct 0.6.0
  • pathname 0.3.0
  • pp 0.5.0
  • prettyprint 0.2.0
  • pstore 0.1.3
  • psych 5.1.1.1
  • rdoc 6.6.0
  • reline 0.3.9
  • rinda 0.2.0
  • securerandom 0.3.0
  • shellwords 0.2.0
  • singleton 0.2.0
  • stringio 3.0.9
  • strscan 3.0.7
  • syntax_suggest 1.1.0
  • tempfile 0.2.0
  • time 0.3.0
  • timeout 0.4.1
  • tmpdir 0.2.0
  • tsort 0.2.0
  • un 0.3.0
  • uri 0.13.0
  • weakref 0.1.3
  • win32ole 1.8.10
  • yaml 0.3.0
  • zlib 3.1.0

以下默认 gem 成为绑定 gem

  • racc 1.7.3

更新了以下绑定 gems。

  • minitest 5.20.0
  • rake 13.1.0
  • test-unit 3.6.1
  • rexml 3.2.6
  • rss 0.3.0
  • net-imap 0.4.4
  • net-smtp 0.4.0
  • rbs 3.2.2
  • typeprof 0.21.8
  • debug 1.8.0

有关默认 gems 和 绑定 gems 的细节,可以参考 GitHub 上的发布,例如 logger gem 或相应的变更日志。

更多详情,可参见 NEWS提交日志

自 Ruby 3.2.0 以来,5207 个文件被更改,新增 284820 行(+), 删除 174773 行(-)!

下载

  • https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.tar.gz

    SIZE: 21550473
    SHA1: 2811f191d66dffee0206771873bd990857ae4ed6
    SHA256: 0969141be92e67e0edb84a8fb354acc98f01bd78e602a23a0f136045c82f4809
    SHA512: 94db07a6958c09809b2e5b597fa55a121074e8bacb3bf588c83cf0d35b07a8b070172035a49d1abf0d8ee364a9ace824f34e677f7327ffe1acdbab0938ac49c4
    
  • https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.tar.xz

    SIZE: 15970144
    SHA1: 496600612605f8ebeb955255e98bac73a4cbc045
    SHA256: f79afcf122dc7d04fe26cfa4436b9c488b21766fc54b0d2dfb2ba41cd0cdd355
    SHA512: d7ab0d703e7884efd31045933409cd68fac1d9941963537ccc8e309ca7c8bee8500a68182135acba22cbdbf4a8ae99f39bf7f0925273eb4fbc3728c0c1ba0c19
    
  • https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.zip

    SIZE: 26618303
    SHA1: 6a13e08c7e484d42037c1e2c87c5d0e220f893a0
    SHA256: c35bf637a647c2f60148368ffb374db5c258570911794f46b6dfdb98ebfe95d9
    SHA512: c4ef2cdcdadeb85ad1d42aedc97f9f3d609b3b01eea2319451cf92c81bd31ae8129b7c91fc68571469dd888c01ea0f48f73234b965db17f6a87404ca382f7794
    

什么是 Ruby

Ruby 最初由 Matz (松本行弘,Yukihiro Matsumoto) 于 1993 年开发,现在以开源软件的形式开发。它可以在多个平台上运行,并在全球得到广泛使用,尤其是Web开发领域。