Ruby 3.2.0 RC 1 릴리스

Ruby 3.2.0-rc1 릴리스를 알리게 되어 기쁩니다. Ruby 3.2는 많은 기능과 성능 향상을 포함하고 있습니다.

WASI 기반 웹어셈블리 지원

WASI에 기반해 웹어셈블리를 지원하는 첫 이식판입니다. 이를 통해 CRuby 바이너리는 웹 브라우저, 서버리스 엣지 환경, 그 이외의 웹어셈블리/WASI를 사용 가능한 환경에서 동작할 수 있습니다. 현재 이 이식판은 스레드 API를 사용하지 않는 기본적인 테스트와 부트스트랩 테스트 스위트를 통과합니다.

배경

웹어셈블리(Wasm)는 본래 웹 브라우저에서 프로그램을 안전하고 빠르게 실행하기 위해서 만들어졌습니다. 하지만 그 목적 중 하나인 프로그램을 다양한 환경에서 안전하고 효율적으로 실행하는 것은 웹뿐만이 아니라 일반적인 애플리케이션도 바라던 것입니다.

WASI(The WebAssembly System Interface)는 이러한 용도를 위해 설계되었습니다. 이러한 애플리케이션은 운영체제와 통신해야 합니다만, 웹어셈블리는 시스템 인터페이스를 가지지 않는 가상 머신 위에서 동작합니다. WASI는 이 인터페이스를 표준화합니다.

Ruby의 웹어셈블리/WASI 지원은 이러한 프로젝트들을 활용하기 위함입니다. 이를 통해 Ruby 개발자들이 약속한 플랫폼에서 움직이는 애플리케이션을 작성할 수 있습니다.

사용 예시

이는 개발자가 웹어셈블리 환경에서 CRuby를 활용할 수 있도록 돕습니다. 하나의 예로, TryRuby playground의 CRuby 지원이 있습니다. 이제 CRuby를 웹 브라우저 상에서 직접 사용해볼 수 있습니다.

기술적인 부분

현재 WASI와 웹어셈블리 자체에는 Fiber, 예외 처리, GC를 구현하기 위한 일부 기능이 부족합니다. 이는 여전히 개발 중이라는 점도 있지만, 보안 때문이기도 합니다. 그래서 CRuby는 사용자 공간에서의 실행을 제어하기 위한 바이너리 변환 기술인 Asyncify를 사용해 그 차이를 메꿉니다.

나아가서 Ruby 앱을 간단하게 단일 .wasm 파일로 패키징할 수 있도록 WASI 상에 VFS를 구현했습니다. 이는 Ruby 앱의 배포를 쉽게 해줄 것입니다.

관련 링크

ReDoS에 대한 정규표현식 개선

정규표현식 일치는 기대와는 다르게 시간이 오래 걸리는 경우가 있습니다. 신뢰할 수 없는 입력에 대해서 비효율적일 가능성이 있는 정규표현식을 일치시키고 있다면, 공격자는 이를 이용해 효율적으로 서비스 거부 공격(이를 정규표현식 DoS, 또는 ReDoS라고 부릅니다)이 가능합니다.

ReDoS의 위협을 현저하게 완화할 수 있는 2개의 개선을 도입했습니다.

개선된 정규표현식 일치 알고리즘

Ruby 3.2부터 정규표현식 일치 알고리즘이 메모이제이션 기술에 의해 매우 개선됩니다.

# Ruby 3.1에서 10초가 걸리지만, Ruby 3.2에서는 0.003초가 걸립니다.

/^a*b?a*$/ =~ "a" * 50000 + "x"

이 개선된 알고리즘은 대부분의 정규표현식 일치(실험에서는 약 90%)가 선형 시간으로 완료됩니다.

이 최적화는 각 일치마다 입력의 길이에 비례하여 메모리를 소비할 수 있습니다. 이 메모리 확보는 필요할 때까지 발생하지 않으며, 일반적인 정규표현식 일치는 입력 길이에 비해 최대 10배 소비할 뿐이므로, 실상황에서 문제는 없을 것이라고 예상합니다. 만약 실제 애플리케이션에서 정규표현식 일치로 인한 메모리 부족이 발생하는 경우에는 보고해주세요.

기능 제안 티켓은 https://bugs.ruby-lang.org/issues/19104입니다.

정규표현식 타임아웃

위에서 설명한 최적화는 고급 기능(e.g. 역참조나 전후방탐색)이나 매우 큰 고정 회수 반복을 포함하는 정규표현식에서는 적용할 수 없습니다. 이러한 경우를 위한 방법으로, 정규표현식 일치에 타임아웃 기능이 추가되었습니다.

Regexp.timeout = 1.0

/^a*b?a*()\1$/ =~ "a" * 50000 + "x"
#=> Regexp::TimeoutError is raised in one second

Regexp.timeout은 전역 설정임에 주의하세요. 일부의 특수한 정규표현식에 대해서만 다른 타임아웃 설정을 사용하고 싶다면, Regexp.newtimeout 키워드를 사용할 수 있습니다.

Regexp.timeout = 1.0

# 이 정규표현식은 타임아웃 설정이 없습니다.
long_time_re = Regexp.new('^a*b?a*()\1$', timeout: Float::INFINITY)

long_time_re =~ "a" * 50000 + "x" # never interrupted

기능 제안 티켓은 https://bugs.ruby-lang.org/issues/17837입니다.

그 이외의 주목할 만한 새 기능

SyntaxSuggest

  • syntax_suggest(구 dead_end)의 기능이 Ruby에 통합됩니다. 이는 end가 빠져있거나, 하나 더 있을 때 발생하는 에러의 위치를 찾고 개발에 집중할 수 있도록 돕습니다. 예를 들어 다음과 같은 에러를 찾아줍니다.

    Unmatched `end', missing keyword (`do', `def`, `if`, etc.) ?
    
      1  class Dog
    > 2    defbark
    > 4    end
      5  end
    

    [Feature #18159]

ErrorHighlight

  • TypeError와 ArgumentError가 발생한 인수를 가리킵니다.
test.rb:2:in `+': nil can't be coerced into Integer (TypeError)

sum = ary[0] + ary[1]
               ^^^^^^

언어

  • 익명 나머지 인수, 익명 나머지 키워드 인수가 파라미터로서뿐만 아니라, 인수로서도 사용할 수 있게 됩니다. [Feature #18351]

      def foo(*)
        bar(*)
      end
      def baz(**)
        quux(**)
      end
    
  • 1개의 위치 인수와 나머지를 키워드로 받는 프록은 인수를 자동으로 전개하지 않습니다. [Bug #18633]

    proc{|a, **k| a}.call([1, 2])
    # Ruby 3.1 and before
    # => 1
    # Ruby 3.2 and after
    # => [1, 2]
    
  • 상수 대입에서의 상수 평가 순서가 단일 속성 대입 시의 평가 순서와 일관성을 가지게 됩니다. 다음 코드의 경우,

      foo::BAR = baz
    

    foo는 이제 baz보다 먼저 호출됩니다. 마찬가지로 상수의 다중 대입에서도 왼쪽에서 오른쪽으로 평가됩니다. 다음 코드의 경우,

        foo1::BAR1, foo2::BAR2 = baz1, baz2
    

    아래와 같은 순서로 평가됩니다.

    1. foo1
    2. foo2
    3. baz1
    4. baz2

    [Bug #15928]

  • 검색 패턴은 이제 정식 기능입니다. [Feature #18585]

  • *args와 같은 나머지 파라미터를 받는 메서드에서 foo(*args)를 통해 키워드 인수를 위임하고 싶은 경우, 반드시 ruby2_keywords를 사용해야 합니다. 다르게 말하면, *args를 사용해 키워드 인수를 위임하고 싶은 모든 메서드는 예외 없이 ruby2_keywords를 사용해야 합니다. 이 변경으로 라이브러리가 Ruby 3 이상을 요구하게 되었을 때 다른 위임 방식으로의 마이그레이션이 간단해집니다. 지금까지 메서드가 *args를 넘겨받았을 때, ruby2_keywords 플래그가 유지되었습니다만, 이는 의도치 않은 동작이었으며, 일관성이 없었습니다. 빠져있었던 ruby2_keywords를 찾아내기 위한 좋은 방법 중 한 가지로 테스트를 실행한 뒤, 실패하는 각각의 테스트에서 키워드 인수를 받는 마지막 메서드를 찾고, 그곳에서 puts nil, caller, nil를 사용하세요. 그리고 나서 호출 체인의 각 메서드/블록이 키워드를 위임할 때 ruby2_keywords를 올바르게 사용하고 있는지 확인하세요. [Bug #18625] [Bug #16466]

      def target(**kw)
      end
    
      # 의도치 않게 Ruby 2.7-3.1에서 ruby2_keywords 없이 동작했습니다만,
      # Ruby 3.2+에서는 ruby2_keywords가 필요합니다. ruby2_keywords를 사용하지 않는 경우,
      # #foo, #bar 양쪽에 (*args, **kwargs)나 (...)이 필요합니다.
      ruby2_keywords def bar(*args)
        target(*args)
      end
    
      ruby2_keywords def foo(*args)
        bar(*args)
      end
    
      foo(k: 1)
    

성능 향상

YJIT

  • YJIT은 x86-64와 arm64/aarch64 CPU에서 동작하는 Linux, MacOS, BSD, 그 외 UNIX 환경을 지원합니다.
    • 이번 릴리스는 Apple M1/M2, AWS Graviton, Raspberry Pi 4 ARM64 프로세서 등을 추가로 지원합니다.
  • YJIT을 빌드하기 위해서는 Rust 1.58.0 이상을 요구합니다. [Feature #18481]
    • CRuby를 YJIT과 함께 빌드하기 위해서는 1.58.0 이상의 rustc를 설치한 후 ./configure 스크립트를 --enable-yjit과 함께 실행해주세요.
    • 문제가 생긴 경우에는 YJIT 팀에 연락해 주세요.
  • JIT 코드의 물리 메모리는 지연되어 할당됩니다. Ruby 3.1과는 다르게, --yjit-exec-mem-size는 JIT 코드에 의해서 실제로 최적화될 때까지 물리 메모리 페이지에 할당되지 않기 때문에 Ruby 프로세스의 RSS는 최소화됩니다.
  • JIT 코드로 인한 메모리 소비가 --yjit-exec-mem-size에 도달했을 때 모든 코드 페이지를 할당 해제하는 코드 GC를 도입했습니다.
    • RubyVM::YJIT.runtime_stats는 기존의 inline_code_size, outlined_code_size에 더해 코드 GC 정보인 code_gc_count, live_page_count, freed_page_count, freed_code_size를 반환합니다.
  • RubyVM::YJIT.runtime_stats가 제공하는 통계 정보가 이번 릴리스부터 이용 가능합니다.
    • 통계 정보를 계산하고 얻기 위해서는 Ruby를 --yjit-stats와 함께 실행하세요(약간의 실행시간 오버헤드가 발생합니다).
  • YJIT은 객체 형상을 이용해 최적화합니다. [Feature #18776]
  • 상수를 무효화하는 단위를 작게 하여 새 상수를 정의할 때 더 적은 코드를 무효화합니다. [Feature #18589]

MJIT

  • MJIT 컴파일러는 표준 라이브러리 mjit으로 Ruby를 사용해 재구현되었습니다.
  • MJIT 컴파일러는 MJIT 워커에 의해 실행된 네이티브 스레드 대신 포크된 프로세스에서 실행됩니다. [[Feature #18968]]
    • 이 영향으로 Microsoft Visual Studio(MSWIN)가 더 이상 지원되지 않습니다.
  • MinGW는 더 이상 지원되지 않습니다. [[Feature #18824]]
  • --mjit-min-calls--mjit-call-threshold로 변경했습니다.
  • --mjit-max-cache의 기본값을 10000에서 100으로 되돌렸습니다.

PubGrub

  • Bundler 2.4는 Molinillo 대신에 PubGrub 의존성 해결기를 사용합니다.

    • PubGrub은 Dart 프로그래밍 언어의 pub 패키지 매니저에서 사용하고 있는 차세대 의존성 해결 알고리즘입니다.
    • 이 변경으로 지금과는 다른 해결 결과를 얻을 수 있습니다. 그런 경우에는 RubyGems/Bundler issues에 보고해 주세요.
  • RubyGems는 Ruby 3.2에서도 Molinillo를 그대로 사용합니다. 미래에 PubGrub으로 변경할 계획입니다.

3.1 이후로 주목할 만한 변경

  • Hash
    • Hash#shift는 이제 해시가 비어있다면 기본 값이나 기본 프록을 호출한 결과 값을 반환하는 대신 언제나 nil을 반환합니다. [Bug #16908]
  • MatchData
  • Module
  • Proc
    • Proc#dup은 서브클래스의 인스턴스를 반환합니다. [Bug #17545]
    • Proc#parameters는 이제 람다 키워드를 받습니다. [Feature #15357]
  • Refinement
  • RubyVM::AbstractSyntaxTree
    • parse, parse_file, oferror_tolerant 옵션이 추가되었습니다. [[Feature #19013]]
  • Set
    • Set은 이제 require "set"할 필요 없이 사용 가능한 내장 클래스입니다. [Feature #16989] 현재는 Set 상수를 사용하거나 Enumerable#to_set을 호출하면 자동으로 로드됩니다.
  • String
    • String#byteindexString#byterindex가 추가되었습니다. [Feature #13110]
    • 유니코드 버전이 15.0.0, 에모지 버전이 15.0으로 갱신되었습니다. [[Feature #18037]] (이는 정규표현식에도 적용됩니다)
    • String#bytesplice가 추가되었습니다. [Feature #18598]
  • Struct
    • keyword_init: true 없이 Struct.new에 키워드 인수를 넘겨 Struct 클래스를 초기화할 수 있습니다. [Feature #16806]

호환성 문제

주의: 기능 버그 수정은 포함되어 있지 않습니다.

삭제된 상수

폐기 예정이었던 상수가 삭제됩니다.

삭제된 메서드

폐기 예정이었던 메서드가 삭제됩니다.

Stdlib 호환성 문제

서드파티 소스 코드의 동봉을 폐기

  • libyaml, libffi와 같은 서드파티 라이브러리의 소스 코드를 더 이상 포함하지 않습니다.

    • libyaml의 소스 코드는 psych로부터 제거되었습니다. Ubuntu/Debian 환경에서는 libyaml-dev가 필요합니다. 패키지 이름은 각 환경별로 다를 수 있습니다.

    • 동봉된 libffi 소스 코드도 fiddle로부터 제거되었습니다.

  • Psych와 fiddle이 특정 버전의 libyaml과 libffi 소스코드와 함께 정적 빌드를 할 수 있게 됩니다. 다음과 같이 psych를 libyml-0.2.5와 함께 빌드할 수 있습니다.

      $ ./configure --with-libyaml-source-dir=/path/to/libyaml-0.2.5
    

    그리고 다음과 같이 fiddle를 libffi-3.4.4와 함께 빌드할 수 있습니다.

      $ ./configure --with-libffi-source-dir=/path/to/libffi-3.4.4
    

    [Feature #18571]

C API 변경

갱신된 C API

다음 API가 갱신됩니다.

  • PRNG 갱신
    • rb_random_interface_t가 갱신되어 이제 버전을 가집니다. 이 인터페이스를 구버전으로 사용하고 있다면 새 인터페이스를 사용해야 합니다. 또한 init_int32 함수를 정의할 필요가 있습니다.

삭제된 C API

다음 폐기 예정인 API가 삭제됩니다.

  • rb_cData 변수.
  • “taintedness”와 “trustedness” 함수. [Feature #16131]

표준 라이브러리 갱신

  • 다음 기본 gem이 갱신되었습니다.
    • RubyGems 3.4.0.dev
    • benchmark 0.2.1
    • bigdecimal 3.1.3
    • bundler 2.4.0.dev
    • cgi 0.3.6
    • date 3.3.0
    • delegate 0.3.0
    • did_you_mean 1.6.2
    • digest 3.1.1
    • drb 2.1.1
    • erb 4.0.2
    • error_highlight 0.5.1
    • etc 1.4.1
    • fcntl 1.0.2
    • fiddle 1.1.1
    • fileutils 1.7.0
    • forwardable 1.3.3
    • getoptlong 0.2.0
    • io-console 0.5.11
    • io-nonblock 0.2.0
    • io-wait 0.3.0.pre
    • ipaddr 1.2.5
    • irb 1.5.1
    • json 2.6.2
    • logger 1.5.2
    • mutex_m 0.1.2
    • net-http 0.3.1
    • net-protocol 0.2.0
    • nkf 0.1.2
    • open-uri 0.3.0
    • openssl 3.1.0.pre
    • optparse 0.3.0
    • ostruct 0.5.5
    • pathname 0.2.1
    • pp 0.4.0
    • pstore 0.1.2
    • psych 5.0.0
    • racc 1.6.1
    • rdoc 6.5.0
    • reline 0.3.1
    • resolv 0.2.2
    • securerandom 0.2.1
    • set 1.0.3
    • stringio 3.0.3
    • syntax_suggest 1.0.1
    • timeout 0.3.1
    • tmpdir 0.1.3
    • tsort 0.1.1
    • un 0.2.1
    • uri 0.12.0
    • win32ole 1.8.9
    • zlib 3.0.0
  • 다음 내장 gem이 갱신되었습니다.
    • minitest 5.16.3
    • power_assert 2.0.2
    • test-unit 3.5.5
    • net-ftp 0.2.0
    • net-imap 0.3.1
    • net-pop 0.1.2
    • net-smtp 0.3.3
    • rbs 2.8.1
    • typeprof 0.21.3
    • debug 1.7.0

더 자세한 내용은 NEWS커밋 로그를 확인해 주세요.

이러한 변경사항에 따라, Ruby 3.1.0 이후로 파일 2846개 수정, 203950줄 추가(+), 127153줄 삭제(-)가 이루어졌습니다!

다운로드

  • https://cache.ruby-lang.org/pub/ruby/3.2/ruby-3.2.0-rc1.tar.gz

    SIZE: 20253652
    SHA1: 9b45af61ef1ae3c21ab88d7c9e30b80060116ac3
    SHA256: 3bb9760c1ac1b66416aaa4899809f6ccd010e57038eaaeca19a383fd56275dac
    SHA512: 798157d785ebae94cb128d3c134fa35e0e90c654972e531cb6562823042f3fb68a270226f7b1cf0c42572ef2b1488a1a3e44f88389ad2a6f9ca4b280a2a8e759
    
  • https://cache.ruby-lang.org/pub/ruby/3.2/ruby-3.2.0-rc1.tar.xz

    SIZE: 14934012
    SHA1: 5576e304786d466410f27a345dc1cb66f2c773f6
    SHA256: 0d45b3af14e84337882a2021235a091ae5dcfc0baaf31dccc479b71d96dd07bc
    SHA512: d38fcb1e09eb9984f3b2347e65ae7406129c2578d068a25d33b5b4f021ec3b567a9abe56c2acbec6d07a3c2b4bc7b485dbd330cbfbb3a96350f60a2bb94d016e
    
  • https://cache.ruby-lang.org/pub/ruby/3.2/ruby-3.2.0-rc1.zip

    SIZE: 24473024
    SHA1: 8fdc85363ce61e0b8f04da36e709d49028d04a75
    SHA256: 7ff32473be108534548e401aaa9092c37a27f73323ea4091c33901c714c87ee5
    SHA512: 07adf6a9c89fdcf420e7b131f40f2b1f4aca036aa6f28539ade26ca552f84a75e0698f77a8b774d2ea52b8c756c4982ef319bda5afa786c081a31dd9873c5ef7
    

Ruby는

Ruby는 1993년에 Matz(마츠모토 유키히로) 씨가 처음 개발했고, 현재는 오픈 소스로서 개발되고 있습니다. 여러 플랫폼에서 동작하며, 특히 웹 개발에서 전 세계적으로 이용되고 있습니다.