Lançado Ruby 3.2.0 RC 1

Estamos contentes em anunciar o lançamento do Ruby 3.2.0-rc1. Ruby 3.2 adds many features and performance improvements.

Suporte a WebAssembly com WASI

Esse é um port inicial de suporte a WebAssembly com WASI. Isso permite um binário CRuby ficar disponível num navegador Web, num ambiente Serverless Edge, ou em outros tipos de WebAssembly/WASI embedders. Atualmente esse port passa suítes de teste básica e bootstrap não utilizando a Thread API.

Contexto

WebAssembly (Wasm) foi originalmente introduzido para rodar programas seguramente e rápido em navegadores web. Mas seu objetivo - rodar programas eficientemente com segurança em ambiente variado - é desejado há muito tempo não somente para web, mas também para aplicações em geral.

WASI (The WebAssembly System Interface) é projetado para tais casos de uso. Embora tais aplicações precisem se comunicar com os sistemas operacionais, WebAssembly roda numa máquina virtual que não possui uma interface com o sistema. WASI padroniza isso.

O suporte a WebAssembly/WASI em Ruby pretende alavancar esses projetos. Isso permite aos desenvolvedores Ruby a escreverem aplicações que rodam em tais plataformas.

Caso de uso

Esse suporte encoraja desenvolvedores a utilizarem CRuby em um ambiente WebAssembly. Um exemplo de caso de uso é o suporte a CRuby do TryRuby playground. Agora você pode testar o CRuby original no seu navegador web.

Questões técnicas

O WASI e o WebAssembly de hoje estão com algumas funcionalidades faltando para implementar Fiber, exceção, e GC porque ainda estão evoluindo, e também por questões de segurança. Então o CRuby preenche essa lacuna através do Asyncify, que é uma técnica de transformação binária para controlar a execução na userland.

Além disso, nós construímos um VFS(sistema de arquivo virtual) em cima do WASI assim nós podemos facilmente empacotar aplicações Ruby em um único arquivo .wasm. Isso torna a distribuição de aplicações Ruby um pouco mais fácil.

Links relacionados

Melhorias em Regexp contra ReDoS

Se sabe que o tempo de verificação de uma Regexp pode ser inesperadamente longo. Se seu código tenta verificar uma Regexp possivelmente ineficiente contra um input não confiável, um invasor pode explorar isso para uma eficiente Denial of Service (então chamada Regular expression DoS, ou ReDoS).

Nós introduzimos duas melhoria que significantemente mitigam ReDoS.

Algoritmo de verificação de Regexp melhorado

Desde o Ruby 3.2, o algoritmo de verificação de Regexp tem sido grandemente melhorado usando a técnica de memoization.

# Isso leva 10 seg. no Ruby 3.1, e 0.003 seg. no Ruby 3.2

/^a*b?a*$/ =~ "a" * 50000 + "x"

O algoritmo melhorado de verificação permite que a maioria das verificações de Regexp (cerca de 90% em nossos experimentos) sejam completadas em tempo linear.

(Para usuários da prévia: Essa otimização pode consumir memória proporcionalmente à entrada pra cada verificação. Nós esperamos que nenhum problema prático surja porque essa alocação de memória é normalmente atrasada, e uma Regexp normalmente deveria consumir no máximo 10 vezes mais que o comprimento do input. Se você ficar sem memória ao realizar verificações de Regexps numa aplicação do mundo real, por favor nos relate.)

A proposta original é https://bugs.ruby-lang.org/issues/19104

Timeout de Regexp

A otimização acima não pode ser aplicada a alguns tipos de expressões regulares, tais como aquelas que incluem funcionalidades avançadas (e.g., back-references ou look-around), ou com um grande número fixado de repetições. Como medida de fallback, uma funcionalidade de timeout na verificação de Regexp também é introduzida.

Regexp.timeout = 1.0

/^a*b?a*()\1$/ =~ "a" * 50000 + "x"
#=> Regexp::TimeoutError é devolvido em um segundo

Perceba que Regexp.timeout é uma configuração global. Se deseja usar uma configuração diferente de timeout pra alguma Regexp em especial, você pode usar a chave timeout no Regexp.new.

Regexp.timeout = 1.0

# Essa regexp não possui timeout
long_time_re = Regexp.new('^a*b?a*()\1$', timeout: Float::INFINITY)

long_time_re =~ "a" * 50000 + "x" # nunca é interrompida

A proposta original é https://bugs.ruby-lang.org/issues/17837.

Outras Novas Funcionalidades Notórias

SyntaxSuggest

  • A funcionalidade de syntax_suggest (anteriormente dead_end) está integrada ao Ruby. Isso ajuda você a encontrar a posição dos erros tais como ends faltantes ou supérfluos, pra te trazer de volta ao seu caminho mais rapidamente, assim com o exemplo a seguir:

    Unmatched `end', missing keyword (`do', `def`, `if`, etc.) ?
    
      1  class Dog
    > 2    defbark
    > 3    end
      4  end
    

    [Feature #18159]

ErrorHighlight

  • Agora ele aponta aos argumentos relevantes para TypeError e ArgumentError
test.rb:2:in `+': nil can't be coerced into Integer (TypeError)

sum = ary[0] + ary[1]
               ^^^^^^

Linguagem

  • Argumentos rest anônimos e palavra-chave rest agora podem ser passados como argumentos, em vez de serem usados apenas em parâmetros do método. [Feature #18351]

      def foo(*)
        bar(*)
      end
      def baz(**)
        quux(**)
      end
    
  • Uma proc que aceita um único argumento posicional e palavras-chave não irá mais autosplat. [Bug #18633]

    proc{|a, **k| a}.call([1, 2])
    # Ruby 3.1 e antes
    # => 1
    # Ruby 3.2 e depois
    # => [1, 2]
    
  • A ordem de avaliação de atribuição da constante para constantes definidas em objetos explícitos tornou-se consistente com a ordem de avaliação de atribuição de atributo único. Com esse código:

      foo::BAR = baz
    

    foo agora é chamado antes de baz. Similarmente, para múltiplas atribuições para constantes a ordem esquerda-para-direita é usada. Com esse código:

        foo1::BAR1, foo2::BAR2 = baz1, baz2
    

    A seguinte ordem de avaliação agora é utilizada:

    1. foo1
    2. foo2
    3. baz1
    4. baz2

    [Bug #15928]

  • O find pattern não é mais experimental. [Feature #18585]

  • Métodos recebendo um parâmetro rest (como *args) e desejando delegar argumentos de palavra-chave através de foo(*args) devem agora serem marcados com ruby2_keywords (se ainda não for o caso). Em outras palavras, todos métodos que desejam delegar argumentos de palavras-chave através do *args devem agora serem marcados com ruby2_keywords, sem exceção. Isso fará mais fácil a transição para outras formas de delegação uma vez que uma biblioteca requira Ruby 3+. Anteriormente, a flag ruby2_keywords foi mantida se o método recebedor levava *args, mas isso era um bug de inconsistência. Uma boa técnica pra encontrar potenciais ruby2_keywords faltantes é rodar a suíte de testes, encontrar o último método que deve receber argumentos para cada lugar onte a suíte de teste falha, e usar puts nil, caller, nil lá. Então verifique que cada método/bloco da cadeia de chamada que deve delegar palavras-chave está corretamente marcado com ruby2_keywords. [Bug #18625] [Bug #16466]

      def target(**kw)
      end
    
      # Acidentalmente funcionou sem ruby2_keywords no Ruby 2.7-3.1, ruby2_keywords
      # é necessário em 3.2+. Assim como (*args, **kwargs) ou (...) seriam necessários
      # em #foo e #bar quando migrar de ruby2_keywords.
      ruby2_keywords def bar(*args)
        target(*args)
      end
    
      ruby2_keywords def foo(*args)
        bar(*args)
      end
    
      foo(k: 1)
    

Melhorias de desempenho

YJIT

  • YJIT agora suporta x86-64 e arm64/aarch64 CPUs no Linux, MacOS, BSD e outras plataformas UNIX.
    • Essa release trás suporte para os processadores Mac M1/M2, AWS Graviton e Raspberry Pi 4 ARM64.
  • O build do YJIT agora requer Rust 1.58.0+. [Feature #18481]
    • Para garantir que CRuby seja buildado com YJIT, por favor instale rustc >= 1.58.0 e rode ./configure com --enable-yjit.
    • Por favor entre em contato com o time do YJITP caso tenha qualquer problema.
  • Memória física para o código JIT é alocada de forma lazy. Diferente do Ruby 3.1, o RSS de um processo Ruby é minimizado por conta das páginas de memória virtual alocadas por --yjit-exec-mem-size que não serão mapeadas para páginas de memória física até que sejam utilizadas pelo código JIT.
    • Introduz GC(Garbage collector) que libera todas as páginas de código quando o consumo de memória do código JIT atinge --yjit-exec-mem-size.
      • RubyVM::YJIT.runtime_stats retorna métricas do GC além das chaves existentes em inline_code_size e outlined_code_size: code_gc_count, live_page_count, freed_page_count, e freed_code_size.
  • A maioria das estastísticas produzidas por RubyVM::YJIT.runtime_stats estão agora disponíveis nas release builds.
    • Simplesmente rode ruby com --yjit-stats para calcular e obter estatísticas (fica sujeito a sobrecarga de tempo de execução).
  • YJIT agora está otimizado para tirar vantagem de formatos de objetos. [Feature #18776]
  • Tira vantagem de invalidação de constantes de forma mais granular para invalidar menos código ao definir novas constantes. [Feature #18589]

MJIT

  • O compilador MJIT está reimplementado em Ruby como uma bilioteca padrão mjit.
  • O compilador MJIT é executado sob um processo fork ao invés de fazer isso em uma thread nativa chamada worker MJIT. [[Feature #18968]]
    • Como resultado, Microsoft Visual Studio (MSWIN) não é mais suportado.
  • MinGW não é mais suportado. [[Feature #18824]]
  • Renomeado --mjit-min-calls para --mjit-call-threshold.
  • Mudado valor padrão --mjit-max-cache de 10000 para 100.

PubGrub

  • Bundler 2.4 agora utiliza o resolvedor de versão PubGrub ao invés de Molinillo.

    • PubGrub é a próxima geração de algoritmo resolvedor utilizado pelo gerenciador de pacote pub da linguagem de programação Dart.
    • Você pode obter um resultado de resolução de versões diferentes depois dessa mudança. Por favor relate tais casos para RubyGems/Bundler issues
  • RubyGems ainda utiliza o resolvedor Molinillo no Ruby 3.2. Nós planejamos trocá-lo pelo PubGrub no futuro.

Other notable changes since 3.1

  • Hash
    • Hash#shift agora sempre retorna nil se o hash está vazio, ao invés de retornar o valor padrão ou chamar a proc padrão. [Bug #16908]
  • MatchData
  • Module
  • Proc
    • Proc#dup retorna uma instância da subclasse. [Bug #17545]
    • Proc#parameters agora aceita a palavra-chave lambda. [Feature #15357]
  • Refinement
  • RubyVM::AbstractSyntaxTree
    • Adicionada opção error_tolerant para parse, parse_file e of. [[Feature #19013]]
  • Set
    • Set agora está disponível como uma classe builtin sem necessidade de require "set". [Feature #16989] Ela está atualmente autoloaded via constante Set ou chamada em Enumerable#to_set.
  • String
    • String#byteindex e String#byterindex foram adicionados. [Feature #13110]
    • Atualizado Unicode para Versão 15.0.0 e Emoji Versão 15.0. [Feature #18639] (também aplicado para Regexp)
    • String#bytesplice foi adicionado. [Feature #18598]
  • Struct
    • Uma classe Struct pode também ser inicializada com argumentos de palavras-chave sem keyword_init: true em Struct.new [Feature #16806]

Issues de compatibilidade

Nota: Excluindo correção de bugs de funcionalidades.

Constantes removidas

As seguintes constantes obsoletas foram removidas.

Métodos removidos

Os seguintes métodos obsoletos foram removidos.

Não empacota mais código fonte de terceiros

  • Nós não empacotamos mais código fonte de terceiro como libyaml, libffi.

    • O código fonte do libyaml foi removido do psych. Você pode precisar instalar libyaml-dev na plataforma Ubuntu/Debian. O nome do pacote é diferente pra cada plataforma.

    • O código fonte empacotado do libffi também foi removido do fiddle

  • Psych e fiddle suportaram builds estáticos com versões específicas dos fontes de libyaml e libffi. Você pode rodar o build do psych com libyaml-0.2.5 assim:

      $ ./configure --with-libyaml-source-dir=/path/to/libyaml-0.2.5
    

    E você pode rodar o build do fiddle com libffi-3.4.4 assim:

      $ ./configure --with-libffi-source-dir=/path/to/libffi-3.4.4
    

    [Feature #18571]

Atualizações da API de C

APIs de C atualizadas

As seguintes APIs foram atualizadas.

  • Atualização do PRNG
    • rb_random_interface_t atualizado e versionado. Bibliotecas de extensão que usam essa interface e buildadas para versões antigas. E também a função init_int32 precisa ser definida.

APIs de C removidas

As seguintes APIs se tornaram obsoletas e foram removidas.

  • Variável rb_cData.
  • Funções “taintedness” e “trustedness”. [Feature #16131]

Atualizações da biblioteca padrão

  • As seguintes gems padrão foram atualizadas.
    • RubyGems 3.4.0.dev
    • benchmark 0.2.1
    • bigdecimal 3.1.3
    • bundler 2.4.0.dev
    • cgi 0.3.6
    • date 3.3.0
    • delegate 0.3.0
    • did_you_mean 1.6.2
    • digest 3.1.1
    • drb 2.1.1
    • erb 4.0.2
    • error_highlight 0.5.1
    • etc 1.4.1
    • fcntl 1.0.2
    • fiddle 1.1.1
    • fileutils 1.7.0
    • forwardable 1.3.3
    • getoptlong 0.2.0
    • io-console 0.5.11
    • io-nonblock 0.2.0
    • io-wait 0.3.0.pre
    • ipaddr 1.2.5
    • irb 1.5.1
    • json 2.6.2
    • logger 1.5.2
    • mutex_m 0.1.2
    • net-http 0.3.1
    • net-protocol 0.2.0
    • nkf 0.1.2
    • open-uri 0.3.0
    • openssl 3.1.0.pre
    • optparse 0.3.0
    • ostruct 0.5.5
    • pathname 0.2.1
    • pp 0.4.0
    • pstore 0.1.2
    • psych 5.0.0
    • racc 1.6.1
    • rdoc 6.5.0
    • reline 0.3.1
    • resolv 0.2.2
    • securerandom 0.2.1
    • set 1.0.3
    • stringio 3.0.3
    • syntax_suggest 1.0.1
    • timeout 0.3.1
    • tmpdir 0.1.3
    • tsort 0.1.1
    • un 0.2.1
    • uri 0.12.0
    • win32ole 1.8.9
    • zlib 3.0.0
  • As seguintes gems empacotadas foram atualizadas.
    • minitest 5.16.3
    • power_assert 2.0.2
    • test-unit 3.5.5
    • net-ftp 0.2.0
    • net-imap 0.3.1
    • net-pop 0.1.2
    • net-smtp 0.3.3
    • rbs 2.8.1
    • typeprof 0.21.3
    • debug 1.7.0

Veja NOVIDADES ou commit logs para mais detalhes.

Com estas mudanças, 2846 arquivos mudados, 203950 inserções(+), 127153 remoções(-) desde o Ruby 3.1.0!

Download

  • https://cache.ruby-lang.org/pub/ruby/3.2/ruby-3.2.0-rc1.tar.gz

    SIZE: 20253652
    SHA1: 9b45af61ef1ae3c21ab88d7c9e30b80060116ac3
    SHA256: 3bb9760c1ac1b66416aaa4899809f6ccd010e57038eaaeca19a383fd56275dac
    SHA512: 798157d785ebae94cb128d3c134fa35e0e90c654972e531cb6562823042f3fb68a270226f7b1cf0c42572ef2b1488a1a3e44f88389ad2a6f9ca4b280a2a8e759
    
  • https://cache.ruby-lang.org/pub/ruby/3.2/ruby-3.2.0-rc1.tar.xz

    SIZE: 14934012
    SHA1: 5576e304786d466410f27a345dc1cb66f2c773f6
    SHA256: 0d45b3af14e84337882a2021235a091ae5dcfc0baaf31dccc479b71d96dd07bc
    SHA512: d38fcb1e09eb9984f3b2347e65ae7406129c2578d068a25d33b5b4f021ec3b567a9abe56c2acbec6d07a3c2b4bc7b485dbd330cbfbb3a96350f60a2bb94d016e
    
  • https://cache.ruby-lang.org/pub/ruby/3.2/ruby-3.2.0-rc1.zip

    SIZE: 24473024
    SHA1: 8fdc85363ce61e0b8f04da36e709d49028d04a75
    SHA256: 7ff32473be108534548e401aaa9092c37a27f73323ea4091c33901c714c87ee5
    SHA512: 07adf6a9c89fdcf420e7b131f40f2b1f4aca036aa6f28539ade26ca552f84a75e0698f77a8b774d2ea52b8c756c4982ef319bda5afa786c081a31dd9873c5ef7
    

What is Ruby

Ruby foi primeiramente desenvolvido por Matz (Yukihiro Matsumoto) em 1993 e agora é desenvolvido como Open Source. Ele roda em múltiplas plataformas e é usado em todo o mundo, especialmente para desenvolvimento web.