ruby迭代map的简洁写法实现原理分析

Ruby 2.7.0
稳定版在圣诞节当天发布了,此版本引入了许多新特性和性能改进,最值得注意的包括:

Ruby 2.7.0 preview 2 已经发布了,最终版本计划在 12
月发布。该版本引入了一些新特性和性能改进,主要是:

Ruby 2.7.0-rc2 发布了,最终版本计划于 12 月 25 日发布。

简便方法的用法

  • 模式匹配(Pattern Matching)
  • REPL 改进
  • 紧凑 GC(Compaction GC)
  • 位置参数和关键字参数的分离
  • Compaction GC
  • Pattern Matching
  • REPL improvement
  • Separation of positional and keyword arguments

此版本引入了许多新特性和性能改进,最值得注意的包括:

现有一个字符串列表,需要对其中的每个字符串执行转换大写操作,我们可以用一个简便写法来完成。

模式匹配(实验性功能)

模式匹配是函数式编程语言中广泛使用的特性,如果匹配某一个模式,它可以遍历给定的对象并分配其值,目前尚处于实验阶段 [Feature
#14912]:

require "json"

json = <<END
{
  "name": "Alice",
  "age": 30,
  "children": [{ "name": "Bob", "age": 2 }]
}
END

case JSON.parse(json, symbolize_names: true)
in {name: "Alice", children: [{name: "Bob", age: age}]}
  p age #=> 2
end

有关该功能的具体细节请查看 Pattern matching – New feature in Ruby
2.7。

Compaction GC 

  • 模式匹配

复制代码 代码如下:

REPL 改进

绑定的交互式环境 irb 现在支持多行编辑,由 reline 提供支持,reline
是一种与 readline 兼容的纯 Ruby 实现。它还提供了 rdoc 集成。在 irb
中,可以显示给定类、模块或方法的引用。此外,binding.irb
中显示的源代码行和核心类对象的检查结果现在以颜色区分显示。

www.9778.com 1

这个版本引入了 Compaction
GC,以碎片化内存空间。GC.Compact 方法对堆进行压缩,这个函数压缩堆中的活动对象,以使用更少的页,并且堆会更友好。

模式匹配是函数式编程语言中广泛使用的特性,如果匹配某一个模式,它可以遍历给定的对象并分配其值:

name_list = [“chareice”, “angel”]
name_list.map(&:upcase)
# => [“CHAREICE”, “ANGEL”]

紧凑 GC(Compaction GC)

紧凑 GC 可以对碎片化的内存空间进行碎片整理。一些多线程 Ruby
程序可能会导致内存碎片,从而导致高内存使用率和速度下降。引入了
GC.compact
方法来压缩堆,此函数压缩堆中的活动对象,以便可以使用更少的页,并且堆可能对
CoW 更友好。

Pattern Matching(实验性)

require "json"

json = <<END
{
  "name": "Alice",
  "age": 30,
  "children": [{ "name": "Bob", "age": 2 }]
}
END

case JSON.parse(json, symbolize_names: true)
in {name: "Alice", children: [{name: "Bob", age: age}]}
  p age #=> 2
end

这个写法等同于

位置参数和关键字参数的分离

关键词参数和位置参数的自动转换被标记为已废弃(deprecated),自动转换将会在
Ruby 3 中被移除。[功能
#14183]

  • 当方法传入一个 Hash
    作为最后一个参数,或者传入的参数没有关键词的时候,会抛出警告。如果需要继续将其视为关键词参数,则需要加入两个星号来避免警告并确保在
    Ruby 3 中行为正常。

  def foo(key: 42); end; foo({key: 42})   # warned
  def foo(**kw);    end; foo({key: 42})   # warned
  def foo(key: 42); end; foo(**{key: 42}) # OK
  def foo(**kw);    end; foo(**{key: 42}) # OK
  • 当方法传入一个 Hash
    到一个接受关键词参数的方法中,但是没有传递足够的位置参数,关键词参数会被视为最后一个位置参数,并抛出一个警告。请将参数包装为
    Hash 对象来避免警告并确保在 Ruby 3 中行为正常。

  def foo(h, **kw); end; foo(key: 42)      # warned
  def foo(h, key: 42); end; foo(key: 42)   # warned
  def foo(h, **kw); end; foo({key: 42})    # OK
  def foo(h, key: 42); end; foo({key: 42}) # OK
  • 当方法接受关键词参数传入,但不会进行关键词分割(splat),且传入同时含有
    Symbol 和非 Symbol 的 key,那么 Hash
    会被分割,但是会抛出警告。你需要在调用时传入两个分开的 Hash 来确保在
    Ruby 3 中行为正常。

  def foo(h={}, key: 42); end; foo("key" => 43, key: 42)   # warned
  def foo(h={}, key: 42); end; foo({"key" => 43, key: 42}) # warned
  def foo(h={}, key: 42); end; foo({"key" => 43}, key: 42) # OK
  • 当一个方法不接受关键词,但是调用时传入了关键词,关键词会被视为位置参数,不会有警告抛出。这一行为将会在
    Ruby 3 中继续工作。

  def foo(opt={});  end; foo( key: 42 )   # OK
  • 如果方法支持任意参数传入,那么非 Symbol
    也会被允许作为关键词参数传入。[功能
    #14183]

  def foo(**kw); p kw; end; foo("str" => 1) #=> {"str"=>1}
  • **nil 被允许使用在方法定义中,用来标记方法不接受关键词参数。以关键词参数调用这些方法会抛出
    ArgumentError [功能
    #14183]

  def foo(h, **nil); end; foo(key: 1)       # ArgumentError
  def foo(h, **nil); end; foo(**{key: 1})   # ArgumentError
  def foo(h, **nil); end; foo("str" => 1)   # ArgumentError
  def foo(h, **nil); end; foo({key: 1})     # OK
  def foo(h, **nil); end; foo({"str" => 1}) # OK
  • 将空的关键词分割(splat)传入一个不接受关键词的方法不会继续被当作空
    Hash
    处理,除非空哈希被作为一个必要参数,并且这种情况会抛出警告。请移除双星号来将
    Hash 作为位置参数传入。[功能
    #14183]

  h = {}; def foo(*a) a end; foo(**h) # []
  h = {}; def foo(a) a end; foo(**h)  # {} and warning
  h = {}; def foo(*a) a end; foo(h)   # [{}]
  h = {}; def foo(a) a end; foo(h)    # {}

如果要禁用“弃用提醒警告(deprecation
warnings)”,请使用命令行参数-W:no-deprecated或添加Warning[:deprecated] = false到代码中。

模式匹配是函数式程序设计语言中广泛使用的一种特性。通过模式匹配,可以遍历给定的对象并分配其值。

  • REPL 改进

复制代码 代码如下:

其它值得关注的新特性

  • ruby迭代map的简洁写法实现原理分析。方法引用运算符,.:,作为实验性功能加入了。功能
    #12125、功能
    #13581

  • 实验性地加入了把编号参数作为默认的块参数的特性。功能
    #4475

  • 无头范围实验性地加入了。它可能尽管没有无限范围那么有用,但它对开发
    DSL 是非常有用的。功能
    #14799

  ary[..3]  # identical to ary[0..3]
  rel.where(sales: ..100)
  • 新增了 Enumerable#tally,它会计算每个元素出现的次数。

  ["a", "b", "c", "b"].tally
  #=> {"a"=>1, "b"=>2, "c"=>1}
  • 允许在 self 上调用私有方法 [功能
    #11297] [功能
    #16123]

  def foo
  end
  private :foo
  self.foo
  • 新增 Enumerator::Lazy#eager。它会产生一个非懒惰的迭代器。[功能
    #15901]

  a = %w(foo bar baz)
  e = a.lazy.map {|x| x.upcase }.map {|x| x + "!" }.eager
  p e.class               #=> Enumerator
  p e.map {|x| x + "?" }  #=> ["FOO!?", "BAR!?", "BAZ!?"]
case JSON.parse('{...}', symbolize_names: true)
in {name: "Alice", children: [{name: "Bob", age: age}]}
  p age
  ...
end

绑定的交互式环境 irb 现在支持多行编辑,由 reline 提供支持,reline
是一种与 readline 兼容的纯 Ruby 实现。它还提供了 rdoc 集成。在 irb
中,可以显示给定类、模块或方法的引用。此外,binding.irb
中显示的源代码行和核心类对象的检查结果现在以颜色区分显示。

name_list.map do {|name| name.upcase}

性能改进

  • JIT [实验性质]

    • 当优化假设不成功时,JIT
      后的代码可能会被重新编译到优化程度较低的代码。

    • 当方法(Method)被认为是纯函数(pure)时,会进行方法内联优化。这种优化方法仍是实验性的,许多方法不被认为是纯函数。

    • --jit-min-calls 的默认值从 5 调整到 10,000。

    • --jit-max-cache 的默认值从 1,000 调整到 100。

  • Symbol#to_s,Module#name,true.to_s,false.to_snil.to_s`
    现在始终返回一个冻结(frozen)字符串。返回的字符串始终和给定的对象相等。
    [实验性] [功能
    #16150]

  • CGI.escapeHTML 的性能被提升了。GH-2226

REPL improvement 

irb 现在支持多行编辑,它由 reline,readline 兼容的纯 Ruby
实现驱动。它还提供 rdoc 集成。在 irb
中,可以显示给定类、模块或方法的引用。

www.9778.com 2

简便写法带来的是很明显的效率提升,可是这看似魔术一般的参数,背后的原理是怎样的呢?

其他自 2.6 版本以来显著的变化

  • 一些标准库已被更新
    • Bundler 2.1.0.pre.1
    • RubyGems 3.1.0.pre.1
    • CSV 3.1.2
      (NEWS)
    • Racc 1.4.15
    • REXML 3.2.3
      (NEWS)
    • RSS 0.2.8
      (NEWS)
    • StringScanner 1.0.3
    • 一些其它没有原始版本的库也被更新了。
  • 现在进行块方法调用时,如果 Proc.new 和 proc 在没有 block
    会产生警告。

  • lambda 在方法调用时如果没有 block 会产生区块错误。

  • Unicode 和 Emoji 版本从 11.0.0 更新至 12.0.0。[功能
    #15321]

  • 更新 Unicode 至 12.1.0 版本,新增对于新年号「令和」 U+32FF
    的支持。[功能 #15195]

  • Date.jisx0301Date#jisx0301 和 Date.parse 展示支持新的日本年号作为非正式的扩展功能,直到新的
    JIS X 0301 发布。[功能
    #15742]

  • 编译器需要支持 C99 [杂项
    #15347] *关于方言使用的具体信息请查阅:

见 NEWS 或 提交日志 以查看详情。

Separation of positional and keyword arguments

关键字参数和位置参数的自动转换,将在 Ruby 3 中将删除。

  • 压缩 GC(Compaction GC)

&符号

下载地址

    SIZE: 14703381
    SHA1: b54f4633174dbc55db77d9fd6d0ef90cc35503af
    SHA256: 7aa247a19622a803bdd29fdb28108de9798abe841254fe8ea82c31d125c6ab26
    SHA512: 8b8dd0ceba65bdde53b7c59e6a84bc6bf634c676bfeb2ff0b3604c362c663b465397f31ff6c936441b3daabb78fb7a619be5569480c95f113dd0453488761ce7
    SIZE: 16799684
    SHA1: 6f4e99b5556010cb27e236873cb8c09eb8317cd5
    SHA256: 8c99aa93b5e2f1bc8437d1bbbefd27b13e7694025331f77245d0c068ef1f8cbe
    SHA512: 973fc29b7c19e96c5299817d00fbdd6176319468abfca61c12b5e177b0fb0d31174a5a5525985122a7a356091a709f41b332454094940362322d1f42b77c9927
    SIZE: 11990900
    SHA1: 943c767cec037529b8e2d3cc14fc880cad5bad8d
    SHA256: 27d350a52a02b53034ca0794efe518667d558f152656c2baaf08f3d0c8b02343
    SHA512: dd5690c631bf3a2b76cdc06902bcd76a89713a045e136debab9b8a81ff8c433bbb254aa09e4014ca1cf85a69ff4bcb13de11da5e40c224e7268be43ef2194af7
    SIZE: 20571744
    SHA1: fbebdd3a2a641f9a81f7d8db5abd926acea27e80
    SHA256: 8bf2050fa1fc76882f878fd526e4184dc54bd402e385efa80ef5fd3b810522e0
    SHA512: 5060f2dd3bfd271ef255b17589d6d014260d7ec2d97b48112b717ee01c62fe125c3fe04f813e02d607cea3f0a2a812b14eb3a28d06c2551354dfeff5f4c3dd6b

享受使用 Ruby 2.7 编程吧!

(文/开源中国)    

其他显著新特点:

  • 引入编号参数作为默认块参数
  • 添加 Enumerable#tally

["a", "b", "c", "b"].tally
#=> {"a"=>1, "b"=>2, "c"=>1}
  • 现在允许在 Self 上调用私有方法

def foo
end
private :foo
self.foo
  •  添加 Enumerator::Lazy#eager

a = %w(foo bar baz)
e = a.lazy.map {|x| x.upcase }.map {|x| x + "!" }.eager
p e.class               #=> Enumerator
p e.map {|x| x + "?" }  #=> ["FOO!?", "BAR!?", "BAZ!?"]

另外,还有更新部分标准库:

  • www.9778.com,Bundler 2.1.0.pre.1
  • RubyGems 3.1.0.pre.1
  • CSV 3.1.2 (NEWS)
  • Racc 1.4.15
  • REXML 3.2.3
    (NEWS)
  • RSS 0.2.8 (NEWS)
  • StringScanner 1.0.3

更多详情见发布说明。 

(文/开源中国)    

压缩 GC 可以对碎片化的内存空间进行碎片整理。一些多线程 Ruby
程序可能会导致内存碎片,从而导致高内存使用率和速度下降。引入了
GC.compact
方法来压缩堆,此函数压缩堆中的活动对象,以便可以使用更少的页,并且堆可能对
CoW 更友好。

如果把上面方法调用的&符号去掉,可以很明显得看到,是把:upcase这个符号传到方法中,作为方法的参数。

  • 位置参数和关键字参数的分离

实际上,&符号代表的是块转变为Proc(block-to-proc
conversion)。我们看下面的一个例子。

不建议使用关键字参数和位置参数的自动转换,并且在 Ruby 3 中将删除此转换。

复制代码 代码如下:

详情查看更新说明:

def capture_block(&block)
  block.call
end

https://www.ruby-lang.org/en/news/2019/12/21/2-7-0-rc2-released

capture_block { puts “我有一只小毛驴,我从来也不骑。” }
# => 我有一只小毛驴,我从来也不骑。

(文/开源中国)    

我们运行capture_block函数,给它传递一个代码块,代码块会经&符号的转换变为一个Proc对象传递到函数中,在上面的例子中就是block变量。如果我们输出一下block的class,输出的结果会是Proc。

你也可以将一个Proc对象传递给capture_block来代替代码块.

复制代码 代码如下:

p = Proc.new { puts “又给一只小毛驴” }
capture_block(&p)
# => 又给一只小毛驴

这里看来&符号是多余的,完全可以去掉&,运行的结果也是一样。

&符号做了什么?

以capture_block(&p)调用为例。

1.触发p的to_proc方法。
2.告诉Ruby解释器,将to_proc方法返回的结果当做本次函数调用的block。

如果同时使用了&符号和传入了block给一个函数,Ruby会报错。

复制代码 代码如下:

capture_block(&p) { puts “传给一个block” }
#=>SyntaxError: (irb):30: both block arg and actual block given

所以将一个Proc对象传给&符号,它会调用Proc对象的to_proc方法,返回它自己,然后把它当做方法调用的block传递给方法。

&:upcase是什么?

知道了&符号的作用后,我们可以看到,&:upcase是先调用了:upcase对象的to_proc方法。

:upcase的to_proc方法实现如下:

复制代码 代码如下:

class Symbol
  def to_proc
    Proc.new {|obj| obj.send(self) }
  end
end

这下结果就很清楚了,Symbol#to_proc会返回一个带参数的Proc对象,Proc对象所做的是为使用这个Proc对象的对象发送调用名字为该符号的方法。

您可能感兴趣的文章:

  • Ruby Gems更换淘宝源方法
  • Ruby中访问SQL
    Server数据库的配置实例
  • 举例理解Ruby on
    Rails的页面缓存机制