# 字符串

## 生成字符串

### 典型构造

典型地，**Ruby**中可以使用一对单引号''或者双引号""生成字符串。

In [1]:
"Hello World!"

"Hello World!"

In [2]:
'Hello World!'

"Hello World!"

双引号(`"`) 允许 `内插值(interpolation)` 和 `转义(escaping)`

In [3]:
name = "James"
puts "Hello\t#{name}"

Hello	James


单引号(`'`) 则保留更多字符串的原始字面信息

In [4]:
name = 'James'
puts 'Hello\t#{name}'

Hello\t#{name}


### 特殊构造

* %Q: 类似于双引号(")，不需要特殊处理字符串中"
* %q: 类似于单引号(')，不需要特殊处理字符串中'
* 你可以使用任何典型的分割字符，例如`%Q{...}`, `%Q(...)`, `%Q|...|`, `%Q?...?`, `%Q-....-`, `%Q/.../`, etc.

In [5]:
interpolation = "interpolation"
puts %Q{Do "#{interpolation}" and \t escaping}
puts %q|Don't do "#{interpolation}" and \t escaping|

Do "interpolation" and 	 escaping
Don't do "#{interpolation}" and \t escaping


## 多行字符串

#### `"`和`'`支持直接换行

In [6]:
"Hello\t#{name}
Hello\t#{name}
Hello\t#{name}"

"Hello\tJames\nHello\tJames\nHello\tJames"

In [7]:
'Hello\t#{name}
Hello\t#{name}
Hello\t#{name}'

"Hello\\t\#{name}\nHello\\t\#{name}\nHello\\t\#{name}"

#### Ruby 也可以用一对 `"""` 或者 `'''` 来生成多行字符串：

In [8]:
s = """hello world.
it is a nice day."""
print s

hello world.
it is a nice day.

在储存时，我们在两行字符间加上一个换行符 `'\n'`

In [9]:
s

"hello world.\nit is a nice day."

In [10]:
'''
Hello\t#{name}
Hello\t#{name}
Hello\t#{name}
'''

"\nHello\\t\#{name}\nHello\\t\#{name}\nHello\\t\#{name}\n"

#### 使用  `\` 来换行

当代码太长或者为了美观起见时，我们可以使用 `\` 来将一行代码转为多行代码(不追加换行符 `\n` )：

In [11]:
a = "hello, world. " \
    "it's a nice day. " \
    "my name is xxx"
a

"hello, world. it's a nice day. my name is xxx"

### Here Docs

In [12]:
s = <<-END
Hello\t#{name}
Hello\t#{name}
Hello\t#{name}
END
puts s

Hello	James
Hello	James
Hello	James



In [13]:
xml = <<-XML
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <author>
    <name>James Zhan</name>
  </author>
</feed>
XML
puts xml

<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <author>
    <name>James Zhan</name>
  </author>
</feed>



In [14]:
puts <<-SQL
SELECT * FROM blogs 
WHERE id = 10086
SQL

puts(<<-RUBY, __FILE__, __LINE__ + 1)
(0...10).each do|i|
  puts "%d: Hello World!" % i
end
RUBY

SELECT * FROM blogs 
WHERE id = 10086

(0...10).each do|i|
  puts "%d: Hello World!" % i
end

<main>
6


In [15]:
def repeat(content, times)
  times.downto(1).each do
    puts content
  end
end

repeat(<<-CONTENT, 3)
Hello World
CONTENT

puts <<-NUM.to_i ** 6
2
NUM

Hello World

Hello World

Hello World

64


## 简单操作

加法：

In [16]:
s = 'Hello ' + 'World'
s

"Hello World"

字符串与数字相乘：

In [17]:
"echo" * 3

"echoechoecho"

字符串长度：

In [18]:
puts s.length
puts s.size

11
11


## 字符串方法

**Ruby**是一种面向对象的语言，面向对象的语言中一个必不可少的元素就是方法，而字符串是对象的一种，所以有很多可用的方法。

跟很多语言一样，**Ruby**使用以下形式来调用方法(括号可选)：

> `对象.方法(参数)` 

### 分割

s.split()将s按照空格（包括多个空格，制表符`\t`，换行符`\n`等）分割，并返回所有分割得到的字符串。

In [19]:
line = "1 2 3 4  5"
numbers = line.split()
print numbers

["1", "2", "3", "4", "5"]

`s.split(pattern, [limit])`以给定的pattern为分隔符对s进行分割。

In [20]:
line = "1,2,3,4,5"
numbers = line.split(',')
print numbers

["1", "2", "3", "4", "5"]

In [21]:
puts '1, 2, ,3, 4, 5'.split(/[,\s]*/, 3)

["1", "2", "3, 4, 5"]


### 连接

与分割相反，`str_sequence.join(s)` 的作用是以s为连接符将字符串序列 `str_sequence` 中的元素连接起来，并返回连接后得到的新字符串：

In [22]:
s = ' '
numbers.join(s)

"1 2 3 4 5"

In [23]:
s = ','
numbers.join(s)

"1,2,3,4,5"

### 替换

`s.gsub(pattern, replacement)` 将字符串s中匹配pattern的部分替换成想要的部分replacement，并返回新的字符串。

In [24]:
s = "Hello World"
s.gsub('world', 'ruby')

"Hello World"

正则表达式分组替换

In [25]:
puts s.gsub(/([aeiou])/i, '<\1>')
puts s.gsub(/(?<foo>[aeiou])/, '{\k<foo>}')

H<e>ll<o> W<o>rld
H{e}ll{o} W{o}rld


`s.gsub(pattern, hash)` 将字符串s中匹配pattern的部分按照hash的规则替换，并返回新的字符串

In [26]:
puts s.gsub(/[eo]/, 'e' => '<e>', 'o' => '{*}')

H<e>ll{*} W{*}rld


此时，s的值并没有变化，替换方法只是生成了一个新的字符串。

In [27]:
s

"Hello World"

### 大小写转换

s.upcase()方法返回一个将s中的字母全部大写的新字符串。

s.downcase()方法返回一个将s中的字母全部小写的新字符串。

这两种方法也不会改变原来s的值：

In [28]:
s = "Hello World"
puts s.upcase()
puts s.downcase()

s

HELLO WORLD
hello world


"Hello World"

### 去除多余空格

s.strip()返回一个将s两端的多余空格除去的新字符串。

s.lstrip()返回一个将s开头的多余空格除去的新字符串。

s.rstrip()返回一个将s结尾的多余空格除去的新字符串。

In [29]:
s = "  hello world   "
s.strip()

"hello world"

s的值依然不会变化：

In [30]:
s

"  hello world   "

In [31]:
s.lstrip()

"hello world   "

In [32]:
s.rstrip()

"  hello world"

### 去除换行符

`s.chomp(separator=$/)` 一般用户去除字符串末尾出现的换行符

In [33]:
puts "hello".chomp                #=> "hello"
puts "hello\n".chomp              #=> "hello"
puts "hello\r\n".chomp            #=> "hello"
puts "hello\n\r".chomp            #=> "hello\n"
puts "hello\r".chomp              #=> "hello"
puts "hello \n there".chomp       #=> "hello \n there"
puts "hello".chomp("llo")         #=> "he"
puts "hello\r\n\r\n".chomp('')    #=> "hello"
puts "hello\r\n\r\r\n".chomp('')  #=> "hello\r\n\r"

hello
hello
hello
hello

hello
hello 
 there
he
hello
hello



### 首字母大写

仅首字母大写，其他字母全小写

In [34]:
puts "HELLO".capitalize
puts "hello".capitalize

Hello
Hello


### 字符串翻转

In [35]:
puts "Hello Wrold".reverse

dlorW olleH


### 字符填充

`s.center(width, padstr=' ')` 用于把字符串s居中填充到指定长度

In [36]:
puts "hello".center(3)
puts "hello".center(30)
puts "hello".center(30, '@')

hello
            hello             
@@@@@@@@@@@@hello@@@@@@@@@@@@@


## 更多方法

可以使用 `s.methods(true)` 函数查看所有可以使用的方法：

In [37]:
s = "Hello World"
s.methods().sort

[:!, :!=, :!~, :%, :*, :+, :+@, :-@, :<, :<<, :<=, :<=>, :==, :===, :=~, :>, :>=, :[], :[]=, :__id__, :__send__, :ascii_only?, :b, :between?, :bytes, :bytesize, :byteslice, :capitalize, :capitalize!, :casecmp, :casecmp?, :center, :chars, :chomp, :chomp!, :chop, :chop!, :chr, :clamp, :class, :clear, :clone, :codepoints, :concat, :count, :crypt, :define_singleton_method, :delete, :delete!, :display, :downcase, :downcase!, :dump, :dup, :each_byte, :each_char, :each_codepoint, :each_line, :empty?, :encode, :encode!, :encoding, :end_with?, :enum_for, :eql?, :equal?, :extend, :force_encoding, :freeze, :frozen?, :gem, :getbyte, :gsub, :gsub!, :hash, :hex, :include?, :index, :insert, :inspect, :instance_eval, :instance_exec, :instance_of?, :instance_variable_defined?, :instance_variable_get, :instance_variable_set, :instance_variables, :intern, :is_a?, :itself, :kind_of?, :length, :lines, :ljust, :lsmagic, :lstrip, :lstrip!, :match, :match?, :method, :methods, :next, :next!, :nil?, :object_id,

> 有别于其他语言，ruby的字符串是可变的，按照惯例，所有带`!`后缀的方法都是直接在原字符串上操作

| 返回新串 | 原地修改  | 说明 |
| :------ | :-------| :---- |
| sub | sub! | 按照模式替换，仅替换第一次出现的 |
| gsub | gsub! | 按照模式替换 |
| lstrip | lstrip! | 将字符串开头的多余空格除去 |
| rstrip | rstrip! | 将字符串结尾的多余空格除去 |
| strip | strip! | 将字符串两端的多余空格除去 |
| chomp | chomp! | 将字符串末尾的换行分隔符去除 |
| tr | tr! | 替换，比gsub高效 |
| upcase | upcase! | 转换为大写 |
| downcase | downcase! | 转换为小写 |
| capitalize | capitalize! | 首字母大写 |
| squeeze | squeeze! | 字符串中多个重复指定字符保留一个 |
| encode | encode! | 编码转换 |

### 字符串操作

In [38]:
s = ""
(0...10).each{|i| s << i.to_s}
s

"0123456789"

In [39]:
puts s[1]
puts s[3]
puts s[-1]
puts s[1..3]
puts s[1, 3]

1
3
9
123
123


In [40]:
s = "0123456789"
s[0] = 'ab'
s[-1] = 'xyz'
s

"ab12345678xyz"

In [41]:
s = 'Ruby Notes rebuild'
puts s[/r../]
puts s[/r../i]

reb
Rub


In [42]:
s = 'Ruby Notes rebuild'
s['Notes'] = "note"
s

"Ruby note rebuild"

## 强制转换为字符串

* `obj.to_s` 强制将 `obj` 转化成字符串。 
* `obj.inspect`也是强制将 `obj` 转化成字符串。

In [43]:
(1.1 + 2.2).to_s

"3.3000000000000003"

In [44]:
(1.1 + 2.2).inspect

"3.3000000000000003"

## 整数与不同进制的字符串的转化

可以将整数按照不同进制转化为不同类型的字符串。

十六进制：

In [45]:
255.to_s(16)

"ff"

八进制：

In [46]:
255.to_s(8)

"377"

二进制：

In [47]:
255.to_s(2)

"11111111"

可以使用 `to_i` 将字符串转为整数：

In [48]:
'255'.to_i

255

还可以指定按照多少进制来进行转换，最后返回十进制表达的整数：

In [49]:
'FF'.to_i(16)

255

In [50]:
'377'.to_i(8)

255

In [51]:
'11111111'.to_i(2)

255

`float` 可以将字符串转换为浮点数：

In [52]:
'3.5'.to_f

3.5

## 格式化字符串

**Ruby**用字符串的`%`方法来格式化字符串。

具体用法如下，字符串中花括号 `%` 的部分会被 `%` 传入的参数替代，传入的值可以是 `Array`，`Hash`，单个替换可以是字符串，数字或者别的对象。

In [53]:
'%s %s %s' % ['a', 'b', 'c']

"a b c"

还可以指定传入参数的名称：

In [54]:
'%{c} %{b} %{a}' % {a: 'a', b: 'b', c: 'c'}

"c b a"

In [55]:
'%{color} %{n} %{x}' % {n: 10, x: 1.5, color: 'blue'}

"blue 10 1.5"

可以用`{<field name>:<format>}`指定格式：

In [56]:
'%-10s %010d %2.52f' % ['foo', 5, 2 * Math::PI]

"foo        0000000005 6.2831853071795862319959269370883703231811523437500000"