`

Ruby中是如何處理字符串的?

阅读更多
#定义字符串
"abc"

'efg'

 %Q{abc} #等价于 ""

 %{hahaha} #等价于 ""

 %q!efg! #等价于 ''

 %!hello! #等价于 ''


Q:"" 和'' 两者之间的区别?
A:"" 中可以嵌入#{}输出表达式的值,或者是character escapes

str = "abc"

puts "this is #{str}" # this is abc

puts 'this is #{str}' # this is #{str}

puts "abc\nedf" # abc
                # edf

puts 'abc\nefg' # abc\nefg


Q:ruby中字符编码?
Q:在ruby中puts "中國" 出现"invalid multitype char<us-ASCII>"
A:ruby中的source code 默認的編碼是US-ACSII,不能解析中文。需要把源文件的編碼改為“適合”的方式,繁體是
#encoding: Big5


#new
my_name = "tony"

your_name = String.new(my_name)

puts my_name.object_id #5907780

puts your_name.object_id #5907768

your_name[0] = "m"

puts my_name # tony

puts your_name # mony


#String.try_convert

puts "try_convert"

puts String.try_convert("aBC") #aBC

puts String.try_convert(12345) #nil

puts String.try_convert("12345") #12345



# % format string
puts "%"
puts "str % arg -> string"

puts "%05d" % 123 #00123 formatstring = "%flag with precision name fieldtype"

puts "%0b" % 123 #1111011 

puts "%5s: %08x" % ["ID", self.object_id] #   ID: 005af846

puts "%-5s: %08X" % ["ID", self.object_id] #ID   : 005AF846

puts "%-5<name>s : %08<value>X" % {name: "hash_id", value: self.object_id} #hash_id: 005AF86


# * copies
# + concatenation 
# << append  if the object is a Fixnum it is considered to be a codepoint in the encoding
#    of str and converted to the appropriate character before being appended
# concat

puts "Ha" * 3 #HaHaHa

puts "Ha" + "Ho" #HaHo

puts "Hello" << 119 #Hellow

puts "Hello" << "Tony" #HelloTony

puts "concat"

puts "Hello".concat(" Tony") # Hello Tony

str = "hello"

str << 119

puts str << "Tony" #hellowTony


#[] []=
puts "[],[]="

str = "Hello Ruby"

puts str[-1] # y
puts str[0] # H
puts str[1] #e
puts str[9] #y
puts str[10] #nil

puts str[0..2] #hel

puts str[0...2] #he

puts str[0,2] #he

puts str["e"] #e

str[0..2] = 'haha'

puts str # hahalo Ruby


#ascii_only?
puts "ascii_only?"
puts __ENCODING__ #Big5

puts "ruby".ascii_only? #true

str = "中國"
puts str.ascii_only? #false


#bytes, chars, codepoints
#str.bytes -> enum
#str.bytes{|byte| block} -> str
#str.chars -> enum
#str.chars{|char| block}-> str
#codepoints(integers representation of the characters)
#str.codepoints -> enum
#str.codepoints {|integer| block} -> str
#getbyte
puts "bytes, getbyte"
p "ruby".bytes.to_a #[114,117,98,121]

puts "getbyte"
puts "ruby".getbyte(1) #117

result = []

puts "ruby".bytes {|byte| result << byte} #ruby

p result #[114,117,98,121]

puts "chars"

p "ruby".chars.to_a # ["r", "u", "b", "y"]

result = []

puts "ruby".chars {|char| result << char} #ruby 

p result # ["r", "u", "b", "y"]

puts "codepoints"

p "中國".codepoints.to_a # [42148, 45290]

result = []

puts "中國".codepoints {|b| result << b} #中國

p result #[42148, 45290] 



#bytesize, length, size
puts "bytesize, length"

puts "ruby".length #4
puts "ruby".bytesize #4
puts "ruby".size #4

puts "中國".length # 2
puts "中國".bytesize # 4
puts "中國".size #2


#capitalize, capitalize!
#capitalize  return a copy of str with the first character converted to 
#            uppcase and the remainder to lowercase
#capitalize! Modified str by converting the first character to uppercase and the 
#            ramainder to lowercase .Returns nil if no changes are made
puts "capitalize, capitalize! "

str = "hello Ruby"
puts "str = hello Ruby"

puts "str.capitalize = > #{str.capitalize}" #Hello ruby

puts "str = > #{str}" # hello Ruby

puts "str.capitalize! = > #{str.capitalize!}" # Hello Ruby

puts "str = > #{str}" # Hello Ruby

puts "str.capitalize! = > #{str.capitalize!}" # nil

puts "str = > #{str}" # Hello Ruby



#<=>, casecmp
puts "<=> , casecmp"

puts "abc" <=> "Abc" #1

puts "abc".casecmp("Abc") # 0

puts "abc" <=> "ab" #1

puts "abc".casecmp("ab") #1

puts "ab" <=> "abc" #-1

puts "ab".casecmp("abc") #-1



#center
puts "center"

str = "ruby"

puts str.center(4) #ruby

puts str.center(5) #ruby

puts str.center(10, '*') #***ruby***

puts str # ruby


#chr return the first character

puts "chr"

puts "ruby".chr # r

puts "中國".chr # 中


#clear removes the content(but not the associated encoding) of str

puts "clear"

str = "ruby"
puts str.clear #nil

puts str.length #0

#encoding: Big5
puts str.encoding #Big5


#chomp, chomp!
#chomp return new string with given record separator remove from the end of str
#str.chomp(rs = $/) -> string
puts "chomp, chomp!"

str =  "ruby"

p str.chomp # ruby

p str.chomp("y") # rub

str = "ruby\n"

p str.chomp # ruby

str = "ruby\n\r"

p str.chomp # ruby\n

str = "ruby\r\n"

p str.chomp # ruby

str = "ru \n by"
p str.chomp # ru \n by


#chop, chop!
#remove last character

puts "chop"
p "ruby".chop #rub
p "ruby\n".chop # ruby
p "ruby\r\n".chop #ruby
p "R".chop.chop # ""


#count, delete, delete! 
#str.count(<string>+)->int
#Each string parameter difines a set of characters to count.
#the intersection of these sets defines the characters to count in str
#Any parameter that starts with a caret(^) is negated
#The sequence c1-c2 means all characters between c1 and c2
puts "count"

str = "hello world"
puts str.count "lo" #5 在str 中 有 3 個 l 和 兩個 0 => 3 + 2 = 5

puts str.count "el" #4

puts str.count "lo", "o" #2 [l,o],[o]的交集是 0 在str中出現2個

puts str.count "ej-m" # 4 [e,j,k,l,m] 在str 中有 1個 e 3個l 總共 4

puts "delete"
puts str.delete "lo" # he wrd

puts str # hello world

puts str.delete! "e" # hllo world

puts str # hllo world

#crypt 加密
puts "crypt"

puts "ruby".crypt "ruby"


#downcase, downcase!
puts "downcase downcase!"

puts "ABC".downcase #abc


#dump
#Produces a version of str with all nonprinting characters replaced by \nnn notation
#and all special characters escaped
puts "dump"

p "ABC".dump #"\"ABC"\"

p "ABC" #"ABC"


#empty?
puts "empty?"

puts "hello".empty? # false

puts "".empty? #true


#encode, encode!, encoding, force_encoding
puts "encoding"

str = "ruby"

puts str.encoding #GBK

puts str.encode("utf-8") # ruby

puts str.encoding #GBK

puts str.encode!("utf-8") # ruby

puts str.encoding #utf-8

str.force_encoding("GBK")

puts str.encoding  #GBK



#gsub, gsub! 與正則表達式連用搜索字符串

#start_with? end_with?
puts "start_with?, end_with"

puts "Apache".end_with?("ache") # true

puts "ruby code".end_with?("python", "perl", "code") # true

puts "Apache".start_with?("Apa") # true

puts "ruby code".start_with?("python","perl","ruby") #true


#index
puts "index"

puts "hello".index("e") #1

puts "hello".index("a") #nil

puts "hello".index(/[aeiou]/, -3) #4

puts "hello".index("lo",4) #nil 第二參數開始搜索的位置


#insert
puts "insert"

puts "abcd".insert(0,"X") #Xabcd

puts "abcd".insert(-1, "X") #abcdX

puts "abcd".insert(1, "X") #aXbcd

puts "abcd".insert(-2, "X") #abcXd


#intern
#Return the Symbol corresponding to str, creatin the symbol if it did not 
#previously exist
puts "intern"

p "ruby".intern #:ruby
分享到:
评论

相关推荐

    ruby的二进制字符串与hex互转,二进制字符串与整数互转的工具函数

    本资源是ruby代码,提供了一系列封装好的函数,用于快速进行转换,一个函数搞定,包括如下转换,二进制字符串与hex字符串的互转。二进制字符串与整数互转,包括uint8,uin16,uint32, 以及本地字节序和网络字节序两种...

    RubyonRails字符串处理中文最新版本

    本文档旨在探讨Ruby on Rails中的字符串处理技术。在Ruby语言中,字符串可以通过多种方式创建。具体而言,字符串可以通过单引号('str')或双引号("str")来定义。这两种表示方式的主要区别在于它们对字符串内部...

    Ruby-Unicode字符串调试帮助

    在Ruby编程语言中,处理Unicode字符串是一项常见的任务,尤其是在全球化和多语言应用的开发中。Unicode是一个广泛采用的标准,它包含世界上几乎所有的字符集,使得跨语言的数据交换变得可能。然而,由于Unicode的...

    Ruby 字符串处理

    Ruby将字符串像数字一样处理.我们用单引号(‘…’)或双引号(…)将它们括起来. ruby&gt; abc  abc ruby&gt; ‘abc’  abc 单引号和双引号在某些情况下有不同的作用.一个由双引号括起来的字符串允许字符由一个前置的斜杠...

    Ruby中常用的字符串处理函数使用实例

    2.判断字符串中是否包含另一个串 代码如下: str.include? other_str =&gt; true or false “hello”.include? “lo” #=&gt; true “hello”.include? “ol” #=&gt; false “hello”.include? ?h #=&gt; true 3.字符串插入 ...

    Ruby-Stringex一些实用的Ruby字符串扩展类

    Ruby是一种面向对象的动态...总之,Stringex是Ruby开发者的一个强大工具,它扩展了Ruby的内建字符串类,使得处理字符串变得更加简单和直观。无论你是新手还是经验丰富的开发者,都值得在你的项目中尝试和利用这个库。

    ruby基础教程(第四版)第14章 字符串类1

    在处理字符串时,换行符有时需要特别处理。`chop` 方法会删除字符串末尾的一个字符,而 `chomp` 方法专门用于移除末尾的换行符。`chop!` 和 `chomp!` 分别是它们的变体,会直接修改原始字符串。需要注意的是,不同...

    使用Ruby来处理文本的教程

    除了处理字符串,Ruby还能处理各种格式的文本数据。比如CSV(逗号分隔值),经常用来存储表格数据,Ruby提供了CSV模块来读取和写入CSV文件。在处理XML数据时,Ruby的REXML库能够解析和生成XML文档,支持XML数据的...

    多行字符串的表示方式

    在编程领域,尤其是在Ruby语言中,处理多行字符串是一个常见的需求。标题“多行字符串的表示方式”聚焦于如何在代码中优雅地表示跨越多行的文本。Ruby提供了多种方法来处理这样的情况,使得代码更加易读且维护性更强...

    字符串压缩

    字符串压缩的主要目的是通过消除数据中的冗余来降低存储需求,这在处理大量文本数据时尤其有用。在编程领域,有许多不同的压缩算法,如霍夫曼编码、LZ77、LZ78、DEFLATE(广泛应用于ZIP和GZIP格式)等。 描述中提到...

    用string拆分字符串

    无论是在哪种语言中,理解并熟练运用字符串拆分技巧对于处理文本数据至关重要,尤其是在数据分析、日志解析和文件处理等场景中。通过学习这些方法,我们可以更有效地从字符串中提取信息,为后续的编程任务提供便利。

    分割字符串函数 分割字符串函数

    无论在哪个编程语言中,字符串分割函数都是数据处理的关键组件,尤其在处理CSV、日志文件或解析URL等场景中。它们可以方便地将大字符串转换为可操作的数据结构,进而进行进一步的分析和处理。 了解了这些基本知识后...

    为何Ruby 1.9的不兼容性会导致原有Ruby代码无法工作

    在处理不同长度的数组时,多余的元素在Ruby 1.9中会被忽略。 这些变化给现有代码带来了挑战,开发者需要对代码进行修改以确保在1.9环境中正常运行。例如,Sam Ruby针对REXML库进行了兼容性调整,James Edward Gray ...

    Ruby中操作字符串的一些基本方法

    Ruby中的字符串操作非常灵活,提供了丰富的函数和方法来处理字符串内容。 1. **字符串创建与转义**: - 单引号字符串('...')不解析转义字符,例如'\n'不会换行,而'\''用于插入单引号自身。 - 双引号字符串("......

    Ruby中的字符串编写示例

    ### Ruby中的字符串编写示例详解 #### 一、概述 在Ruby编程语言中,字符串是极为常见且重要的数据类型之一。正确地使用字符串不仅能够提高代码的可读性,还能优化程序性能。本文将深入探讨Ruby中字符串使用的最佳...

    从字符串中返回指定数目的字符源代码.zip

    在IT行业中,字符串处理是编程工作中的基础任务之一。标题提到的"从字符串中返回指定数目的字符源代码"涉及到的是字符串操作的核心概念,尤其是在编程语言中如何截取字符串的一部分,通常这涉及到字符串的切片或者...

    字符串和时间戳相互转换

    在编程领域,字符串和时间戳之间的转换是常见的操作,尤其在处理日期和时间相关的功能时。时间戳(Timestamp)通常表示为自1970年1月1日(UTC/GMT的午夜)以来的秒数,不考虑闰秒。而字符串则可以是多种格式的日期和...

Global site tag (gtag.js) - Google Analytics