from : http://www.importnew.com/3673.html
这个章节的内容包含
- 基本数据结构
- 函数组合器
基本数据结构
Scala提供了一些很方便的集合类。
参考 《Effective Scala》中关于怎么使用集合类的内容。
List
1
2
|
scala> val numbers = List( 1 , 2 , 3 , 4 )
numbers: List[Int] = List( 1 , 2 , 3 , 4 )
|
Set
集合中没有重复元素
1
2
|
scala> Set( 1 , 1 , 2 )
res0: scala.collection.immutable.Set[Int] = Set( 1 , 2 )
|
元组(Tuple)
元组可以直接把一些具有简单逻辑关系的一组数据组合在一起,并且不需要额外的类。
1
2
|
scala> val hostPort = ( "localhost" , 80 )
hostPort: (String, Int) = (localhost, 80 )
|
和case class不同,元组的元素不能通过名称进行访问,不过它们可以通过基于它们位置的名称进行访问,这个位置是从1开始而非从0开始。
1
2
3
4
5
|
scala> hostPort._1 res0: String = localhost scala> hostPort._2 res1: Int = 80
|
元组可以很好地和模式匹配配合使用。
1
2
3
4
|
hostPort match { case ( "localhost" , port) => ...
case (host, port) => ...
} |
创建一个包含2个值的元组有一个很简单的方式:->
1
2
|
scala> 1 -> 2
res0: (Int, Int) = ( 1 , 2 )
|
参考 《Effective Scala》中关于解除绑定(拆封一个元组)的观点。
Map
Map里可以存放基本的数据类型。
1
2
|
Map( 1 -> 2 )
Map( "foo" -> "bar" )
|
这个看起来是一个特殊的语法,不过回想一下前面我们讨论元组的时候,->
符号是可以用来创建元组的。
Map()可以使用我们在第一节里讲到的可变参数的语法:Map( 1 -> "one", 2 -> "two")
,它会被扩展为Map((1,"one"),(2,"two"))
,其中第一个元素参数是key,第二个元素是value。
Map里也可以包含Map,甚至也可以把函数当作值存在Map里。
1
|
Map( 1 -> Map( "foo" -> "bar" ))
|
1
|
Map( "timesTwo" -> { timesTwo(_) })
|
Option
Option
是一个包含或者不包含某些事物的容器。
Option的基本接口类似于:
1
2
3
4
5
|
trait Option[T] { def isDefined: Boolean
def get: T
def getOrElse(t: T): T
} |
Option本身是泛型的,它有两个子类:Some[T]
和None
我们来看一个Option的示例: Map.get
使用Option
来作为它的返回类型。Option的作用是告诉你这个方法可能不会返回你请求的值。
1
2
3
4
5
6
7
8
|
scala> val numbers = Map( 1 -> "one" , 2 -> "two" )
numbers: scala.collection.immutable.Map[Int,String] = Map(( 1 ,one), ( 2 ,two))
scala> numbers.get( 2 )
res0: Option[java.lang.String] = Some(two) scala> numbers.get( 3 )
res1: Option[java.lang.String] = None |
现在,我们要的数据存在于这个Option
里。那么我们该怎么处理它呢?
一个比较直观的方法就是根据isDefined
方法的返回结果作出不同的处理。
1
2
3
4
5
6
7
|
//如果这个值存在的话,那么我们把它乘以2,否则返回0。 val result = if (res1.isDefined) {
res1.get * 2
} else {
0
} |
不过,我们更加建议你使用getOrElse
或者模式匹配来处理这个结构。
getOrElse让你可以很方便地定义一个默认值。
1
|
val result = res1.getOrElse( 0 ) * 2
|
模式匹配可以很好地和Option
进行配合使用。
val result = res1 match { case Some(n) => n * 2 case None => 0 }
参考 《Effective Scala》中关于 Options的内容。
函数组合器
List(1,2,3) map squared
会在列表的每个元素上分别应用squared
函数,并且返回一个新的列表,可能是List(1,4,9)
。我们把类似于map
这样的操作称为组合器。(如果你需要一个更好的定义,你或许会喜欢Stackoverflow上的关于组合器的解释。
map
在列表中的每个元素上计算一个函数,并且返回一个包含相同数目元素的列表。
1
2
|
scala> numbers.map((i: Int) => i * 2 )
res0: List[Int] = List( 2 , 4 , 6 , 8 )
|
或者传入一个部分计算的函数
1
2
3
4
5
|
scala> def timesTwo(i: Int): Int = i * 2
timesTwo: (i: Int)Int scala> numbers.map(timesTwo _) res0: List[Int] = List( 2 , 4 , 6 , 8 )
|
foreach
foreach和map相似,只不过它没有返回值,foreach只要是为了对参数进行作用。
1
|
scala> numbers.foreach((i: Int) => i * 2 )
|
没有返回值。
你可以尝试把返回值放在一个变量里,不过它的类型应该是Unit(或者是void)
1
2
|
scala> val doubled = numbers.foreach((i: Int) => i * 2 )
doubled: Unit = () |
filter
移除任何使得传入的函数返回false的元素。返回Boolean类型的函数一般都称为断言函数。
1
2
|
scala> numbers.filter((i: Int) => i % 2 == 0 )
res0: List[Int] = List( 2 , 4 )
|
1
2
3
4
5
|
scala> def isEven(i: Int): Boolean = i % 2 == 0
isEven: (i: Int)Boolean scala> numbers.filter(isEven _) res2: List[Int] = List( 2 , 4 )
|
zip
zip把两个列表的元素合成一个由元素对组成的列表里。
1
2
|
scala> List( 1 , 2 , 3 ).zip(List( "a" , "b" , "c" ))
res0: List[(Int, String)] = List(( 1 ,a), ( 2 ,b), ( 3 ,c))
|
partition
partition
根据断言函数的返回值对列表进行拆分。
1
2
3
|
scala> val numbers = List( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 )
scala> numbers.partition(_ % 2 == 0 )
res0: (List[Int], List[Int]) = (List( 2 , 4 , 6 , 8 , 10 ),List( 1 , 3 , 5 , 7 , 9 ))
|
find
find返回集合里第一个匹配断言函数的元素
1
2
|
scala> numbers.find((i: Int) => i > 5 )
res0: Option[Int] = Some( 6 )
|
drop & dropWhile
drop
丢弃前i个元素
1
2
|
scala> numbers.drop( 5 )
res0: List[Int] = List( 6 , 7 , 8 , 9 , 10 )
|
dropWhile
移除前几个匹配断言函数的元素。例如,如果我们从numbers列表里dropWhile
奇数的话,1
会被移除(3
则不会,因为它被2
所“保护”)。
1
2
|
scala> numbers.dropWhile(_ % 2 != 0 )
res0: List[Int] = List( 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 )
|
foldLeft
1
2
|
scala> numbers.foldLeft( 0 )((m: Int, n: Int) => m + n)
res0: Int = 55
|
0是起始值(注意numbers是一个List[Int]),m是累加值。
更加直观的来看:
1
2
3
4
5
6
7
8
9
10
11
12
|
scala> numbers.foldLeft( 0 ) { (m: Int, n: Int) => println( "m: " + m + " n: " + n); m + n }
m: 0 n: 1
m: 1 n: 2
m: 3 n: 3
m: 6 n: 4
m: 10 n: 5
m: 15 n: 6
m: 21 n: 7
m: 28 n: 8
m: 36 n: 9
m: 45 n: 10
res0: Int = 55
|
foldRight
这个和foldLeft相似,只不过是方向相反。
1
2
3
4
5
6
7
8
9
10
11
12
|
scala> numbers.foldRight( 0 ) { (m: Int, n: Int) => println( "m: " + m + " n: " + n); m + n }
m: 10 n: 0
m: 9 n: 10
m: 8 n: 19
m: 7 n: 27
m: 6 n: 34
m: 5 n: 40
m: 4 n: 45
m: 3 n: 49
m: 2 n: 52
m: 1 n: 54
res0: Int = 55
|
flatten
flatten可以把嵌套的结构展开。
1
2
|
scala> List(List( 1 , 2 ), List( 3 , 4 )).flatten
res0: List[Int] = List( 1 , 2 , 3 , 4 )
|
flaoMap
flatMap是一个常用的combinator,它结合了map和flatten的功能。flatMap接收一个可以处理嵌套列表的函数,然后把返回结果连接起来。
1
2
3
4
5
|
scala> val nestedNumbers = List(List( 1 , 2 ), List( 3 , 4 ))
nestedNumbers: List[List[Int]] = List(List( 1 , 2 ), List( 3 , 4 ))
scala> nestedNumbers.flatMap(x => x.map(_ * 2 ))
res0: List[Int] = List( 2 , 4 , 6 , 8 )
|
可以把它当作map和flatten两者的缩写:
1
2
|
scala> nestedNumbers.map((x: List[Int]) => x.map(_ * 2 )).flatten
res1: List[Int] = List( 2 , 4 , 6 , 8 )
|
这个调用map和flatten的示例是这些函数的类“组合器”特点的展示。
See Also Effective Scala has opinions about flatMap.
参考 《Effective Scala》中关于flatMap的内容.
广义的函数组合器
现在,我们学习了一大堆处理集合的函数。
不过,我们更加感兴趣的是怎么写我们自己的函数组合器。
有趣的是,上面展示的每个函数组合器都是可以通过fold来实现的。我们来看一些示例。
1
2
3
4
5
6
7
8
|
def ourMap(numbers: List[Int], fn: Int => Int): List[Int] = { numbers.foldRight(List[Int]()) { (x: Int, xs: List[Int]) =>
fn(x) :: xs
}
} scala> ourMap(numbers, timesTwo(_)) res0: List[Int] = List( 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 )
|
为什么要List[Int]?因为Scala还不能聪明到知道你需要在一个空的Int列表上来进行累加。
如何处理好Map?
我们上面所展示的所有函数组合器都能都Map进行处理。Map可以当作是由键值对组成的列表,这样你写的函数就可以对Map里的key和value进行处理。
1
2
|
scala> val extensions = Map( "steve" -> 100 , "bob" -> 101 , "joe" -> 201 )
extensions: scala.collection.immutable.Map[String,Int] = Map((steve, 100 ), (bob, 101 ), (joe, 201 ))
|
现在过滤出所有分机号码小于200的元素。
1
2
|
scala> extensions.filter((namePhone: (String, Int)) => namePhone._2 < 200 )
res0: scala.collection.immutable.Map[String,Int] = Map((steve, 100 ), (bob, 101 ))
|
因为你拿到的是一个元组,所以你不得不通过它们的位置来取得对应的key和value,太恶心了!
幸运的是,我们实际上可以用一个模式匹配来优雅地获取key和value。
1
2
|
scala> extensions.filter({ case (name, extension) => extension < 200 })
res0: scala.collection.immutable.Map[String,Int] = Map((steve, 100 ), (bob, 101 ))
|
相关推荐
### Scala 集合数据操作详解 #### 一、引言 Scala作为一种融合了面向对象编程和函数式编程特点的编程语言,在数据处理方面展现出了极强的能力。它内置了一系列强大的集合类,使得开发者能够高效地对数据进行操作。...
【标题】"Scala集合(二)Java开发Java经验技巧共10页" 指的是一份关于Scala集合和Java开发技巧的文档,该文档共包含10页内容,可能是详细讲解了如何在Scala编程中使用集合,并结合了Java开发的经验和技巧。...
**Scala集合与Java开发:深度解析与经验技巧** 在编程世界中,Scala和Java是两种广泛应用的编程语言,尤其在企业级应用开发中占据重要地位。Scala,作为一门多范式编程语言,融合了面向对象和函数式编程的特性,为...
Scala集合框架的设计使得开发者可以根据具体需求选择最合适的集合类型。不可变集合适用于不需要修改的场景,而可变集合则适用于需要频繁修改的场景。理解不同集合类型之间的差异和特性有助于编写更高效、更安全的...
学习spark之前,大家必须先学会Scala这门语言,他是spark的基础,这里总结了一下Scala集合的相关知识点
Scala集合类型.md
Scala中集合的使用 大学生 1. List 列表的使用 2. Set 集合的使用 3.Map 映射的使用 4. 元组的使用
《scala集合技术手册》笔记+《LearningConcurrentProgrammingInScala》例子及习题
"Scala进阶之路-part02-集合.pdf"将带你深入了解Scala的集合库,它是Scala语言的一大亮点。这部分会讲解如何使用List、Set、Map等集合,以及如何进行集合操作,如映射、过滤、折叠等。此外,还会涉及Option和Either...
此文档是讲解实战Scala,希望对喜欢大数据的同学有所帮助!!! 学习Scala语言,不仅仅意味着熟悉新的API,更重要的是一种思维方式的转变。从原有的面向对象编程(OO)到函数式编程(FP)的思想。本书面向实际的使用场景...
15. **Java 集合与 Scala 集合的转换**: - 导入 `scala.jdk.CollectionConverters`,可以使用 `.asJava` 和 `.asScala` 转换。 16. **函数 values**: - 编写一个函数,根据给定区间和函数,生成对应的输入输出...
Scala-graph是针对Scala编程语言设计的一个强大的图形库,它为开发者提供了与Scala集合库无缝集成的图形处理功能。这个库的核心理念是模仿Scala集合API的风格和易用性,使得图形操作变得直观且高效。正如其名,Graph...
关于这是Scala集合库中并发的trie哈希映射实现的Java端口。 它曾经是从Scala到Java的几乎逐行转换。 如今,它已经被重构为对Java 8友好,并且无法通过重构来进行一些原始的断言。 在Aleksandar Prokopec撰写的这些...
VIEWDUCTION-传感器(折叠变压器)和Scala集合视图的交集。 该项目尝试通过以下思路来改善Scala集合视图的实现和性能: 我们不需要记住视图,而是需要让用户暂存所有所需的操作,然后根据需要执行。 在大多数...
### Scala习题精选知识点解析 #### 1. 关于与Scala进行交互的基本方式REPL的说明 - **知识点概述**:REPL(Read-Eval-Print Loop)是一种交互式的编程环境,用户可以在其中输入代码,系统立即执行并显示结果。在...
《Scala集合技术手册》则专注于Scala强大的集合API,这是Scala的一个亮点。Scala集合库提供了丰富的操作符和方法,使得处理数据变得极其简洁和高效。读者可以学习到如何使用映射(map)、过滤(filter)、折叠(fold...
此外,Scala集合库是其设计的一大亮点,它提供了丰富的数据结构和操作,如List、Set、Map等,这些集合都实现了高阶函数,使得代码更加简洁且富有表达力。Eclipse的Scala插件在代码编辑时会自动识别并应用这些库,...
基准 Scala 集合 第一个结果: L - List V - Vector Q - Queue [info] # Run complete. Total time: 06:11:26 [info] [info] Benchmark (field) Mode Cnt Score Error Units [info] CollectionsBench.appendL 100 ...
这个操作简洁、高效且易于理解,充分展示了Scala集合类的优势。 总之,Scala通过融合面向对象编程与函数式编程的最佳实践,为开发者提供了一种全新的编程体验。通过掌握Scala的核心编程要素,开发者可以充分利用其...