Skip to content

Latest commit

 

History

History
301 lines (224 loc) · 13.9 KB

lambda-learn2.md

File metadata and controls

301 lines (224 loc) · 13.9 KB

Android Lambda表达式学习2

Java8 Lambda表达式教程

一. 什么是λ表达式?

λ表达式本质上是一个匿名方法.

   public int add(int x , int y){
    return x + y;
   }

转成λ表达式后是这个样子:(但是我在代码里面转换时总感觉有点不对)

(int x , int y)-> x + y;

可见λ表达式由三部分组成:参数列表,箭头(->),以及一个表达式或语句块。

下面这个例子里的λ表达式没有参数,也没有返回值(相当于一个方法接受0个参数,返回void,其实就是Runnable里run方法的一个实现):

() -> System.out.println("Hello Lambda !");

二. λ表达式的类型(它是Object吗?)

λ表达式可以被当做是一个Object(注意措辞)。λ表达式的类型,叫做“目标类型(target type)”。

λ表达式的目标类型是“函数接口(functional interface)”,这是Java8新引入的概念。

它的定义是:一个接口,如果只有一个显式声明的抽象方法,那么它就是一个函数接口。一般用@FunctionalInterface标注出来(也可以不标)。举例如下:

   @FunctionalInterface
   public interface Runnable{void run();}
   
   public interface Callable<V>{ V call() throws Exception;}
   
   public interface ActionListener{ void actionPerformed(ActionEvent e);}
   
   public interface Comparator<T>{ int compare(T o1,T o2);boolean equals(Object obj);}

注意最后这个Comparator接口。它里面声明了两个方法,貌似不符合函数接口的定义,但它的确是函数接口。

这是因为equals方法是Object的,所有的接口都会声明Object的public方法——虽然大多是隐式的。所以,Comparator显式的声明了equals不影响它依然是个函数接口。

可以用一个λ表达式为一个函数接口赋值:

   Runnable r1 = () -> {System.out.println("Hello Lambda!");};
   //然后再赋值给一个Object
   Object obj = r1;

但是不能这样做:

   Object obj = ()->{System.out.println("Hello Lambda!");};//Error! Object is not a functional interface!

必须要显式的转型成一个函数接口才可以:

   Object obj = (Runnable)()->{System.out.println("Hello Lambda!");};

一个λ表达式只有在转型成一个函数接口后才能被当做Object使用。

假如我们自己写了一个函数接口,长得跟Runnable一模一样:

   @FunctionalInterface
   public interface MyRunnable{void run();}

那么,下面这两种写法都是正确的写法:

   Runnable r1 = () -> {System.out.println("Hello Lambda!");};
   MyRunnable r2 = () -> {System.out.println("Hello Lambda!");};

这说明,一个λ表达式可以有多个目标类型(函数接口),只要函数匹配成功即可。但是需要注意的是:一个λ表达式必须至少有一个目标类型。

JDK预定义了很多函数接口以避免用户重复定义。最典型的是Function:

   @FunctionalInterface
   public interface Function<T , R>{
    R apply (T t);
   }

上面的这个接口代表一个函数,接受一个T类型的参数,并返回一个R类型的返回值。

另一个预定义的函数接口叫做Consumer,跟Function的唯一不同是它没有返回值。

   @FunctionalInterface
   public interface Consumer<T>{
     void accept(T t);
   }

还有一个Predicate,用来判断某项条件是否满足。经常用来进行筛滤操作:

   @FunctionalInterface
   public interface Predicate<T>{
    boolean test(T t);
   }

综上所述,一个λ表达式其实就是定义了一个匿名方法,只不过这个方法必须符合至少一个函数接口。

三. λ表达式的使用

3.1 λ表达式用在何处

λ表达式主要用于替换以前广泛使用的内部匿名类,各种回调,比如事件响应器、传入Thread类的Runnable等。看下面的例子:

        Thread thread = new Thread(new Runnable() {
            @Override
            public void run() {
                System.out.println("This is from an anonymous class.");
            }
        });

        Thread thread1 = new Thread(() -> System.out.println("this is from an anonymous method (lambda exp)."));

注意第二个线程里面的λ表达式,我们并不需要显式的把它转成一个Runnable,因为Java能够根据上下文自动推断出来:一个Thread的构造函数接受一个Runable参数,
而传入的λ表达式正好符合其run()函数,所以Java编译器推断它为Runnable。

从形式上看,λ表达式只是为我们节省了几行代码。但将λ表达式引入Java的动机并不仅仅为此。Java8有一个短期目标和一个长期目标。

短期目标是:配合“集合类批处理操作”的内部迭代和并行处理(下面将要讲到);长期目标是将Java向函数式编程语言这个方向引导(并不是要完全变成一门函数式编程语言,只是让它有更多的函数式编程语言的特性),

也正是由于这个原因,Oracle并没有简单地使用内部类去实现λ表达式,而是使用了一种更动态、更灵活、易于将来扩展和改变的策略(invoke dynamic)。

3.2 λ表达式与集合类批处理操作(或者叫块操作) 前面提到的“集合类批处理操作”,它与λ表达式的配合使用是Java 8的最主要的特性之一。

集合类的批处理操作API的目的是实现集合类的“内部迭代”,并期望充分利用现代多核CPU进行并行计算。

Java8之前集合类的迭代(Iteration)都是外部的,即客户代码。而内部迭代意味着改由Java类库来进行迭代,而不是客户代码。例如:

   for(Object o:list){
    System.out.println(o);
   }

可以写成:

list.forEach(o->{System.out.println(o);});//forEach函数实现内部迭代

集合类(包括List)现在都有一个forEach方法,对元素进行迭代(遍历),所以我们不需要再写for循环了。forEach方法接受一个函数接口Consumer做参数,所以可以使用λ表达式。

这种内部迭代方法广泛存在于各种语言,如C++的STL算法库、python、ruby、scala等。

Java8为集合类引入了另一个重要的概念:流(stream)。一个流通常以一个集合类实例为其数据源,然后在其上定义各种操作。流的API设计使用了管道(pipelines)模式。
对流的一次操作会返回另一个流。如同IO的API或者StringBuffer的append方法那样,从而多个不同的操作可以在一个语句里串起来。看下面的例子:

   List<Shape> shapes=...
   shapes.stream()
      .filter(s->s.getColor==BLUE)
      .forEach(s->s.setColor(RED));

首先调用stream方法,以集合类对象shapes里面的元素为数据源,生成一个流。然后在这个流上调用filter方法,挑出蓝色的,返回另一个流。
最后调用forEach方法将这些蓝色的物体喷成红色。(forEach方法不再返回流,而是一个终端方法,类似于StringBuffer在调用若干append之后的那个toString)。

filter方法的参数是Predicate类型,forEach方法的参数是Consumer类型,它们都是函数接口,所以可以使用λ表达式。

还有一个方法叫做parallelStream(),顾名思义它和stream一样,只不过指明要并行处理,以期充分利用现代CPU的多核特性。

   shapes.parallelStream(); // 或shapes.stream().parallel()

来看更多的例子。下面是典型的大数据处理方法,Filter-Map-Reduce:

   //给出一个String类型的数组,找出其中所有不重复的素数
   public void distinctPrimary(String... numbers){
       List<String> l=Arrays.asList(numbers);
       List<Integer> r=l.stream() //生成流
                 .map(e->new Integer(e)) //把每个元素由String转成Integer,得到一个新的流
                 .filter(e->Primes.isPrime(e)) //过滤那些不是素数的数字,得到一个新的流
                 .distinct() //去掉重复,得到一个新的流
                 .collect(Collectors.toList()); //用collect方法将最终结果收集到一个List里面去,collect方法接受一个Collector类型的参数,这个参数指明如何收集最终结果。
       System.out.println("distinctPrimary result is: " + r);
   }

具体每一步的详细的解释可见原文。

也许我们会觉得在这个例子中,List l被迭代了好多次,map,filter,dintinct都分别是一次循环,效率会不好。实际上并非如此。
这些返回另一个Stream的方法都是“懒(lazy)”的,而最后返回最终结果的collect方法则是“急(eager)”的,在遇到eager方法之前,lazy的方法不会执行。

当遇到eager方法时,前面的lazy方法才会被依次执行。而且是管道贯通式执行。这意味着每一个元素依次通过这些管道。例如有个元素“3”,首先它被map成整数型3;
然后通过filter,发现是素数,被保留下来;又通过distinct,如果已经有一个3了,那么就直接丢弃,如果还没有则保留。这样,3个操作其实只经过了一次循环。

除collect外其它的eager操作还有forEach,toArray,reduce等。

下面看一个也许是最常用的收集器方法,groupingBy:

   //给出一个String类型的数组,找出其中各个素数,并统计其出现次数
   public void primaryOccurrence(String... numbers){
      List<String> l=Arrays.asList(numbers);
      Map<Integer,Integer> r=l.stream()
                 .map(e->new Integer(e))
                 .filter(e->Primes.isPrime(e))
                 .collect(Collectors.groupingBy(p->p, Collectors.summingInt(p->1)));
      System.out.println("primaryOccurrence result is: " + r);
   }

注意这一行:

   Collectors.groupingBy(p->p, Collectors.summingInt(p->1));

它的意思是:把结果收集到一个Map中,用统计到的各个素数自身作为键,其出现次数作为值。

下面是一个reduce的例子

   //给出一个String类型的数组,求其中所有不重复素数的和
   public void distinctPrimarySum(String... numbers){
        List<String> l=Arrays.aslist<numbers>;
        int sum=l.stream()
            .map(e->new Integer(e))
            .filter(e->Primes.isPrime(e))
            .distinct()
            .reduce(0,(x,y)->x+y);//equivalent to .sum()
        System.out.println("distinctPrimarySum result is: " + sum);    
   }

reduce方法用来产生单一的一个最终结果。

流有很多预定义的reduce操作,如sum(),max(),min()等。

再举一个现实世界中的例子,比如:

   //统计年龄在25-35岁的男女人数、比例
   public void boysAndGirls(List<Person> persons){
        Map<Integer,Integer> result=persons.parallelStream()
                                       .filter(p->p.getAge()>=25&&p.getAge()<=35)
                                       .collect(Collectors.groupingBy(p->p.getSex(),Collectors.summingInt(p->1))));
        System.out.print("boysAndGirls result is " + result);
        System.out.println(", ratio (male : female) is " + (float)result.get(Person.MALE)/result.get(Person.FEMALE));
   }

3.3 λ表达式的更多用法

        //嵌套的Lambda表达式
        Callable<Runnable> c1 = () -> () -> System.out.println("Nested Lambda");
        c1.call().run();

        //用在条件表达式中
        Callable<Integer> c2 = true ? (() -> 42) : (() -> 24);
        System.out.println(c2.call());

        //定义一个递归函数,注意需用this限定
        UnaryOperator<Integer> factorial = i -> i == 0 ? 1 : i * this.factorial.apply(i - 1);
        System.out.println(factorial.apply(3));

在Java中,随声明随调用的方式是不行的,比如下面这种:

 int five = ( (x, y) -> x + y ) (2, 3); // ERROR! try to call a lambda in-place

这在C++中是可以的,但是Java中不行。Java的λ表达式只能用作赋值、传参、返回值等。

四. 其它相关概念

4.1 捕获(Capture)

捕获的概念在于解决在Lambda表达式中我们可以使用哪些外部变量(即除了它自己的参数和内部定义的本地变量)的问题。

答案是:与内部类非常相似,但是有不同点。不同点在于内部类总是持有一个其外部类对象的引用。
而λ表达式,除非在它的内部用到了其外部类(包围类)对象的方法或者成员,否则它就不持有这个对象的引用。

在Java8以前,如果要在内部类访问外部对象的一个本地变量,那么这个变量必须声明为final才行。在Java8中,这种限制被去掉了,代之以一个新的概念,“effectively final”。
它的意思是你可以声明为final,也可以不声明final但是按照final来用,也就是一次赋值永不改变。换句话说,保证它加上final前缀后不会出编译错误。

在Java8中,内部类和λ表达式都可以访问effectively final的本地变量。

4.2 方法引用(Method reference) 任何一个λ表达式都可以代表某个函数接口的唯一方法的匿名描述符。我们也可以使用某个类的某个具体方法来代表这个描述符,叫做方法引用。详细描述见原文。

4.3 生成器函数(Generator function) 有时候一个流的数据源不一定是一个已存在的集合对象,也可能是个“生成器函数”。一个生成器函数会产生一系列元素,供给一个流。
Stream.generate(Supplier s)就是一个生成器函数。其中参数Supplier是一个函数接口,里面有唯一的抽象方法 get()。 例如:

   //生成并打印5个随机数
   Stream.generate(Math::random).limit(5).forEach(System.out::println);