Java Serialable序列化

Java平台允许我们在内存中创建可复用的Java对象,但一般情况下,只有当JVM处于运行时,这些对象才可能存在,即,这些对象的生命周期不会比JVM的生命周期更长。但在现实应用中,就可能要求在JVM停止运行之后能够保存(持久化)指定的对象,并在将来重新读取被保存的对象。Java对象序列化就能够帮助我们实现该功能。

使用Java对象序列化,在保存对象时,会把其状态保存为一组字节,在未来,再将这些字节组装成对象。必须注意地是,对象序列化保存的是对象的"状态",即它的成员变量。由此可知,对象序列化不会关注类中的静态变量。

简单说就是为了保存在内存中的各种对象的状态(也就是实例变量,不是方法),并且可以把保存的对象状态再读出来。虽然你可以用你自己的各种各样的方法来保存object states,但是Java给你提供一种应该比你自己好的保存对象状态的机制,那就是序列化。

2.什么情况下需要序列化

a)当你想把的内存中的对象状态保存到一个文件中或者数据库中时候;

b)当你想用套接字在网络上传送对象的时候;

c)当你想通过RMI传输对象的时候;

3.示例

在Java中,只要一个类实现了java.io.Serializable接口,那么它就可以被序列化。此处将创建一个可序列化的类Person,本文中的所有示例将围绕着该类或其修改版。

1 public enum Gender {  
2     MALE, FEMALE  
3 } 

Java中每个枚举类型都会默认继承类java.lang.Enum,而该类实现了Serializable接口,所以枚举类型对象都是默认可以被序列化的。

Person类,实现了Serializable接口,它包含三个字段:name,String类型;age,Integer类型;gender,Gender类型。另外,还重写该类的toString()方法,以方便打印Person实例中的内容。

 1 public class Person implements Serializable {  
 2  
 3     private String name = null;  
 4  
 5     private Integer age = null;  
 6  
 7     private Gender gender = null;  
 8  
 9     public Person() {  
10         System.out.println("none-arg constructor");  
11     }  
12  
13     public Person(String name, Integer age, Gender gender) {  
14         System.out.println("arg constructor");  
15         this.name = name;  
16         this.age = age;  
17         this.gender = gender;  
18     }  
19  
20     public String getName() {  
21         return name;  
22     }  
23  
24     public void setName(String name) {  
25         this.name = name;  
26     }  
27  
28     public Integer getAge() {  
29         return age;  
30     }  
31  
32     public void setAge(Integer age) {  
33         this.age = age;  
34     }  
35  
36     public Gender getGender() {  
37         return gender;  
38     }  
39  
40     public void setGender(Gender gender) {  
41         this.gender = gender;  
42     }  
43  
44     @Override 
45     public String toString() {  
46         return "[" + name + ", " + age + ", " + gender + "]";  
47     }  
48 } 

SimpleSerial,是一个简单的序列化程序,它先将一个Person对象保存到文件person.out中,然后再从该文件中读出被存储的Person对象,并打印该对象。

public class SimpleSerial {  
 
    public static void main(String[] args) throws Exception {  
        File file = new File("person.out");  
 
        ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));  
        Person person = new Person("John", 101, Gender.MALE);  
        oout.writeObject(person);  
        oout.close();  
 
        ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));  
        Object newPerson = oin.readObject(); // 没有强制转换到Person类型  
        oin.close();  
        System.out.println(newPerson);  
    }  
} 

此时必须注意的是,当重新读取被保存的Person对象时,并没有调用Person的任何构造器,看起来就像是直接使用字节将Person对象还原出来的。

当Person对象被保存到person.out文件中之后,我们可以在其它地方去读取该文件以还原对象,但必须确保该读取程序的CLASSPATH中包含有Person.class(哪怕在读取Person对象时并没有显示地使用Person类,如上例所示),否则会抛出ClassNotFoundException。

4.当对一个对象实现序列化时,究竟发生了什么?

在没有序列化前,每个保存在堆(Heap)中的对象都有相应的状态(state),即实例变量(instance ariable)比如:

1 Foo  myFoo = new Foo();  
2 myFoo .setWidth(37);  
3 myFoo.setHeight(70); 

当通过下面的代码序列化之后,MyFoo对象中的width和Height实例变量的值(37,70)都被保存到foo.ser文件中,这样以后又可以把它 从文件中读出来,重新在堆中创建原来的对象。当然保存时候不仅仅是保存对象的实例变量的值,JVM还要保存一些小量信息,比如类的类型等以便恢复原来的对象。

1 FileOutputStream fs = new FileOutputStream("foo.ser");  
2 ObjectOutputStream os = new ObjectOutputStream(fs);  
3 os.writeObject(myFoo); 
 1 import java.io.*;
 2   
 3 public class  Box implements Serializable  
 4 {  
 5     private int width;  
 6     private int height;  
 7   
 8     public void setWidth(int width){  
 9         this.width  = width;  
10     }  
11     public void setHeight(int height){  
12         this.height = height;  
13     }  
14   
15     public static void main(String[] args){  
16         Box myBox = new Box();  
17         myBox.setWidth(50);  
18         myBox.setHeight(30);  
19   
20         try{  
21             FileOutputStream fs = new FileOutputStream("foo.ser");  
22             ObjectOutputStream os =  new ObjectOutputStream(fs);  
23             os.writeObject(myBox);  
24             os.close();  
25         }catch(Exception ex){  
26             ex.printStackTrace();  
27         }  
28     }  
29       
30 }  

5.默认序列化机制

如果仅仅只是让某个类实现Serializable接口,而没有其它任何处理的话,则就是使用默认序列化机制。使用默认机制,在序列化对象时,不仅会序列化当前对象本身,还会对该对象引用的其它对象也进行序列化,同样地,这些其它对象引用的另外对象也将被序列化,以此类推。所以,如果一个对象包含的成员变量是容器类对象,而这些容器所含有的元素也是容器类对象,那么这个序列化的过程就会较复杂,开销也较大。

6.影响序列化

在现实应用中,有些时候不能使用默认序列化机制。比如,希望在序列化过程中忽略掉敏感数据,或者简化序列化过程。下面将介绍若干影响序列化的方法。

6.1 transient关键字

当某个字段被声明为transient后,默认序列化机制就会忽略该字段。此处将Person类中的age字段声明为transient,如下所示,

1 public class Person implements Serializable {  
2     ...  
3     transient private Integer age = null;  
4     ...  
5 } 

输出为:

1 arg constructor  
2 [John, null, MALE] 

age字段未被序列化。

6.2 writeObject()方法与readObject()方法

对于上述已被声明为transitive的字段age,除了将transitive关键字去掉之外,是否还有其它方法能使它再次可被序列化?方法之一就是在Person类中添加两个方法:writeObject()与readObject(),如下所示:

 1 public class Person implements Serializable {  
 2     ...  
 3     transient private Integer age = null;  
 4     ...  
 5  
 6     private void writeObject(ObjectOutputStream out) throws IOException {  
 7         out.defaultWriteObject();  
 8         out.writeInt(age);  
 9     }  
10  
11     private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {  
12         in.defaultReadObject();  
13         age = in.readInt();  
14     }  
15 } 

在writeObject()方法中会先调用ObjectOutputStream中的defaultWriteObject()方法,该方法会执行默认的序列化机制,如5.1节所述,此时会忽略掉age字段。然后再调用writeInt()方法显示地将age字段写入到ObjectOutputStream中。readObject()的作用则是针对对象的读取,其原理与writeObject()方法相同。再次执行SimpleSerial应用程序,则又会有如下输出:

1 arg constructor  
2 [John, 31, MALE] 

必须注意地是,writeObject()与readObject()都是private方法,那么它们是如何被调用的呢?毫无疑问,是使用反射。详情可以看看ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。

6.3 Externalizable接口

无论是使用transient关键字,还是使用writeObject()和readObject()方法,其实都是基于Serializable接口的序列化。JDK中提供了另一个序列化接口--Externalizable,使用该接口之后,之前基于Serializable接口的序列化机制就将失效。此时将Person类作如下修改,

 1 public class Person implements Externalizable {  
 2  
 3     private String name = null;  
 4  
 5     transient private Integer age = null;  
 6  
 7     private Gender gender = null;  
 8  
 9     public Person() {  
10         System.out.println("none-arg constructor");  
11     }  
12  
13     public Person(String name, Integer age, Gender gender) {  
14         System.out.println("arg constructor");  
15         this.name = name;  
16         this.age = age;  
17         this.gender = gender;  
18     }  
19  
20     private void writeObject(ObjectOutputStream out) throws IOException {  
21         out.defaultWriteObject();  
22         out.writeInt(age);  
23     }  
24  
25     private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {  
26         in.defaultReadObject();  
27         age = in.readInt();  
28     }  
29  
30     @Override 
31     public void writeExternal(ObjectOutput out) throws IOException {  
32  
33     }  
34  
35     @Override 
36     public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {  
37  
38     }  
39     ...  
40 } 

此时再执行SimpleSerial程序之后会得到如下结果:

1 arg constructor  
2 none-arg constructor  
3 [null, null, null] 

从该结果,一方面,可以看出Person对象中任何一个字段都没有被序列化。另一方面,如果细心的话,还可以发现这此次序列化过程调用了Person类的无参构造器。

Externalizable继承于Serializable,当使用该接口时,序列化的细节需要由程序员去完成。如上所示的代码,由于writeExternal()与readExternal()方法未作任何处理,那么该序列化行为将不会保存/读取任何一个字段。这也就是为什么输出结果中所有字段的值均为空。

另外,使用Externalizable进行序列化时,当读取对象时,会调用被序列化类的无参构造器去创建一个新的对象,然后再将被保存对象的字段的值分别填充到新对象中。这就是为什么在此次序列化过程中Person类的无参构造器会被调用。由于这个原因,实现Externalizable接口的类必须要提供一个无参的构造器,且它的访问权限为public。

对上述Person类进行进一步的修改,使其能够对name与age字段进行序列化,但忽略掉gender字段,如下代码所示:

 1 public class Person implements Externalizable {  
 2  
 3     private String name = null;  
 4  
 5     transient private Integer age = null;  
 6  
 7     private Gender gender = null;  
 8  
 9     public Person() {  
10         System.out.println("none-arg constructor");  
11     }  
12  
13     public Person(String name, Integer age, Gender gender) {  
14         System.out.println("arg constructor");  
15         this.name = name;  
16         this.age = age;  
17         this.gender = gender;  
18     }  
19  
20     private void writeObject(ObjectOutputStream out) throws IOException {  
21         out.defaultWriteObject();  
22         out.writeInt(age);  
23     }  
24  
25     private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {  
26         in.defaultReadObject();  
27         age = in.readInt();  
28     }  
29  
30     @Override 
31     public void writeExternal(ObjectOutput out) throws IOException {  
32         out.writeObject(name);  
33         out.writeInt(age);  
34     }  
35  
36     @Override 
37     public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {  
38         name = (String) in.readObject();  
39         age = in.readInt();  
40     }  
41     ...  
42 } 

执行SimpleSerial之后会有如下结果:

1 arg constructor  
2 none-arg constructor  
3 [John, 31, null] 

7.相关注意事项

a)序列化时,只对对象的状态进行保存,而不管对象的方法;

b)当一个父类实现序列化,子类自动实现序列化,不需要显式实现Serializable接口;

c)当一个对象的实例变量引用其他对象,序列化该对象时也把引用对象进行序列化;

d)并非所有的对象都可以序列化,,至于为什么不可以,有很多原因了,比如:

1.安全方面的原因,比如一个对象拥有private,public等field,对于一个要传输的对象,比如写到文件,或者进行rmi传输 等等,在序列化进行传输的过程中,这个对象的private等域是不受保护的。

2. 资源分配方面的原因,比如socket,thread类,如果可以序列化,进行传输或者保存,也无法对他们进行重新的资源分 配,而且,也是没有必要这样实现。