Posts Protocol Buffers
Post
Cancel

Protocol Buffers

介绍

Protobuf(Google Protocol Buffer) 是一种用于对结构数据进行序列化的工具,从而实现数据存储和交换。

  • 序列化: 将结构数据或者对象转换成能够用于存储和传输的格式。

  • 反序列化: 在其他的计算环境中,将序列化后的数据还原为数据结构和对象。

Protobuf是类似于JSON、XML这样的数据交换格式。但是相比于JSON和XML,它更小,更快!

优点:

  • 性能高效:与XML相比,protobuf更小(3 ~ 10倍)、更快(20 ~ 100倍)、更为简单。
  • 语言无关、平台无关:protobuf支持Java、C++、Python等多种语言,支持多个平台。
  • 扩展性、兼容性强:只需使用protobuf对结构数据进行一次描述,即可从各种数据流中读取结构数据,更新数据结构时不会破坏原有的程序。

缺点:

  • 自解释性较差,数据存储格式为二进制,需要通过.proto文件才能了解到内部的数据结构;
  • 不适合用来对 基于文本的标记文档(如HTML) 建模。

举个例子:如果想表达一个人名字叫James,年龄是35岁,邮箱是james@163.com这样的结构化数据,并且需要在互联网上传输,

  • xml表示如下:

    1
    2
    3
    4
    5
    
    <person>
       <name>John</name>
       <age>28</age>
       <email>jdoe@example.com</email>
     </person>
    
  • JSON表示如下:

    1
    2
    3
    4
    5
    
    {
        name: John,
        age: 28,
        email: jdoe@example.com
    }
    
  • Protobuf表示如下:

    1
    2
    3
    4
    5
    
    message Person {
        string name = 1;
        int32 age = 2;
        string email = 3;
    }
    

编码结构

参考ProtoBuf(Google Protocol Buffers)—— 编码结构简介(Varint 、ZigZag 、64-bit、32-bit、Length-delimited)

实践

定义自己的格式

创建person.proto,定义自己的格式。

1
2
3
4
5
6
7
8
9
10
11
12
13
syntax = "proto3";

package tutorial;

message Person {
  int32 id = 1;
  string name = 2;
  string email = 3;
}

message PersonList {
	repeated Person persons = 1;
}

编译.proto

1
2
3
export SRC_DIR=./
export DST_DIR=./
protoc -I=$SRC_DIR --cpp_out=$DST_DIR $SRC_DIR/person.proto

编译完后会生成person.pb.cc,person.pb.h两个文件。

使用

下面代码演示如何使用前面生成的文件。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
#include <iostream>
#include <string>
#include <sstream>
#include <map>

#include "person.pb.h"

// set the person's info
void SetPersonInfo(const tutorial::Person& infoPerson, tutorial::Person* pPerson)
{
    pPerson->set_id(infoPerson.id());
    pPerson->set_name(infoPerson.name());
    pPerson->set_email(infoPerson.email());
}

// print the persons
void ListAllPerson(const tutorial::PersonList& listPerson)
{
    for (int i = 0; i < listPerson.persons_size(); i++) {
        const tutorial::Person& person = listPerson.persons(i);
        std::cout << "ID: " << person.id() << std::endl;
        std::cout << "name: " << person.name() << std::endl;
        std::cout << "e-mail: " << person.email() << std::endl;
        std::cout << "----------------------------------------\n";
    }
}

int main(int argc, char* argv[])
{
    GOOGLE_PROTOBUF_VERIFY_VERSION;

    tutorial::Person person;
    person.set_id(666);
    person.set_name("Mark");
    person.set_email("mark@example.com");

    // serialize to io-stream
    std::stringstream ss;
    person.SerializeToOstream(&ss);
    std::string strData = ss.str();
    std::cout << "Data:" << strData << "\n";
    // deserialize from io-stream
    if (!person.ParseFromIstream(&ss)) {
        std::cerr << "Failed to parse person.pb." << std::endl;
        return -1;
    }
    std::cout << "ID: " << person.id() << std::endl;
    std::cout << "name: " << person.name() << std::endl;
    std::cout << "e-mail: " << person.email() << std::endl;

    // list data
    tutorial::PersonList listPerson;
    SetPersonInfo(person, listPerson.add_persons());

    tutorial::Person person1;
    person1.set_id(8468);
    person1.set_name("Test");
    person1.set_email("test@example.com");
    SetPersonInfo(person1, listPerson.add_persons());

    // serialize to io-stream
    std::stringstream ssList;
    listPerson.SerializeToOstream(&ssList);
    std::cout << "List:" << ssList.str() << "\n";
    std::cout << "--------------------Deserialize------------------\n";
    tutorial::PersonList listDeserialize;
    listDeserialize.ParseFromIstream(&ssList);
    ListAllPerson(listDeserialize);

    std::cout << "\nFinished\n";
    return 0;
}

编译上述代码

1
g++ create_person.cc ./person.pb.cc -o create_person -lprotobuf

编译成功后,执行,会打印以下内容

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(zcy) [zuo@zuo protobuf]$ ./create_person 
DataXXXXX@example.com  # 乱码
ID: 666
name: Mark
e-mail: mark@example.com
List:
XXXXXXmark@example.com  # 乱码
XXXXX@example.com  # 乱码
--------------------Deserialize------------------
ID: 666
name: Mark
e-mail: mark@example.com
----------------------------------------
ID: 8468
name: Test
e-mail: test@example.com
----------------------------------------

Finished
This post is licensed under CC BY 4.0 by the author.