Skip to content

Latest commit

 

History

History
76 lines (54 loc) · 2.36 KB

tutorial.rst

File metadata and controls

76 lines (54 loc) · 2.36 KB

快速上手

Datahub相关的基本概念

详情参见 DataHub基本概念

准备工作

  • 访问DataHub服务需要使用阿里云认证账号,需要提供阿里云accessId及accessKey。 同时需要提供可访问的DataHub服务地址。
  • 登陆 Datahub WebConsole页面 ,创建Project

日志信息

可以在自己的代码中设置日志的输出和打印级别,sdk中主要包含一些debug日志和error日志,以下是将sdk的DEBUG日志打印到控制台的配置样例

import logging

logger = logging.getLogger('datahub')
sh = logging.StreamHandler()
sh.setLevel(logging.DEBUG)
logger.addHandler(sh)

初始化DataHub对象

Datahub Python SDK提供的所有API接口均由 datahub.DataHub 类实现,所以第一步就是初始化一个DataHub对象。 可选项:

  • Datahub支持三种协议,主要在put/get record时,分别为Json、Protobuf和Batch协议。可在初始化Datahub对象时指定协议类型,默认为Json类型。
  • Datahub支持三种压缩类型,分别为DEFLATE、LZ4和ZLIB,默认为LZ4类型。
from datahub import DataHub, DatahubProtocolType
from datahub.models import CompressFormat

access_id = ***your access id***
access_key = ***your access key***
endpoint = ***your datahub server endpoint***
dh = DataHub(access_id, access_key, endpoint)
dh = DataHub(access_id, access_key, endpoint, protocol_type=DatahubProtocolType.PB)
dh = DataHub(access_id, access_key, endpoint, protocol_type=DatahubProtocolType.BATCH)
dh = DataHub(access_id, access_key, endpoint) # use lz4 compression when put/get record
dh = DataHub(access_id, access_key, endpoint, compress_format=CompressFormat.ZLIB) # use zlib compression when put/get record

更多详细定义: datahub_client

接口示例

针对常用接口分别给出以下示例:

tutorial-project tutorial-topic tutorial-schema tutorial-record tutorial-shard tutorial-meter tutorial-connector tutorial-subscription tutorial-offset tutorial-client