Skip to content

Latest commit

 

History

History
478 lines (303 loc) · 16.4 KB

README.gist.md

File metadata and controls

478 lines (303 loc) · 16.4 KB
title
Python SDK 使用指南 | 七牛云存储

Python SDK 使用指南

此 Python SDK 适用于2.x版本,基于 七牛云存储官方API 构建。使用此 SDK 构建您的网络应用程序,能让您以非常便捷地方式将数据安全地存储到七牛云存储上。无论您的网络应用是一个网站程序,还是包括从云端(服务端程序)到终端(手持设备应用)的架构的服务或应用,通过七牛云存储及其 SDK,都能让您应用程序的终端用户高速上传和下载,同时也让您的服务端更加轻盈。

SDK 下载地址:https://github.com/qiniu/python-sdk/tags

文档大纲

概述

七牛云存储的 Python 语言版本 SDK(本文以下称 Python-SDK)是对七牛云存储API协议的一层封装,以提供一套对于 Python 开发者而言简单易用的开发工具。Python 开发者在对接 Python-SDK 时无需理解七牛云存储 API 协议的细节,原则上也不需要对 HTTP 协议和原理做非常深入的了解,但如果拥有基础的 HTTP 知识,对于出错场景的处理可以更加高效。

Python-SDK 被设计为同时适合服务器端和客户端使用。服务端是指开发者自己的业务服务器,客户端是指开发者提供给终端用户的软件,通常运行在 Windows/Mac/Linux 这样的桌面平台上。服务端因为有七牛颁发的 AccessKey/SecretKey,可以做很多客户端做不了的事情,比如删除文件、移动/复制文件等操作。一般而言,客服端操作文件需要获得服务端的授权。客户端上传文件需要获得服务端颁发的 uptoken(上传授权凭证),客户端下载文件(包括下载处理过的文件,比如下载图片的缩略图)需要获得服务端颁发的 dntoken(下载授权凭证)。但开发者也可以将 bucket 设置为公开,此时文件有永久有效的访问地址,不需要业务服务器的授权,这对网站的静态文件(如图片、js、css、html)托管非常方便。

从 v5.0.0 版本开始,我们对 SDK 的内容进行了精简。所有管理操作,比如:创建/删除 bucket、为 bucket 绑定域名(publish)、设置数据处理的样式分隔符(fop seperator)、新增数据处理样式(fop style)等都去除了,统一建议到开发者后台来完成。另外,此前服务端还有自己独有的上传 API,现在也推荐统一成基于客户端上传的工作方式。

从内容上来说,Python-SDK 主要包含如下几方面的内容:

  • 公共部分,所有用况下都用到:qiniu/rpc.py, qiniu/httplib_chunk.py
  • 客户端上传文件:qiniu/io.py
  • 客户端断点续上传:qiniu/resumable_io.py
  • 数据处理:qiniu/fop.py
  • 服务端操作:qiniu/auth/digest.py, qiniu/auth/up.py (授权), qiniu/rs/rs.py, qiniu/rs/rs_token.py (资源操作, uptoken/dntoken颁发)

准备开发环境

安装

直接安装:

pip install qiniu
#或
easy_install qiniu

Tornado is listed in PyPI and can be installed with pip or easy_install. Note that the source distribution includes demo applications that are not present when Tornado is installed in this way, so you may wish to download a copy of the source tarball as well. Python-SDK可以使用pipeasy_install从PyPI服务器上安装,但不包括文档和样例。如果需要,请下载源码并安装。

源码安装:

Python-SDK下载地址下载源码:

tar xvzf python-sdk-$VERSION.tar.gz
cd python-sdk-$VERSION
python setup.py install

ACCESS_KEY 和 SECRET_KEY

在使用SDK 前,您需要拥有一对有效的 AccessKey 和 SecretKey 用来进行签名授权。

可以通过如下步骤获得:

  1. 开通七牛开发者帐号
  2. 登录七牛开发者自助平台,查看 Access Key 和 Secret Key

使用SDK

初始化环境

在获取到 Access Key 和 Secret Key 之后,您可以在您的程序中调用如下两行代码进行初始化对接, 要确保ACCESS_KEYSECRET_KEY 在调用所有七牛API服务之前均已赋值:

@gist(gist/conf.py#config)

上传文件

为了尽可能地改善终端用户的上传体验,七牛云存储首创了客户端直传功能。一般云存储的上传流程是:

客户端(终端用户) => 业务服务器 => 云存储服务

这样多了一次上传的流程,和本地存储相比,会相对慢一些。但七牛引入了客户端直传,将整个上传过程调整为:

客户端(终端用户) => 七牛 => 业务服务器

客户端(终端用户)直接上传到七牛的服务器,通过DNS智能解析,七牛会选择到离终端用户最近的ISP服务商节点,速度会比本地存储快很多。文件上传成功以后,七牛的服务器使用回调功能,只需要将非常少的数据(比如Key)传给应用服务器,应用服务器进行保存即可。

上传流程

在七牛云存储中,整个上传流程大体分为这样几步:

  1. 业务服务器颁发 uptoken(上传授权凭证)给客户端(终端用户)
  2. 客户端凭借 uptoken 上传文件到七牛
  3. 在七牛获得完整数据后,发起一个 HTTP 请求回调到业务服务器
  4. 业务服务器保存相关信息,并返回一些信息给七牛
  5. 七牛原封不动地将这些信息转发给客户端(终端用户)

需要注意的是,回调到业务服务器的过程是可选的,它取决于业务服务器颁发的 uptoken。如果没有回调,七牛会返回一些标准的信息(比如文件的 hash)给客户端。如果上传发生在业务服务器,以上流程可以自然简化为:

  1. 业务服务器生成 uptoken(不设置回调,自己回调到自己这里没有意义)
  2. 凭借 uptoken 上传文件到七牛
  3. 善后工作,比如保存相关的一些信息

上传策略

uptoken 实际上是用 AccessKey/SecretKey 进行数字签名的上传策略(qiniu/rs/PutPolicy),它控制则整个上传流程的行为。让我们快速过一遍你都能够决策啥:

@gist(../qiniu/rs/rs_token.py#PutPolicy)
  • scope 限定客户端的权限。如果 scope 是 bucket,则客户端只能新增文件到指定的 bucket,不能修改文件。如果 scope 为 bucket:key,则客户端可以修改指定的文件。
  • callbackUrl 设定业务服务器的回调地址,这样业务服务器才能感知到上传行为的发生。
  • callbackBody 设定业务服务器的回调信息。文件上传成功后,七牛向业务服务器的callbackUrl发送的POST请求携带的数据。支持 魔法变量自定义变量
  • returnUrl 设置用于浏览器端文件上传成功后,浏览器执行301跳转的URL,一般为 HTML Form 上传时使用。文件上传成功后浏览器会自动跳转到 returnUrl?upload_ret=returnBody
  • returnBody 可调整返回给客户端的数据包,支持 魔法变量自定义变量returnBody 只在没有 callbackUrl 时有效(否则直接返回 callbackUrl 返回的结果)。不同情形下默认返回的 returnBody 并不相同。在一般情况下返回的是文件内容的 hash,也就是下载该文件时的 etag;但指定 returnUrl 时默认的 returnBody 会带上更多的信息。
  • asyncOps 可指定上传完成后,需要自动执行哪些数据处理。这是因为有些数据处理操作(比如音视频转码)比较慢,如果不进行预转可能第一次访问的时候效果不理想,预转可以很大程度改善这一点。

关于上传策略更完整的说明,请参考 uptoken

上传凭证

服务端生成 uptoken 代码如下:

@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#uptoken)

PutExtra

PutExtra是上传时的可选信息,默认为None

@gist(../qiniu/io.py#PutExtra)
  • params 是一个字典。自定义变量,key必须以 x: 开头命名,不限个数。可以在 uploadToken 的 callbackBody 选项中求值。
  • mime_type 表示数据的MimeType。
  • crc32 待检查的crc32值
  • check_crc 可选值为0, 1, 2。 check_crc=0: 表示不进行 crc32 校验。check_crc=1: 对于 put 等同于 check_crc=2;对于 put_file 会自动计算 crc32 值。check_crc == 2: 表示进行 crc32 校验,且 crc32 值就是上面的 crc32 变量

上传文件

上传文件到七牛(通常是客户端完成,但也可以发生在服务端):

直接上传二进制流

@gist(gist/conf.py#config)

@gist(demo.py#import_io)

@gist(demo.py#put)

上传本地文件

@gist(gist/conf.py#config)

@gist(demo.py#import_io)

@gist(demo.py#put_file)

ret是一个字典,含有hashkey等信息。

断点续上传、分块并行上传

除了基本的上传外,七牛还支持你将文件切成若干块(除最后一块外,每个块固定为4M大小),每个块可独立上传,互不干扰;每个分块块内则能够做到断点上续传。

我们来看支持了断点上续传、分块并行上传的基本样例:

上传二进制流

@gist(gist/conf.py#config)

@gist(demo.py#import_resumable_io)

@gist(demo.py#resumable_put)

上传本地文件

@gist(gist/conf.py#config)

@gist(demo.py#import_resumable_io)

@gist(demo.py#resumable_put_file)

下载文件

下载公有文件

每个 bucket 都会绑定一个或多个域名(domain)。如果这个 bucket 是公开的,那么该 bucket 中的所有文件可以通过一个公开的下载 url 可以访问到:

http://<domain>/<key>

假设某个 bucket 既绑定了七牛的二级域名,如 hello.qiniudn.com,也绑定了自定义域名(需要备案),如 hello.com。那么该 bucket 中 key 为 a/b/c.htm 的文件可以通过 http://hello.qiniudn.com/a/b/c.htmhttp://hello.com/a/b/c.htm 中任意一个 url 进行访问。

下载私有文件

如果某个 bucket 是私有的,那么这个 bucket 中的所有文件只能通过一个的临时有效的 downloadUrl 访问:

http://<domain>/<key>?e=<deadline>&token=<dntoken>

其中 dntoken 是由业务服务器签发的一个临时下载授权凭证,deadline 是 dntoken 的有效期。dntoken不需要单独生成,SDK 提供了生成完整 downloadUrl 的方法(包含了 dntoken),示例代码如下:

@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#dntoken)

生成 downloadUrl 后,服务端下发 downloadUrl 给客户端。客户端收到 downloadUrl 后,和公有资源类似,直接用任意的 HTTP 客户端就可以下载该资源了。唯一需要注意的是,在 downloadUrl 失效却还没有完成下载时,需要重新向服务器申请授权。

无论公有资源还是私有资源,下载过程中客户端并不需要七牛 SDK 参与其中。

断点续下载

无论是公有资源还是私有资源,获得的下载 url 支持标准的 HTTP 断点续传协议。考虑到多数语言都有相应的断点续下载支持的成熟方法,七牛 C-SDK 并不提供断点续下载相关代码。

资源操作

获取文件信息

@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#stat)

复制文件

@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#copy)

移动文件

@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#move)

删除文件

@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#delete)

批量操作

当您需要一次性进行多个操作时, 可以使用批量操作。

批量获取文件信息
@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#batch_path)

@gist(demo.py#batch_stat)

批量复制文件
@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#batch_path)

@gist(demo.py#batch_copy)

批量移动文件
@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#batch_path)

@gist(demo.py#batch_move)

批量删除文件
@gist(gist/conf.py#config)

@gist(demo.py#import_rs)

@gist(demo.py#batch_path)

@gist(demo.py#batch_delete)

高级管理操作

列出文件

请求某个存储空间(bucket)下的文件列表,如果有前缀,可以按前缀(prefix)进行过滤;如果前一次返回marker就表示还有资源,下一步请求需要将marker参数填上。

@gist(gist/conf.py#config)

@gist(demo.py#import_rsf)

@gist(demo.py#list_prefix)

云处理

图像

查看图像属性
@gist(gist/conf.py#config)

@gist(demo.py#import_fop)
@gist(demo.py#import_rs)

@gist(demo.py#image_info)

查看图片EXIF信息
@gist(gist/conf.py#config)

@gist(demo.py#import_fop)
@gist(demo.py#import_rs)

@gist(demo.py#exif)

生成图片预览
@gist(gist/conf.py#config)

@gist(demo.py#import_fop)
@gist(demo.py#import_rs)

@gist(demo.py#image_view)

贡献代码

  • Fork
  • 创建您的特性分支 (git checkout -b my-new-feature)
  • 提交您的改动 (git commit -am 'Added some feature')
  • 将您的修改记录提交到远程 git 仓库 (git push origin my-new-feature)
  • 然后到 github 网站的该 git 远程仓库的 my-new-feature 分支下发起 Pull Request

许可证

Copyright (c) 2013 qiniu.com

基于 MIT 协议发布:

www.opensource.org/licenses/MIT