# 通过pyODPS访问MaxCompute的例子

MaxCompute原名ODPS，所以为了向前兼容，所以MaxCompute的python的包叫做odps（pyodps），这个例子只是简单example，详细的odps的python sdk的文档请参见https://pyodps.readthedocs.io/zh_CN/latest/index.html

我们确保有pyodps这个包，你可以在terminal用`pip list`看看是不是有pyodps的包
![pip](./odpspip.jpg)

然后我们import `odps` 

In [101]:
from odps import ODPS
from odps.df import DataFrame

通过endpoint和AK进行连接，这里我们访问MaxCompute的公开数据级，关于这个数据集的情况，大家可以参考https://yq.aliyun.com/articles/89763 ，同时也可以通过数加体验馆（https://data.aliyun.com/experience ）来使用这些数据，近距离的感受阿里云其他大数据产品。

In [113]:
access_id = '<your access id>'
access_key = '<your access key>'
project = 'public_data'
endpoint = 'http://service.cn.maxcompute.aliyun.com/api'
o = ODPS(access_id, access_key, project, endpoint)

我们可以通过`list_tables` 来查看项目中有多少表以ods_enterprise_share开头

In [116]:
tables = o.list_tables(prefix='ods_enterprise_share')
for table in tables:
    print table.name

ods_enterprise_share_basic
ods_enterprise_share_quarter_cashflow
ods_enterprise_share_quarter_growth
ods_enterprise_share_quarter_operation
ods_enterprise_share_quarter_profit
ods_enterprise_share_quarter_report
ods_enterprise_share_trade_h


通过`get_table` 来获取表以及它的schema

In [117]:
t = o.get_table('ods_enterprise_share_basic')
t.schema

odps.Schema {
  code                            string      # 代码
  name                            string      # 名称
  industry                        string      # 所属行业
  area                            string      # 地区
  pe                              string      # 市盈率
  outstanding                     string      # 流通股本
  totals                          string      # 总股本(万)
  totalassets                     string      # 总资产(万)
  liquidassets                    string      # 流动资产
  fixedassets                     string      # 固定资产
  reserved                        string      # 公积金
  reservedpershare                string      # 每股公积金
  eps                             string      # 每股收益
  bvps                            string      # 每股净资
  pb                              string      # 市净率
  timetomarket                    string      # 上市日期
  undp                            string      # 未分利润
  perundp                         string      # 每股未分配
  rev                             s

In [119]:
print t.exist_partition('ds=20170113')

True


然后你就可以通过以下接口来访问MaxCompute中的数据

In [122]:
with t.open_reader(partition='ds=20170113') as reader:
    count = reader.count
    for record in reader[:5]:
        print record

odps.Record {
  code                            u'code'
  name                            u'name'
  industry                        u'industry'
  area                            u'area'
  pe                              u'pe'
  outstanding                     u'outstanding'
  totals                          u'totals'
  totalassets                     u'totalAssets'
  liquidassets                    u'liquidAssets'
  fixedassets                     u'fixedAssets'
  reserved                        u'reserved'
  reservedpershare                u'reservedPerShare'
  eps                             u'esp'
  bvps                            u'bvps'
  pb                              u'pb'
  timetomarket                    u'timeToMarket'
  undp                            u'undp'
  perundp                         u'perundp'
  rev                             u'rev'
  profit                          u'profit'
  gpr                             u'gpr'
  npr                             u'npr'
  hold