# A股数据库

## TimescaleDB
参考资料：
- [Python quick start](https://docs.timescale.com/quick-start/latest/python/#connect-to-timescaledb)
### 数据库连接
1. 导入`psycopg2`
2. 基本信息：
    - password
    - username
    - host URL
    - port
    - database name
3. 构造链接字符串
    - 本地数据库，参考[Connection Strings](https://www.postgresql.org/docs/current/libpq-connect.html#LIBPQ-CONNSTRING)
        ```python
        CONNECTION = "postgres://username:password@host:port/dbname"
        ```
    - 云端数据库，在这种情况下，需要加上`ssl`信息：
        ```python
        CONNECTION = "postgres://username:password@host:port/dbname?sslmode=require"
        ```
    - 参数式：
        ```python
        CONNECTION = "dbname=tsdb user=tsdbadmin password=secret host=host.com port=5432 sslmode=require"
        ```
4. 链接方式：用`psycopg2`中的`connect`函数生成一个数据库环境（database session），并且在这个环境中，生成一个`cursor`对象，作为跟数据库交互的工具。
    ```python
    CONNECTION = "postgres://username:password@host:port/dbname"
    with psycopg2.connect(CONNECTION) as conn:
        cursor = conn.cursor()
        # use the cursor to interact with your database
        # cursor.execute("SELECT * FROM table")
    ```

In [1]:
from databases.postgresql.connection import get_conn_url_from_env, test_db_connection
from dotenv import load_dotenv

文件`.env`定义环境变量，其内容如下：
```bash
# For the Postgres/TimescaleDB database. 
POSTGRES_USER=postgres
POSTGRES_PASSWORD=password
POSTGRES_HOST=localhost
POSTGRES_PORT=5432
POSTGRES_DB=postgres
PGDATA=/var/lib/postgresql/data

# For the PGAdmin web app
PGADMIN_DEFAULT_EMAIL=zhifeng.zhang.sz@gmail.com
PGADMIN_DEFAULT_PASSWORD=password
```
对于这些环境变量，需要有调用的机制，而在python。调用的机制之一是`dotenv`包中的`load_dotenv`函数。

In [2]:
load_dotenv(dotenv_path='./.env')

True

程序包`databases.postgresql.connection`（对应于文件`$PYTHONPATH/databases/posgresql/connection.py`，对于此项目，`PYTHONPATH=src/python`，项目的根目录中`setenv.sh`，定义了这个环境变量）：

```python
def get_conn_url_from_env()->str:
    host=os.getenv('POSTGRES_HOST')
    port=os.getenv("POSTGRES_PORT") 
    dbname=os.getenv("POSTGRES_DB")
    user=os.getenv("POSTGRES_USER")
    password=os.getenv("POSTGRES_PASSWORD")
    return f'postgres://{user}:{password}@{host}:{port}/{dbname}'
```

函数`get_connection_from_env`基于环境变量`POSTGRES_*`，通过`os.getenv`提取`host`，`port`，`dbname`，`user`和`password`的信息，返回链接（connection）`url`字符串。

In [3]:
CONNECTION=get_conn_url_from_env()
print(CONNECTION)

postgres://postgres:password@localhost:5432/postgres


在目录`$PROJECTROOT/services/timescaledb`下，执行以下指令来启动`timescaledb`和`pdadmin`服务（只需运行一次，后续在系统启动后会自动启动）：
```bash
docker-compose -f docker-compose.timescale.yml -p timescaledb up -d
docker-compose -f docker-compose.pgadmin.yml -p pgadmin up -d
```

In [4]:
test_db_connection(CONNECTION)

Database postgres connected!


回顾一下以上对`timescaledb`链接的封装：根据`timescaledb`给出的接口格式，我们对本地链接进行了封装。首先用环境变量来定义链接的参数，然后建立链接业务概念。
1. 用`.env`文件来定义环境变量
2. 用`dotenv`中的`load_dotenv`函数来调用环境变量的定义，即在python环境里面生成所定义的环境变量。
3. 封装数据库的链接业务概念（dsl, domain specific language）为链接`url`和测试链接，分别提供了`get_conn_url_from_env`和`test_db_connection`两个函数。

注意1：这里我们把生成环境变量的逻辑独立于链接的业务逻辑，链接业务逻辑只关心从环境变量中提取相关信息，不关心（也不该关心）这些环境变量是如何产生的。

注意2：用户只须按约定定义环境变量（通过`.env`文件和`dotenv`程序包），运用业务概念提取链接`url`和测试链接`url`是否能够正常工作。在这个过程中，用户并不需要知道`psycopg2`或`os`。

## 建立数据表

In [5]:
from databases.postgresql.tables import create_tdx_tables, create_mydata_tables, create_yf_tables, create_fmp_tables

### 通达信

In [6]:
create_tdx_tables(CONNECTION)

### mydata

In [7]:
create_mydata_tables(CONNECTION)

### yfinance

In [8]:
create_yf_tables(CONNECTION)

### Finacial Modeling Prep

In [9]:
create_fmp_tables(CONNECTION)