Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
65 changes: 18 additions & 47 deletions firstdata/sources/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,92 +6,63 @@

This directory contains metadata for all data sources included in FirstData.

## 总体进度 | Overall Progress

```
总目标: 1000+ 个数据源
当前完成: 150 个
完成度: ███████░░░░░░░░░░░░░ 15%
```

| 分类 | 目标 | 已完成 | 进度 |
|------|------|--------|------|
| 🇨🇳 中国 China | 500+ | 21 | 4.2% |
| 🌍 国际 International | 100+ | 45 | 45% |
| 🌎 各国 Countries | 200+ | 27 | 13.5% |
| 🎓 学术 Academic | 100+ | 26 | 26% |
| 🏭 行业 Sectors | 100+ | 31 | 31% |
| **总计 Total** | **1000+** | **150** | **15%** |
> 📊 **最新统计**: 查看 [indexes/statistics.json](../indexes/statistics.json) 获取实时数据源统计信息。

## 目录结构 | Directory Structure

### 📂 中国数据源 | China
**路径**: `sources/china/`
**目标**: 500+个数据源
**完成度**: 21/500 (4.2%)

中国政府机构和官方组织发布的权威数据源,涵盖20个领域:
- 国家级综合统计(1个)
- 国家级部委数据源(345个):金融、经济、交通、文化、科技、教育等17个领域
- 省级数据源(49个):34个省级行政区 + 15个重点城市
- 研究机构和特色数据(21个):6个研究机构 + 7个行业协会 + 8个特色数据
- 国家级综合统计
- 国家级部委数据源:金融、经济、交通、文化、科技、教育等17个领域
- 省级数据源:34个省级行政区 + 15个重点城市
- 研究机构和特色数据

[查看详情 | View Details →](china/README.md)

### 🌍 国际组织 | International
**路径**: `sources/international/`
**目标**: 100+个数据源
**完成度**: 45/100 (45%)

国际组织和跨国机构发布的全球性数据源,涵盖14个领域:
- 经济(8个)、贸易(6个)、能源(6个)
- 农业(5个)、教育(8个)、健康(10个)
- 环境(12个)、发展(13个)、金融(6个)
- 知识产权(5个)、地球科学(8个)
- 劳工与社会(6个)、交通运输(4个)、标准与计量(3个)
- 经济、贸易、能源、农业、教育、健康
- 环境、发展、金融、知识产权、地球科学
- 劳工与社会、交通运输、标准与计量

[查看详情 | View Details →](international/README.md)

### 🌎 各国官方 | Countries
**路径**: `sources/countries/`
**目标**: 200+个数据源
**完成度**: 进行中

各国官方政府机构发布的权威数据源,涵盖6大洲42个国家:
- 北美洲(30个):美国、加拿大、墨西哥
- 欧洲(50个):15个国家
- 亚洲(50个):14个国家(除中国)
- 大洋洲(10个):澳大利亚、新西兰
- 南美洲(15个):4个国家
- 非洲(15个):4个国家
- 北美洲:美国、加拿大、墨西哥
- 欧洲:15个国家
- 亚洲:14个国家(除中国)
- 大洋洲:澳大利亚、新西兰
- 南美洲:4个国家
- 非洲:4个国家

[查看详情 | View Details →](countries/README.md)

### 🎓 学术研究 | Academic
**路径**: `sources/academic/`
**目标**: 100+个数据源
**完成度**: 26/100+ (26%)

学术机构和研究组织维护的学术研究数据源,涵盖9个学科领域:
- 经济学(10个)、健康医学(10个)、环境科学(8个)
- 社会科学(8个)、物理学(5个)、化学(5个)
- 生命科学(10个)、材料学(1个)
- 地球科学与地理信息(15个)
- 经济学、健康医学、环境科学
- 社会科学、物理学、化学
- 生命科学、材料学
- 地球科学与地理信息

[查看详情 | View Details →](academic/README.md)

### 🏭 行业领域 | Sectors
**路径**: `sources/sectors/`
**目标**: 100+个数据源
**完成度**: 31/100+ (31%)

特定行业和专业领域的数据源,按照国际标准产业分类(ISIC Rev.4)组织:
- A-S共19个产业门类
- 从农业到服务业的完整覆盖
- 包括制造业、能源、金融、信息通信、教育、健康等

**注意**: 目录结构已从旧的主题分类更新为ISIC标准分类。

[查看详情 | View Details →](sectors/README.md)

## 分类规则 | Classification Rules
Expand Down
66 changes: 17 additions & 49 deletions firstdata/sources/academic/README.md
Original file line number Diff line number Diff line change
@@ -1,44 +1,12 @@
# 学术研究 | Academic Research

**总数**: 100+个数据源
**已完成**: 26个
**进度**: 26%

---

## 📊 总体进度

```
总目标: 100+ 个高质量学术数据源
当前完成: 26 个
完成度: █████░░░░░░░░░░░░ 26%
```

**目录结构**: ✅ 已完成
**数据填充**: 进行中

---

## 🎯 分类进度概览

| 类别 | 计划 | 完成 | 进度 | 说明 |
|------|------|------|------|------|
| 📊 经济学 | 10 | 6 | 60% | Economics |
| 🏥 健康医学 | 10 | 5 | 50% | Health & Medicine |
| 🧬 生命科学 | 10 | 6 | 60% | Life Sciences & Biology |
| 🧪 化学 | 5 | 4 | 80% | Chemistry |
| ⚛️ 物理学 | 5 | 2 | 40% | Physics |
| 🌍 环境科学 | 8 | 1 | 13% | Environmental Science |
| 👥 社会科学 | 8 | 2 | 25% | Social Science |
| 🔬 材料学 | 1 | 0 | 0% | Materials Science |
| 🌏 地球科学与地理信息 | 15 | 0 | 0% | Geoscience & Geography |
| **总计** | **100+** | **26** | **26%** | - |
> 📊 **最新统计**: 查看 [indexes/statistics.json](../../indexes/statistics.json) 获取实时数据源统计信息。

---

## 📚 已收录数据源

### 📊 经济学 Economics (6/10)
### 📊 经济学 Economics

#### BIS Statistics - 国际清算银行统计数据
- **文件**: [bis-statistics.json](economics/bis-statistics.json) ⭐💎
Expand Down Expand Up @@ -88,7 +56,7 @@
- **更新频率**: 年度
- **特色**: 顶层收入份额、财富集中度、性别不平等、World Inequality Report数据来源

### 🏥 健康医学 Health & Medicine (5/10)
### 🏥 健康医学 Health & Medicine

#### PubMed - PubMed生物医学文献数据库
- **文件**: [pubmed.json](health/pubmed.json) ⭐💎
Expand Down Expand Up @@ -130,7 +98,7 @@
- **更新频率**: 一次性(项目已完成)
- **特色**: NCI/NHGRI、全基因组测序、RNA-seq、甲基化、蛋白质组、GDC平台

### 🧬 生命科学 Life Sciences & Biology (6/10)
### 🧬 生命科学 Life Sciences & Biology

#### GenBank - 基因库
- **文件**: [genbank.json](biology/genbank.json) ⭐💎
Expand Down Expand Up @@ -180,7 +148,7 @@
- **更新频率**: 每日
- **特色**: EMBL-EBI维护、INSDC成员、测序数据归档、免费访问

### 🧪 化学 Chemistry (4/5)
### 🧪 化学 Chemistry

#### PubChem - NCBI公共化学数据库
- **文件**: [pubchem.json](chemistry/pubchem.json) ⭐💎
Expand Down Expand Up @@ -214,7 +182,7 @@
- **更新频率**: 季度
- **特色**: 加拿大阿尔伯塔大学维护、FDA批准药物、药代动力学数据、需注册访问

### ⚛️ 物理学 Physics (2/5)
### ⚛️ 物理学 Physics

#### CERN Open Data Portal - CERN开放数据门户
- **文件**: [cern-open-data.json](physics/cern-open-data.json) ⭐💎
Expand All @@ -232,7 +200,7 @@
- **更新频率**: 每日
- **特色**: 开放访问、CIF格式、无机/有机/金属有机晶体、结构参数、空间群信息

### 🌍 环境科学 Environmental Science (1/8)
### 🌍 环境科学 Environmental Science

#### Copernicus Open Access Hub - 哥白尼开放访问中心
- **文件**: [copernicus-open-access-hub.json](environment/copernicus-open-access-hub.json) ⭐💎
Expand All @@ -242,7 +210,7 @@
- **更新频率**: 每日
- **特色**: Sentinel卫星数据、大气监测、海洋监测、陆地监测、气候变化、紧急管理

### 👥 社会科学 Social Science (2/8)
### 👥 社会科学 Social Science

#### Afrobarometer - 非洲晴雨表
- **文件**: [afrobarometer.json](social/afrobarometer.json) ⭐💎
Expand Down Expand Up @@ -290,15 +258,15 @@

```
academic/
├── economics/ # 📊 经济学 (6/10个数据源)
├── health/ # 🏥 健康医学 (5/10个数据源)
├── biology/ # 🧬 生命科学 (6/10个数据源)
├── chemistry/ # 🧪 化学 (4/5个数据源)
├── physics/ # ⚛️ 物理学 (2/5个数据源)
├── environment/ # 🌍 环境科学 (1/8个数据源)
├── social/ # 👥 社会科学 (2/8个数据源)
├── materials/ # 🔬 材料学 (0/1个数据源)
├── geoscience/ # 🌏 地球科学与地理信息 (0/15个数据源)
├── economics/ # 📊 经济学
├── health/ # 🏥 健康医学
├── biology/ # 🧬 生命科学
├── chemistry/ # 🧪 化学
├── physics/ # ⚛️ 物理学
├── environment/ # 🌍 环境科学
├── social/ # 👥 社会科学
├── materials/ # 🔬 材料学
├── geoscience/ # 🌏 地球科学与地理信息
└── README.md
```

Expand Down
Loading