Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

中国地学数据的来源和引用 #363

Open
core-man opened this issue Jun 2, 2021 · 20 comments
Open

中国地学数据的来源和引用 #363

core-man opened this issue Jun 2, 2021 · 20 comments
Labels

Comments

@core-man
Copy link
Member

core-man commented Jun 2, 2021

(Originally posted in #343 (comment))

来源和构建流程

  • 地学数据的来源比较重要,涉及到数据的可靠性。
  • 如果有必要,一些数据的构建流程也可能需要说明。目前我们只是直接给出gmt格式的数据文件,尚无每个数据文件是如何建设而成的详细说明

引用

  • 为了给予原作者更多的尊重和信誉,应该为每个数据添加引用方式,这也会鼓励大家贡献数据。
  • 如果是社区自行构建的数据库,我们是否可以统一一下引用方式,弄一个 doi?
@seisman
Copy link
Member

seisman commented Jun 4, 2021

  • 一些数据的构建流程也可能需要说明。目前我们只是直接给出gmt格式的数据文件,尚无每个数据文件是如何建设而成的详细说明

这些会尽量在 GMT_Docs 中说明。

  • 为了给予原作者更多的尊重和信誉,应该为每个数据添加引用方式,这也会鼓励大家贡献数据。

贡献数据的用户可能没有数据的版权,此时可以提到贡献者的贡献,引用还是需要引用原始数据的出处。

  • 如果是社区自行构建的数据库,我们是否可以统一一下引用方式,弄一个 doi?

同上,社区构建的数据,但社区并没有版权,所以并不适合引用,也就没必要弄doi。

@core-man
Copy link
Member Author

core-man commented Jun 4, 2021

  • 一些数据的构建流程也可能需要说明。目前我们只是直接给出gmt格式的数据文件,尚无每个数据文件是如何建设而成的详细说明

这些会尽量在 GMT_Docs 中说明。

中文手册中目前并未说明。不过,我们应该先重点在迁移数据库,迁移完毕后再努力解决数据建设流程的说明。

  • 为了给予原作者更多的尊重和信誉,应该为每个数据添加引用方式,这也会鼓励大家贡献数据。

贡献数据的用户可能没有数据的版权,此时可以提到贡献者的贡献

目前中文手册和本数据库中并未提到贡献者的贡献

引用还是需要引用原始数据的出处。

本数据库中并未说明原始数据的出处。另外,我们真的需要在手册和数据库中重复原始数据的出处吗?

@seisman
Copy link
Member

seisman commented Jun 4, 2021

本数据库中并未说明原始数据的出处。另外,我们真的需要在手册和数据库中重复原始数据的出处吗?

只在手册里说明,见 gmt-china/china-geospatial-data#21

@core-man core-man pinned this issue Jun 4, 2021
@seisman
Copy link
Member

seisman commented Jun 8, 2021

Close?

@core-man
Copy link
Member Author

core-man commented Jun 8, 2021

等我检查完数据的来源和引用吧,其实我还想把数据到底如何构建而成的记录好。目前这些数据相当于直接投过来,我们没有做只量检查。

@seisman seisman transferred this issue from gmt-china/china-geospatial-data Jun 8, 2021
@seisman
Copy link
Member

seisman commented Jun 8, 2021

FYI, I just transferred the issue to the GMT_Docs repository.

@seisman
Copy link
Member

seisman commented Jun 25, 2021

  • CN-block
  • CN-faults
  • CN-border
  • geoal

@core-man
Copy link
Member Author

core-man commented Jun 27, 2021

仅仅是为了互相引用,方便我们跳转和联系不同issue和pr

@core-man
Copy link
Member Author

core-man commented Jul 1, 2021

这个恐怕不是一个 good first issue.

@core-man
Copy link
Member Author

core-man commented Jul 13, 2021

貌似只剩 CN-borders 的具体构建流程没有补充了:

Ping @liuzhumei for comments.

@liuzhumei
Copy link
Member

liuzhumei commented Jul 14, 2021 via email

@liuzhumei
Copy link
Member

貌似只剩 CN-borders 的具体构建流程没有补充了:

Ping @liuzhumei for comments.

我确认一下,待补充的CN-borders数据集需要:

  1. 重新上传包含完整属性信息的CN-border数据
  2. 补充数据构建流程,把2017版1:100万全国标准基础地理数据!你值得拥有博文中数据处理部分的内容挪进来? 那原博文是否保留,如果保留,内容是否重复?

@seisman
Copy link
Member

seisman commented Jul 15, 2021

优先考虑整理数据

@core-man
Copy link
Member Author

  1. 重新上传包含完整属性信息的CN-border数据

数据库仓库优先更新

  1. 补充数据构建流程,把2017版1:100万全国标准基础地理数据!你值得拥有博文中数据处理部分的内容挪进来? 那原博文是否保留,如果保留,内容是否重复?

我觉得在 CN-borders 数据处理流程中只需说明所有命令行步骤即可。

至于剩余博文内容,我在 #499 中建议迁移至 自定义数据 中的一节,因为《1:100万全国标准基础地理数据》也算自定义数据了。然后将博文重定向至此节。

@liuzhumei
Copy link
Member

翻了一下午的资料,CN-border数据很棘手:

  1. 现在master中的 CN-border-La数据其实来自于不同版本数据的拼接。因为官方2017版数据里没有南海重要岛屿岛礁的范围线(其实我也不知道这些夸张的线条是怎么做的,毕竟在这个比例尺上应该看不到这些岛礁才对啊),如果我们以2017数据制作新的CN-border数据集,用户做出的地图毫无疑问是问题地图。
    image
  2. 官方2017版数据也不能直接提取得到CN-border-L1,它的海岸线是“中国及邻区”范围,无法区分国内/国外。同样
  3. “十段线”在官方2017版数据里是国界的一部分,无法与大陆国界相区分。

所以如果想得到原 CN-border-La、CN-border-L1和十段线数据文件,必须手工拼接(master分支的数据就是我手工拼的),这里的可靠性就不能保证了。而拼接的数据源要么是人工矢量化数据,要么是网上广为流传的1:400万2000版数据(也是官方版本,但目前已不提供下载途径),要么是高德爬下来的数据?

要么,我们就提供官方2017版数据的gmt版本,爱咋地咋地。要作图请去下载标准地图。

@core-man
Copy link
Member Author

core-man commented Jul 15, 2021

我同时绘制 CN-border-La.gmt, CN-border-L1.gmtten-dash-line.gmt 三个数据:

  • 可以看出 CN-border-La.gmtCN-border-L1.gmt 的差异只有省界,其他完全重和。
  • 但是,这两个文件包含的十段线其实跟 ten-dash-line.gmt 有所偏离,所以单独 ten-dash-line.gmt 是怎么得到的呢?
  • ten-dash-line.gmt 其实包含了 13 个字段?

gmt begin CN-border-JM pdf,png
    gmt set MAP_GRID_PEN_PRIMARY 0.25p,gray,2_2
    gmt coast -JM105/35/10c -R70/138/0/56 -Ba10f5g10 -G244/243/239 -S167/194/223
    gmt basemap -Lg85/17.5+c17.5+w800k+f+u --FONT_ANNOT_PRIMARY=4p
    gmt plot CN-border-La.gmt -W0.1p
    gmt plot CN-border-L1.gmt -W0.1p,blue
    gmt plot ten-dash-line.gmt -W0.1p,red
gmt end show

@core-man
Copy link
Member Author

官方2017版数据里没有南海重要岛屿岛礁的范围线(其实我也不知道这些夸张的线条是怎么做的,毕竟在这个比例尺上应该看不到这些岛礁才对啊)

所以,现在 CN-border 数据里的南海诸岛是从 2000 年版本里抠出来的?

官方2017版数据也不能直接提取得到CN-border-L1,它的海岸线是“中国及邻区”范围,无法区分国内/国外。

从图上看,2017 版本里没有明确的南海诸岛中国国界? 但有正确的省界十段线

“十段线”在官方2017版数据里是国界的一部分,无法与大陆国界相区分。

从图上看能看到十段线啊?

所以如果想得到原 CN-border-La、CN-border-L1和十段线数据文件,必须手工拼接(master分支的数据就是我手工拼的),这里的可靠性就不能保证了。

拼接的数据源要么是人工矢量化数据,要么是网上广为流传的1:400万2000版数据(也是官方版本,但目前已不提供下载途径)

现在master中的 CN-border-La数据其实来自于不同版本数据的拼接。

原来如此~

要么是高德爬下来的数据?

No~

@liuzhumei
Copy link
Member

现在的十段线数据 ten-dash-line.gmt 是有人传到qq群里的。 2017版标准数据里也有十段线,我建议用最新的数据更换,但由于 十段线国界 的GB码是完全一样的,所以不能自动提取,只能手动勾。要不我们不提供单独的十段线了吧?

@liuzhumei
Copy link
Member

至于 CN-border-La.gmtCN-border-L1.gmt 这两个文件应该也是存在着手工处理环节。 如果要全自动代码式处理,得到的只能是 2017版1:100万全国标准基础地理数据!你值得拥有 中 中国及邻区 国界+海岸线 的效果:
09 ChinaMap

@seisman
Copy link
Member

seisman commented Jul 25, 2021

从需求出发。我感觉大家通常的需求包括:

  1. 绘制中国国界、南海诸岛和十段线
  2. 绘制中国国界、省界、南海诸岛和十段线
  3. 绘制某个省及其周边省省界

似乎没有单独绘制十段线的需求?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants