Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Task] 理解 GitHub 上已归档的开源项目 #6

Closed
xiaoya-yaya opened this issue Mar 18, 2022 · 3 comments
Closed

[Task] 理解 GitHub 上已归档的开源项目 #6

xiaoya-yaya opened this issue Mar 18, 2022 · 3 comments
Assignees
Labels
学术论文: Writing 论文稿件写作与修改

Comments

@xiaoya-yaya
Copy link
Member

xiaoya-yaya commented Mar 18, 2022

Understanding The Archived Projects on GitHub

背景

理解 GitHub 上被 Archived 的开源项目,尤其是曾经具备着高活跃度、高关注度的项目出于什么样的原因被Archive,处于 Archived 状态下之后的这些项目拥有怎样的协作、迭代(如果存在的话)和发展/衰退的模式。

一个被 Archived 的项目实例:https://github.com/PHPOffice/PHPExcel

GitHub 上被 Archived 的项目是否就代表它已经是过去式,代表了衰败和停止演化呢?如果是的话,这些项目在历史上拥有怎样的协作、活跃和演化的行为轨迹?我们能否总结出一些导致开发者流失和项目衰败的因素和规律?

是否还存在其他方面的原因而归档一个项目,如在代码开放和协作策略上的考量?

思路

  • 抽取 5000 个左右存在时间在 5 年以上,Star 数 1 万以上的被 Archived 的项目
  • 给相应的项目维护者及活跃度高的贡献者发送问卷,问卷内容围绕项目的基本信息、协作模式和受访者认为的项目存档原因
  • 半结构化的访谈,进一步了解协作模式和存档原因
  • 从行为日志数据中观察项目历史年份中的活跃度、openRank指数、贡献者数量趋势等,结合分析
  • 与项目所具有的性质(规模、技术栈等)进行交叉分析

预期结果

  • 总结出一套项目被归档的模式和原因
  • 总结出一套项目衰败和开发者流失的原因
  • 推导出一些项目衰败模式和规律
  • 反推出一些项目健康和可持续性的关键要素
@xiaoya-yaya xiaoya-yaya self-assigned this Mar 18, 2022
@xiaoya-yaya xiaoya-yaya added this to the 2022 春季学期 milestone Mar 18, 2022
@xiaoya-yaya xiaoya-yaya added the 学术论文: Writing 论文稿件写作与修改 label Mar 18, 2022
@xiaoya-yaya
Copy link
Member Author

xiaoya-yaya commented Mar 18, 2022

灵感来源:谭鑫,周明辉老师等 2020 年的文章

A first look at good first issues on GitHub, Tan, X., Zhou, M., & Sun, Z, ESEC/FSE 2020

@xiaoya-yaya xiaoya-yaya changed the title [Research Topic] Understanding The Archived Projects on GitHub [Task] 理解 GitHub 上已归档的开源项目 Mar 18, 2022
@will-ww
Copy link
Contributor

will-ww commented Mar 18, 2022

你这绝对是个好方向,我也想一下,先把 PHPExcel 项目拉出来看看,有点意思:

image

@will-ww
Copy link
Contributor

will-ww commented Jun 3, 2022

看了下期中作业的汇总:https://xlab2017.yuque.com/msdpvs/rpifg5/26295762

感觉还是挺不错的,可以引申出不少的后续问题:

  • 被归当前社区活动的异常分析,例如转变成一个多指标的时间序列预测
  • 归档是一个非常强的信号(标签),标注数据也有了
  • 分析与总结归档项目的故事,归纳出归档的排在前面的几个原因
  • 结合供应链分析,对供应链上项目归档分线进行实时监控与预警
  • 相反,同时定义成功的项目集合,这样可以作为知识库进行建设

还可以继续想很多~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
学术论文: Writing 论文稿件写作与修改
Projects
None yet
Development

No branches or pull requests

2 participants