Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

3.28 A First Look at Good First Issues on Github #12

Closed
xgdyp opened this issue Mar 27, 2022 · 5 comments
Closed

3.28 A First Look at Good First Issues on Github #12

xgdyp opened this issue Mar 27, 2022 · 5 comments
Labels
研究分享: 讨论 在公开场合(如组会)分享论文

Comments

@xgdyp
Copy link
Contributor

xgdyp commented Mar 27, 2022

论文地址:https://dl.acm.org/doi/abs/10.1145/3368089.3409746
摘要:本篇论文主要对issue label中first good issue类新手向标签进行了研究,主要的研究问题有四个:
How common do projects report GFIs?

How are GFIs solved?

What factors and problems are related to the effectiveness of GFIs?

How to identify appropriate GFIs?

分享时间:3.28 20:30

@will-ww
Copy link
Contributor

will-ww commented Mar 27, 2022

论文地址:https://dl.acm.org/doi/abs/10.1145/3368089.3409746 摘要:本篇论文主要对issue label中first good issue类新手向标签进行了研究,主要的研究问题有四个: How common do projects report GFIs?

How are GFIs solved?

What factors and problems are related to the effectiveness of GFIs?

How to identify appropriate GFIs?

分享时间:3.28 20:30

我们能否迭代一个论文分享的模板与流程,这样我们按照一个标准化的方式进行开展与沟通,几个重要的环节包括:

  • 论文选题
  • 会前相关资料分享
  • 论文分享、讨论、纪录
  • 会后内容输出
  • 后续(如果有的话)

@will-ww
Copy link
Contributor

will-ww commented Mar 27, 2022

分析与输出一篇文章,还可以参考:

附:一个预开题的模板框架,帮助大家进行思考与迭代

0、题目

一个具体明确的题目是成功的一半

1、研究视角

视角的选取是创新的主要来源,由于研究问题的特殊性,产生不同视角下的问题抽象。这块最能体现研究者的功力与水平,但同时对研究者要求最高,需要丰富的经验与广博的学识。对于工程领域而言,视角的选取与工程技术的熟悉程度,以及工程实践的深度密切相关。

2、研究对象

明确研究对象是选题中最核心的一个任务,也是后续其他任务的基础。广义来说,研究对象可以包括:人、物、事、理、模式。而对于工程技术来说,常见的包括:软件、服务、数据、算法、功能、流程等方面。

3、研究方法

绝大多数的工程技术类研究主要是采用工程构建与量化分析的研究方法。为了解决某个具体的问题,提出一种方法或方案,通过实际系统的构建验证方法的有效性,其中找到恰当的评价手段来进行实验分析尤其重要。

4、研究结果

对于大部分工程技术类题目来说,主要是实验结果,少数也可以是案例分析。重点是实验的设计、数据的获取与分析、以及结论分析等主要方面。

5、参考阅读

相关领域的大量文献阅读必不可少,可以是正式的学术论文,也可以是参考书籍、文档、开源项目、技术博客、标准规范等。硕士开题一般不少于20篇深度阅读论文,博士则不少于40篇。

选题6步法:

  • 确定研究对象
  • 确定研究视角
  • 确定研究问题
  • 确定研究方法
  • 预设研究结果
  • 实验设计

范例1(张礼庆,同济大学17级硕士生)

题目 面向最大化内存共享与最小化运行时环境的超轻量级容器设计方法
研究对象 容器(Docker)及其重要属性(镜像体积、运行时资源占用量等)
研究视角 在线实训环节,需要对大量的容器进行生灭操作,关注容器在运行时的性能表现
研究问题 如何降低容器的镜像体积,以及在运行时的资源占用率
研究方法 分析并量化共享库与内存资源利用率之间的关系,提出了一种超轻量级的容器设计方法,将依赖库文件与可执行二进制文件单独抽取成层,以及通过细化可操作资源的粒度支撑应用程序运行的容器运行时环境最小化。
预期结果
  • 现容器间即使仅 共享一小部分内容,就能对内存利用率造成非常显著的影响
  • 提出的方法能够在镜像体积、启动时间、内存占用比、磁盘 IO等方面优于已有方法
实验设计
  • 将提出的方法与已有的Docker容器管理引擎在各指标上进行对比
  • 主要评测方面包括容器基本属性和 CPU、内存、磁盘 3 方面的性能表现
  • 选取 5 种具有代表性且被使用广泛使用的软件作为构建基准测试集,包括 Python、NodeJS、MySQL、Nginx 与 Tomcat

范例2(吴佳洁,华东师范大学18级硕士生)

题目 面向混合云系统的多指标异常检测和故障定位研究
研究对象 分布式混合云系统及其运行状态
研究视角 实训平台构建在公有云与私有云或者本地基础设施相结合的复杂混合云环境中
研究问题 如何通过采集并利用混合云系统的监控数据进行异常检测和故障定位
研究方法 设计一个混合云实时监控和数据采集框架,提出一种多指标异常检测和单指标故障定位算法,以及提出一种故障定位改进算法
实验设计
  • 通过 Influxdb 和 Prometheus 开源软件搭建数据采集框架
  • 采集数据并标注异常点,构建实验数据集,同时也采用第三方公开数据集
  • 选取精准率、召回率、 F-1 分数作为评价指标
预期结果 提出的方法在上述指标下,优于一些传统的方法

templete.md

@xgdyp
Copy link
Contributor Author

xgdyp commented Mar 27, 2022

我感觉很好,我做了一些记录,等明天讲完以后可以再把这些记录按照这种格式传上来

@will-ww
Copy link
Contributor

will-ww commented Mar 27, 2022

我感觉很好,我做了一些记录,等明天讲完以后可以再把这些记录按照这种格式传上来

好滴,我们配合你来建立流程和模板,给大家打个样哈~

@birdflyi
Copy link
Collaborator

论文地址:https://dl.acm.org/doi/abs/10.1145/3368089.3409746 摘要:本篇论文主要对issue label中first good issue类新手向标签进行了研究,主要的研究问题有四个: How common do projects report GFIs?

How are GFIs solved?

What factors and problems are related to the effectiveness of GFIs?

How to identify appropriate GFIs?

分享时间:3.28 20:30

可以在 README.md T18 放上 [Video] 链接~ @xgdyp

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
研究分享: 讨论 在公开场合(如组会)分享论文
Projects
None yet
Development

No branches or pull requests

3 participants