Skip to content
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
chapter-dataanalysis
.gitignore
.travis.yml
LICENSE
README.md
SUMMARY.md
book.json
chapter-epilogue.md
chapter-insight.md
chapter-questionnaire.md

README.md

enter image description here

引言

软件的世界在悄然发生变化

当著名的马克安德森撰写《软件正在吞噬世界》的文章的时候,可能没有想到,在 6 年之后,他就需要加上一个定语:

开源软件正在吞噬世界!

面对人工智能的伦理问题、软件产能过剩的问题、软件转型为服务模式的问题、云计算已经像电力一样成为这个世界默认的基础设施、以及面向海量数据的处理问题。。。围绕这些问题解决的核心原则只有一个:Open Source!

由隐而显

开源 20 岁了,它的内涵和外延正在扩大,不仅仅是一个开源的代码项目,也不再仅仅是一个社区,而是正变得日益复杂,研究的人也越来越多,当然这是由于参与到开源中的人和企业越来越多了。以下不妨列举一番:

开源是一种社交现象

2018 年,有一个消息堪称开源界的重磅炸弹!这就是微软以 75 亿美元的价格收购了 GitHub,要知道在 1999 年,人们仍然不把开源当做一回事,[Bill Gates 在宣传他的书时](http://timreview.ca/sites/default/files/article_PDF/Suehle_TIMReview_January2012_0.pdf \t _blank),曾如此评价 Linux 的:“确实我们承认在学生和爱好者当中我们不如 Linux,但是我们从多个角度考察过,并不认为它能在商业市场上有何作为。”

开源不止于技术,隐藏在背后的是开发者、工程师们之间的协作与交流,以及彼此的默契与褒奖。而 GitHub 的个人 Profile 更是成为了比简历更能拿得出手的”金钥匙“。

那么这些开源的参与者们日常是如何交流的呢?为何这种交流如此的吸引他们呢?

开源是一种经济模式

开源界一直以来都在担心搭便车,当然现实中也不乏搭便车,顺便赚点钱的个人和企业。然而,学术界/经济圈发来了声音,来自哈佛商学院战略部门的 Frank Nagle 教授,刚刚发表了一篇长达 40 页的论文:["Learning by Contributing: Gaining Competitive Advantage Through Contribution to Crowdsourced Public Goods."](http://www.hbs.edu/faculty/product/54809 \t _blank) 从商业的角度论证了,为上游社区做贡献对于企业是大大有利的,这要比工程师布道用干巴巴的软件工程理论要有说服力的多,因为懂的算经济账的未必都懂得软件工程。

那些大的企业为何近来开始注重上游的贡献和曝光率?

开源是本土同步世界的绝佳方式

无论你承认与否,本土是没有拿得出手的软件基金会或大型的类似 Linux、Hadoop、Kubernetes、Docker、TensorFlow 这样的划时代的、创新意义的、能解决实际问题的开源项目的。当我们还在利用开源自主的时候,另外一个世界已经走出去很远了!而似乎本土只有” 拾人牙慧 “的份,在经历了本土 20 年的开源空白之后,终于还是有一些脚踏实地的务实者,按照国际化的方式运作着项目,虽然力量仍显单薄,但终究是一个良好的开端!

问题:你知道本土的这些在国际上颇有名誉的项目都有哪些吗?发生的时间又分别是什么?

开源是中立的治理模式

你能想象没有开源软件基金会的开源项目会是什么样子吗?

Nathen Harvey 在 Information Week 中的文章中指出了三个问题: “项目应该由商业的赞助商驱动还是外围的贡献者驱动?商业利益是否应该凌驾于社区的意愿之上?该如何以及在哪里为商业实体和开源社区之间划上一个明确的界线?”作为中立的基金会可能是唯一平衡此问题的方法,在协商、妥协、争论等等之上让软件受益于所有人。

然而问题来了:那些个开源的软件会是如何运转的?坚守的理念是什么?又是如何平衡软件开发和商业利益的?

开源是企业生态战略

2007 年,Google 决定开源已经花了几亿美金的 Android 智能手机操作系统,希望直接和 Apple、Nokia、Blackberry 展开竞争,现在根据 Linux 官方给出的数据,80% 以上的智能手机运行 Android(基于 Linux 内核),似乎 2015 年开源的 Kubernetes 要占领同样数字的市场,在云原生的市场,运行 Kubernetes 的服务几乎占领了容器调度编排系统的全部份额。

这其中究竟蕴藏着怎样的玄机?拥抱开放是否一定就能成功?做生态之前要做些什么?

其它

开源是软件工程,开源是文化现象,开源是尊重知识产权,开源是市场营销,开源是商业模式......还有很多尚待我们挖掘的主题,开源由亚文化,发展成为主流文化,成形的理论还几乎是空白,尚需更多的人来参与,以科学的视野来彻底诠释这一主题。

调查与洞见

鉴于以上”由隐而显“的各种问题,开源社组织了《2018 开源年度报告》调查,从多种纬度、多种方式、多种协作来尝试靠近上述问题的答案。

调查研究是谋事之基、成事之道。没有调查,就没有发言权,更没有决策权。

——习近平总书记

一、调查之问卷篇

中国开源参与调查报告

本次调查问卷以开源社区协作的方式共同完成,以草根的方式自底向上完成。根据问卷调查搜集结果,对数据进行清理, 交叉比对之后,以数据,图表的形式客观的呈现给大家,同时邀请了开源社区里的专家对结果进行点评,分析和预测。

二、以数据事实来呈现

指南针篇

指南针项目就是为了让开发人员在寻找开源项目方便、快速、准确找到合适的项目,如同在一大片开源的大海中有一个指南针指引前行。

指南针的三个阶段:

  • 第一阶段,针对项目对应其中的内容做数据分析,项目的静态数据都成为可以搜寻和推荐的依据和显示的内容;
  • 第二阶段, 以项目和贡献者的连接的图像呈现方式,让使用者更直观的发现项目和项目之间的关系,也可以透过项目和人的关系对整个开源社区进行了解。
  • 第三阶段,对项目的代码本身做更深度的分析。

调查方法论:

  • 使用网络爬虫与 API 获取开源代码库的数据如原代码、项目信息
  • 将项目的静态信息如项目名称、起始日期等与动态信息如项目下载次数、客户喜爱程度等储存在数据结构
  • 处理原始数据与结构化的单元,生成如分类、统计、排序、标签等总和数据。
  • 使用机器学习、人工智能自然语言处理、数据分析等技术,综合所有数据提供如分类、搜索、推荐、评比等应用服务。

Grank篇

Grank 是另外一种以 GitHub 数据为基础,按照设定方法进行采集、聚类、分析的开源软件评估的开源项目(https://github.com/LCTT/Grank/)。它提供了观察源于中国的或以中国贡献者为主的开源项目发展的的另外一种数据视角。Grank 不仅可以用于综合评估一个开源项目的活跃度、社区化程度,也可以由此反射出开源项目背后的企业、组织在开源方面的实质性投入程度。

三、洞察篇

通过开源社的开源专家委员会、开源专家、业内观察者的多年累积,再根据今年的动向,为大家呈现具有业内先进洞见的分析报告。

小结

正如本文开篇所言,我们的调查限于资源,只能说是窥视冰山一角,有很多尚待以事实调查结果为依据,进而破解各种现象,以及令众人疑惑的谜题。这只是我们的第一步,我们会长久的跟踪下去,也希望能够吸引更多人的参与!

You can’t perform that action at this time.