
1.2 开源大事记
开源从最初的萌芽到发展成为一个成熟的生态系统,已经走过半个多世纪的历程。它经历了缓慢的孕育期、早期的发展期、加速成长期,直至今日的稳定与繁荣期。在这个过程中,无数的开源贡献者为生态的繁荣贡献了自己的力量。其中,一些贡献者开发了具有深远影响的优秀开源项目;一些推动了开源文化运动的进一步发展;还有一些通过创建开源组织,为开发者提供了贡献代码、开放交流和组织活动的平台。这些努力共同塑造了如今繁荣的开源生态系统。
在20世纪90年代之前,对于中国,开源还是一个新兴的概念。那么,缺乏开源基因的中国产业界在这30多年间是如何不断克服自身的不足,以适应全球开源的潮流的呢?
1.2.1 开源的萌芽:从发布UNIX操作系统到启动GNU项目
开源的种子在20世纪50年代计算机发展的早期就已经播下。当时,计算机是研究人员和学者共享的大型设备,由于该领域良好的协作精神以及仍未形成商业化趋势,软件作为硬件的附带品能够自由地被分享。这一时期为开源的发展打下了坚实的基础。
UNIX操作系统的起源可以追溯到20世纪60年代中期。作为开源软件运动的先驱,它为后续众多开源项目奠定了基础。
1969年,互联网的前身ARPANET(阿帕网)诞生。它的出现让开发人员能够更便捷地与全球的其他开发者合作,为今天广泛使用的国际互联网的形成奠定了基础。
20世纪60年代和70年代,商业软件的兴起对这种开放方式提出了挑战,具有更严格许可的专有软件应用渐成常态。
20世纪80年代,为了创建一个完全自由的操作系统,GNU项目应运而生,旨在挑战如MS-DOS(微软磁盘操作系统)等专有系统的主导地位。这标志着一个重要的转折点,它引入了Copyleft许可证的概念,该概念允许用户自由地修改和重新分发软件。
1985年,支持GNU项目的自由软件基金会成立,并于1989年推出GNU通用公共许可证。这一许可证的推出进一步推动了开源软件的发展,确立了开源软件的自由使用、修改和分发的原则。
1.2.2 早期发展和中国开源的萌芽
1.互联网兴起下的开源
在20世纪90年代,互联网的兴起为自由软件的协作与共享提供了一个理想的平台。1991年,搭配GNU套件的Linux内核首次发布,迅速吸引了广泛的关注。随后,Linux 1.0版本于1994年正式发布。此外,诸如Apache Web服务器和Python语言等自由软件项目陆续推出,自由软件项目的数量开始激增。
1998年,“开源”这一概念应运而生。随后成立的OSI为开源软件提供了一套定义指南。OSI的首要任务之一是起草开源的定义,并基于此创建了许可证列表。同年,Mozilla开源项目也正式启动。2002年,Mozilla 1.0浏览器发布。2003年,Mozilla基金会成立,继续维护和支持该项目的进展。
1999年,Apache软件基金会成立,其项目涵盖了多个领域,包括Web服务器、数据库、编程语言、容器技术、人工智能和机器学习等。其中,Apache HTTP Server、Hadoop、Spark、Kafka和Cassandra等项目已广为人知。
2000年,Linux基金会的前身——开放源代码开发实验室(Open Source Development Labs,OSDL)成立。2007年OSDL与自由标准组织(Free Standards Group,FSG)合并,共同成立了Linux基金会。
2.中国开源的十年萌芽
1991年,对中国开源来说是一个启蒙之年。在这一年,中国与AT&T Bell Laboratories USL/USG展开了合作,引进了UNIX SVR 4.2 版本的源代码,并发布了其中文版本。紧接着的第二年,中方与AT&T USG合资,在中国成立了中国UNIX公司。
1997年,在早期开源贡献者的引领和国家信息中心的支持下,“中国自由软件库”在中国经济信息网上建立。这为国内技术人员提供了一个了解、学习和使用Linux操作系统及相关开源软件的平台,极大地便利了他们。
1998年,中国的早期开源贡献者分别开发了Linux虚拟服务系统(Linux Virtual Server,LVS)和嵌入式系统的图形界面系统MiniGui。LVS被Linux内核收录,成为搭载Linux操作系统集群服务器的重要核心软件组件。MiniGui则在手机、数码相框、工业控制系统和工业仪表中得到了广泛应用。同年,中国首个开源社区——阿卡社区(AKA)成立,培养了中国最早的一批Linux操作系统开发人才,这标志着开源生态在中国的初步形成。
1999年,红旗Linux操作系统和RedOffice的中文版研发工作正式启动,它们基于Linux操作系统和OpenOffice进行了本地化的开发工作。
2000年,在“863计划”的支持下,国内高校、研究院所、IT企业联合发起成立了“共创软件联盟”(以下简称联盟)。联盟在开源许可证的规范下,对“863计划”的软件成果进行了开源培育和孵化。联盟提出了“开放源代码协同创新模式”,为中国开源软件的发展探索了一条可行的路径。
2001年,随着中国加入世界贸易组织,外资公司开始在中国设立开源技术中心,这进一步培养了大量开源领域的专业人才。
1.2.3 加速发展时期与中国开源生态塑造
1.新技术风起云涌下的开源
2001年,随着互联网泡沫的破裂,许多在纳斯达克上市的科技企业遭受了沉重打击。在这一背景下,免费的Linux操作系统逐渐成为企业级服务器和互联网基础设施的首选,这标志着开源操作系统在商业应用领域的突破。
2004年,基于Netscape Navigator代码库的Mozilla Firefox开源浏览器开始挑战IE(Internet Explorer)浏览器的市场主导地位,其成功展示了开源软件的巨大潜力。同年,Eclipse基金会宣告成立。
2005年,Git版本控制系统发布,并迅速成为最受欢迎的分布式版本控制系统。它彻底改变了软件开发的方式。
2008年,基于Linux内核的Android操作系统发布,这标志着移动开源软件发展的新纪元。同年,GitHub网站上线,提供Git代码仓库托管和基本的Web管理界面。
2010年左右,随着云计算的兴起和云原生概念的提出,加之云基础设施和容器技术的强大发展,催生了Eucalyptus、OpenStack、Kubernetes等开源云计算平台和容器化应用。
从2014年开始,一些原本闭源的系统软件开始转向开源。例如,.NET Framework的核心部分在Windows操作系统下实现了开源,随后,SQL Server数据库也被移植到了Linux平台。这些举措标志着开源生态开始向商业领域的更深层次扩展。
2015年,Linux基金会成立了云原生计算基金会(Cloud Native Computing Foundation,CNCF)。RISC-V基金会也在这一年成立,致力于推广RISC-V这一开源指令集架构。在这一时期,TensorFlow、PyTorch等开源机器学习框架陆续发布并迅速普及,极大地增强了人工智能技术的开放性和可访问性。
2018年,GitHub网站,作为全球最大的代码托管平台,以75亿美元[2]的价格被收购。这一交易成为载入史册的开源交易之一,进一步凸显了开源在商业价值和战略上的重要性。同年,第一代生成式预训练开源模型GPT(Generative Pre-trained Transformer)发布,该模型拥有1.17亿个参数,在自然语言处理领域表现出色。
2.各方力量塑造中国开源生态
2002年,由中国Linux公社的社区会员和Linux爱好者共同制作的中文Linux发行版——Magic Linux发布。这标志着中国首个由社区发行的Linux版本诞生。
2003年,IBM中国Linux解决方案中心在北京中关村软件园正式投入运营。
2004年,中国、日本和韩国在北京签署了《中国信息产业部、日本经济产业省、韩国情报通信部开放源代码软件合作备忘录》,旨在促进3国在开放源代码领域的合作与发展。
2006年,首届中国Linux内核开发者大会成功举办,并延续至今,成为中国开源领域重要的开发者交流平台,通过这一会议不断挖掘和培养开源领域的核心技术人才。
2008年,Linux(Kernel)、Apache、OpenOffice等国际知名开源社区在北京举办了全球技术峰会,这是国际开源组织首次在亚洲国家举办技术峰会。
2010年,Linux基金会在中国设立了首个分支机构,致力于推动Linux操作系统在中国的普及与应用。
2012年,Tinker作为Android热修复解决方案库被开源,为开发者提供了便利。
2013年,Gitee和CODE两个代码托管平台相继上线,为开发者社区提供了代码管理和协作的新选择。
2015年,国务院在《关于积极推进“互联网+”行动的指导意见》中提出,要大力发展开源社区,并鼓励企业自主研发,同时通过国家科技计划(包括专项、基金等)支持形成的软件成果,借助互联网向社会开源。
2016年,分布式SDN(Software Defined Network,软件定义网络)控制器项目DragonFlow、网络级联项目Tricircle、数据保护服务项目Karbor被托管至OpenStack基金会。同年,PB级融合数据引擎项目CarbonData进入Apache孵化器,并在2018年成为顶级项目。
2017年,国务院在《新一代人工智能发展规划》中强调了通过开源开放的方式推动人工智能的发展。同年,微服务架构项目ServiceComb被托管至Apache软件基金会,并在2018年成为顶级项目。由中国企业托管至Apache社区的开源项目RocketMQ正式毕业,成为国内首个达到Apache顶级项目标准的互联网中间件。
2018年,中国人工智能开源软件发展联盟、中国RISC-V产业联盟、中国开放指令生态(RISC-V)联盟在政府和产学研各界的牵头下相继成立。同年,云原生边缘计算项目KubeEdge开源。开源镜像仓库Harbor、开源分布式事务键值数据库TiKV及开源云原生镜像分发系统Dragonfly这3个源自中国的项目被CNCF接纳,这标志着中国在开源领域的影响力和贡献日益增强。
1.2.4 稳定繁荣时期与中国开源的贡献
1.大模型时代的开源
2019年,第二代生成式预训练模型GPT-2发布,该模型拥有15亿个参数,相较于GPT-1,在文本生成、问答、机器翻译等任务上展现出显著的性能提升。在这一时期,得益于Helmet、Flagger和Terraform等智能工具的支持,容器化平台Kubernetes实现了高度自动化,极大地方便了依赖容器技术的开发者。
2020年,第三代生成式预训练模型GPT-3发布,该模型拥有1750亿个参数。虽然GPT-3并未完全开源,其代码和训练模型权重未对外公开,但它在自然语言处理领域的影响力不容小觑。同年,CentOS官方宣布停止维护CentOS Linux,并于2024年6月30日结束对CentOS 7的支持,同时推出了CentOS Stream项目,作为CentOS Linux的替代。
2021年,Log4Shell漏洞成为开源历史上最严重的安全漏洞之一,影响了众多国内外公司。当年年底,Apache团队发布了针对Log4Shell漏洞的修复程序。
2022年,Linux内核团队发布了5.16、5.17、5.18、5.19和6.1共5个版本,这些更新进一步增强了Linux操作系统的稳定性和性能。同年,PyTorch正式加入Linux基金会,这标志着PyTorch项目的进一步发展和社区支持的加强。
2023年,深度优化的开源库TensorRT-LLM推出,为机器学习模型的推理提供了更高效的解决方案。开源项目Visual ChatGPT发布,它结合了视觉和语言处理技术,为人工智能领域带来了新的应用场景。此外,Llama 2项目成功开源了3种不同规模的预训练模型,为研究人员和开发者提供了更多的选择和资源。
2.中国开源进入项目贡献期
2019年,面向多样性计算的操作系统开源社区openEuler正式成立,这标志着中国在开源操作系统领域迈出了重要的一步。同年,中国首个开源许可证——“木兰宽松许可证”正式发布,为国内开源项目提供了法律框架和规范。
2020年,全场景AI框架MindSpore和关系型数据库openGauss开源;Kubernetes上的首个云原生平台构建引擎KubeVela开源;企业级分布式键值数据库Tendis开源。同年,中国首个开源基金会——开放原子开源基金会成立。开源操作系统OpenHarmony正式托管至开放原子开源基金会。
2021年,开源操作系统openEuler正式托管至开放原子开源基金会;业界首个全开源2000亿个参数的中文预训练语言模型“盘古α”发布;OceanBase数据库开源;Echarts正式从Apache毕业,成为顶级项目。
2022年,中国首个桌面操作系统开源社区“开放麒麟”成立,为中国桌面操作系统的发展提供了新的平台。南京未来诉江苏云蜻蜓案成为中国首例根据GPL获得法院支持的生效判决,这一判决对国内开源许可证的法律效力和执行具有重要意义。
2023年,中国的大模型开源生态迎来了蓬勃发展的时期。这一年,跨端、跨框架、跨版本的企业级应用前端组件库OpenTiny及高性能服务网格项目Kmesh开源。
通过梳理“开源大事记”,我们可以清晰地看到技术发展在开源历程中的推动作用。从大型机时代的初步孕育,到互联网时代开源定义的形成和逐步正规化、规模化,开源运动经历了重要的发展阶段。进入后互联网时代,随着数字化转型的推进,云计算、云原生、大数据、机器学习等领域的开源项目呈现爆发式增长。到了如今的AI大模型时代,越来越多的开源项目开始聚焦于AI大模型的开发,这标志着开源技术进入了一个新的发展阶段。
中国的开源发展虽然起步较晚,但经历了早期的个人探索到企业积极参与,社区联盟的建立,以及国家政策的持续支持的各个阶段,直至如今产业各界广泛参与开源项目和社区的贡献。这一系列发展不仅推动了中国开源生态系统的成熟,而且与国际开源社区的发展保持了同步,甚至在某些领域实现了引领。中国的开源社区和企业在全球开源生态中的影响力逐渐增强,为全球开源技术的发展和创新作出贡献。
[2] 2018年,1美元大约可以兑换6.6元人民币。