中国开源的发展历史具有四个里程碑节点,1991年、1999年、2008年、2019年,可以代表着中 国开源进入启蒙、萌芽、发展、加速四个时代的里程碑。
1.启蒙时代
1991年,陆首群、张克治和杨天行牵头代表中方代表团与美国AT&T USG合作,美方将最新开发的 UNIX版本——UNIX SVR4.2源代码向中方开放。中方为此组织了UNIX新版本编辑委员会,由杨芙 清、胡道元、仲萃豪、刘锦德、尤晋元、贾耀良、孙玉芳等国内资深软件专家组成,并邀集全国软件 专家、程序员200多人,翻译、编辑、出版了UNIX SVR4.2中文版本共19册,首发式在人民大会堂举 行,向全国各大图书馆、高等院校赠书,业界影响甚大。这一历史事件被Linux基金会收录,后被作为 中国开源诞生的标志性事件。1991年成为中国开源元年。
1992年12月,中方与USG合资在华成立了中国UNIX公司。 1994年,已经在芬兰工作5年的宫敏博士第一次将Linux和大量自由/开源软件源码通过磁带带回中 国。 1997年,宫敏第二次带回80GB的自由软件,并在国家信息中心的帮助下在中国经济信息网上建成了 “中国自由软件库”,为国内技术人员了解、学习和使用Linux及相关自由/开源软件提供了便利。 1998年,在开源概念提出的这一年,在湖南长沙读博士的章文嵩在Linux2.0内核上利用课余时间开发了Linux虚拟服务系统(LVS),并在第一时间开源,在全世界引起很大反响。同一年,在北京清华大 学读研的魏永明,决定开发针对实时嵌入式系统的图形界面系统并将其开源,MiniGui应运而生。同 一年,在安徽合肥读大二的自动化系学生吴峰光开始接触Linux,他发现Linux的文件预读算法磁盘I/ O性能较差,便尝试对Linux内核进行改进。
1998年初,北京冲浪平台软件技术有限公司成立,专注于研发Linux中文发行版,同年9月Xteam Linux收获了第一个市场用户——北京市政府政策研究室。1999年3月正式对外发布Xteam Linux中文 版1.0。2001年冲浪平台在香港创业板上市。
2.萌芽时代
在历时8年的启蒙阶段中,自由/开源软件的理念和文化开始在中国大地生根发芽,随着UNIX、Linux 在中国用户的激增,以及互联网时代的到来,中国自发地涌现出一批开源社区和开源企业。在中国开 源发展的萌芽阶段,Linux技术的快速普及起到了核心的推动作用。 1999年9月,蓝点软件技术(深圳)有限公司成立,次年3月在美国纳斯达克上市。一个中国初创公司 从成立到在美上市仅用不足200天,且上市当天股价暴涨400余倍,这个神话旷古绝今。
999年底,时任中国科学院软件所副所长的孙玉芳老师牵头筹建北京中科红旗软件有限公司和北京 红旗中文贰仟有限公司,分别基于Linux和OpenOffice进行中文版红旗Linux和RedOffice的研制。孙 玉芳老师英年早逝(2005),一生发表操作系统相关论文180余篇,编著和译著操作系统原理相关著 作140余册,他指导过的诸多硕士/博士生现已成为开源产业的中坚力量。1999年,中国软件开发者社 区CSDN在蒋涛的努力下成立了,并于2000年创办《程序员》杂志。 2000年2月,在科技部国家高技术研究发展计划(863计划)的支持下,由一批国内高校、研究院所、 IT企业联合发起成立了共创软件联盟。共创软件联盟在开源许可证规则下对863计划的软件成果进 行开源培育和孵化,并提出以开放源代码的协同创新模式作为中国基础软件发展的主要路径,对我 国开源产业发展起到了重要的推动作用。
2002年,黄建忠以CJacker的ID在中国Linux公社发布了基于RedHat 8再发布的Magic Linux版本—— 这是国内第一个Linux社区发行版。在这个阶段,部分中国开发者开始尝试向国际上游社区贡献代 码。但同时,国内Linux企业对开源技术采用拿来主义,忽视开源社区、商业模式和开源知识产权等 方面的投入和积累,导致在国际社区中出现了许多针对中国Linux发行商只是开源使用者的评价,直到2008年,这种印象才得以扭转。 2003年,原信息产业部通过电子发展基金支持“Linux公共开发平台”的建设,并成立国家软件与集 成电路公共服务平台,组织国内操作系统厂商进行Linux参考平台的研发和Linux操作系统的应用推 广。
2004年,COPU成立,陆首群教授被推举为联盟主席。在陆首群主席的大力推进下,COPU为推动中 国开源软件的发展而不懈努力,也为促进中、日、韩乃至全球关于开源运动的沟通、交流、共享、协 同与合作而努力,为促进中国、东北亚和全球开源运动作出贡献而努力。联盟的国际智囊团聘请了几 十位全球顶级开源专家以多种形式参与和推进中国开源建设,如此规模的智囊团在全球首屈一指, 是开源界公认的顶级智库,是COPU创建的开源高地、科技高地、创新高地、人才高地。可以说,联 盟的成立和陆主席的领导加速了中国开源软件发展的速度,为碎片化的国内开源产业建立了统一的 根据地,为国际开源生态和中国开源生态建立了纽带。
2008年,以Kernel、Apache、GNOME、OpenOffice为代表的国际知名开源社区纷纷选择在北京召开 全球技术峰会,作为他们进入亚洲的第一步(之前从未在亚洲国家召开顶级技术峰会)。这是对中国 开发者在社区提交贡献的肯定。因此,我们认为2008年成了中国开源发展重要的分水岭。
3.发展时代
在2009年前,中国常被视为国际开源资源单纯的使用者,2009年之后,中国开发者提交的代码被 Linux基金会接受,排名稳居世界前四(Kernel 2.6.27之后),中国开始成为国际开源资源的重要贡献 者。 在2009年之后,伴随着云计算、物联网、大数据、移动互联网的快速发展,中国一批有实力有抱负的 知名科技IT企业、互联网公司开始选择拥抱开源。Linux基金会执行董事Jim Zemlin曾表示:“这些中 国科技公司无论从开源技术上,还是产业、经济发展上,已经走进世界领导者行列。”
在2009-2018年这十年中,中国开源呈现了百花齐放的繁荣局面,从开源开发者数量的激增,到开源 社区的多样化(不再局限Linux等操作系统领域),再到知名科技企业自内而外的拥抱开源(内部实 行开源治理,逐渐对外捐献开源项目,并向上游技术社区提交贡献)。2012年成立的中国开源云联盟 (COSCL)和2016年成立的云计算开源产业联盟(OSCAR)就是典型的开源与云计算技术融合的产 业联盟。这一阶段明显的特点在于不论是初创企业还是千百亿体量的科技巨头纷纷用开源技术来构建公司自身的技术堆栈,在技术上全面拥抱开源,并越来越重视对上游开源社区和开源基金会的投 入与贡献。
4.加速时代
自2019年起,中国开源进入了一个新的时代——加速阶段。 根据Linux基金会有关Kernel.org社区贡献的统计,来自中国开发者的贡献已居全世界之首(Kernel 4.14至今)。中国开源发展进入深水区,开源生态的完整性、开源社区的成熟性、开源商业模式的多 样性和复合性都在发生巨大变化。 由木兰开源社区牵头、多家单位联合参与起草的“中国第一个开源协议——木兰许可证”已经正式 发布,前不久还被OSGJ翻译为日文版使用。2020年6月,开放原子开源基金会在北京正式成立,是 我国唯一的国家级开源基金会。
在现阶段,部分领先的中国企业不满足于拥抱开源,他们正在很多创新领域跃跃欲试,希望通过开 源模式来对创新技术进行引领,如商汤的OpenMMLab计算机视觉开放算法、矩阵元的Rosetta隐私 AI开源框架、阿里的RocketMQ海量信息中间件、京东的JD Chain开源区块链、百度的PaddlePaddle 深度学习平台和Apollo自动驾驶平台、海尔卡奥斯COSMOPlat工业互联网平台的工业APP开发框 架开源项目等。同时,在现阶段出现了一些原生的开源明星项目,如Apache SkyWalking、Apache Echarts、Apache IoTDB、TiDB,其中一些优秀的开源项目如TiDB备受资本市场的推崇,创造了全球 数据库融资历史新的里程碑。
2023年,大模型引起了AI开源热潮。6月9日,北京智源人工智能研究院院长黄铁军在2023北京 智源大会上作报告,发布悟道3.0大模型系列,并宣布进入全面开源的新阶段。6月15日,百川智 能公司,推出了70亿参数量的中英文预训练大模型——baichuan-7B;7月,百川智能继续推出了 baichuan-13B,不仅对学术研究完全开放,所有开发者均可通过邮件向百川智能申请授权,在获 得官方商用许可后即可免费商用。7月14日,智谱AI官网发布:经智谱AI及清华KEG实验室决定, 自即日起ChatGLM-6B和ChatGLM2-6B权重对学术研究完全开放,并且在完成企业登记获得授权 后,允许免费商业使用。8月3日,阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和 对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。9月4日,既阿里达摩 院推出的魔搭社区之后,始智AI团队发布始智AI-wisemodel社区正式上线,纷纷将目标指向中国版 “HuggingFace”。10月30日,昆仑万维宣布开源百亿级大语言模型“天工”Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。11月22日,中国人民大学高瓴 人工智能学院的大语言模型系列——YuLan开源。2024年1月10日,中国电信宣布,将自研星辰AI大 型模型全面开源,以更好地助力客户业务的智能化升级。
2024年3月12日,北京大学深圳研究生院-兔展智能AIGC联合实验室正式发布了“Open-Sora”计划 旨在复现一个“开源版Sora”。该项目由深圳兔展智能创始人、CEO董少灵与北京大学信息工程学 院助理教授、博士生导师袁粒领衔发起,期望通过产业公司和科研机构的强强联手,以开源的方式 对外传播中国团队的技术自信,号召全球社区一起做人类普惠的技术内容。