开源:如何让技术更便宜和可靠

文章主题:周二, Meta, Llama 2, 开源

666AI工具大全,助力做AI时代先行者!

伴随着互联网的快速发展,进了开源软件行业的发展。

周二,Meta 发布了最新一代的开源大语言模型 Llama 2。

打开凤凰新闻,查看更多高清图片

相较于2月份首次亮相的Llama 1大模型,Llama 2在诸多层面实现了显著优化。首先,其训练数据量提升了40%,这意味着模型在获取知识时拥有更为丰富的数据支持;其次,用于训练的token数量翻了一番,达到了2万亿,这无疑极大地扩充了模型的语言处理能力;再者,上下文长度限制也翻了一倍,这一改变使得模型能够更好地理解和生成长距离的上下文信息。综上所述,Llama 2在各方面都展现出了更强的实力。

尽管 Llama 2 的强大程度足以引起整个行业的关注,但这并非最令人惊讶的事情。真正令行业感到震撼的是 Meta 公司宣布 Llama 2 将对研究和商用领域完全免费。

这表明,许多研究机构和企业可以免费利用开源的Llama 2,从而省去了开发大型模型的巨大成本,这有助于降低企业的研发费用,并使Meta能够吸引更多的合作伙伴。

目前与 Llama 2 合作的就包括了微软、亚马逊、IBM、高通、Spotify 等知名企业。

关于Llama 2的介绍已经在网络上铺天盖地,在此不再详述,而本文将重点关注“开源”这一在当今互联网领域相当普遍,但对许多人来说却较为生疏的概念。

开源的基本概念

所谓“开源”,即开放源代码,也称源代码公开,是软件的一种散布形式,而开源软件即公开源代码的软件。

在软件领域,大部分情况下,其他用户只能获取经过编译的二次元可执行文件,而程序的原始源代码则仅限于软件创作者、著作权所有人等具备。这种类型的软件被称为闭源软件。

原内容为:开源软件的魅力不仅仅在于源代码的透明度,它更关键的地方在于,其他人在遵循开源协议的前提下,能够自由地学习和修改该软件,甚至可以根据自身需求进行再分发。这种开放性不仅推动了软件技术的进步,也促进了全球范围内的合作与交流。

开放源代码的定义最先由 Bruce Perens 提出,经由 Eric S.Raymond 发展,主要有以下十条:

开源的历史

虽然现在人们用到的软件,闭源居多,但最早期的软件开发,软件都是开源的,因为早期硬件发达,而软件只是附属品。

例如在 1970 年之前,IBM 出售的大规模计算机,采用的部分软件,软件公司会提供源代码,让懂程序的维护人员知道软件是如何运作的,方便修正或添加想要的功能。

*IBM S/360 计算机,于 1964 年推出

后来随着软件行业的发展,软件公司意识到其中的商业利益,开始进入封闭式的开发模式,不再提供软件的源代码,人们称其为“教堂式”。

所谓教堂式,就是将软件开发比作建造一座教堂,应该由高手或专家来设计并建造,等到版本成熟时才开放提供给用户,并利用知识产权制度将开放的软件私有财产化,将其闭源,不被他人模仿,以满足企业的商业利益。

我们熟悉的 Windows 系统便是闭源软件开发模式的代表。

*Windows3.0

但闭源软件开发模式带来了一系列问题,比如软件费用高、安全漏洞多、新旧版支持问题、不符合个人需求等等,一部分软件开发者对其不满意,于是兴起了“开放源代码运动”。

开放源代码运动的支持者认为不阻碍合作、可共享的研究风气才是软件开发应有的路径,反对把软件建立在知识产权与许可证的基础之上,认为这样限制了他人利用源代码修改、调整软件以适应自身的需要,阻碍了软件的进一步完善和发展,导致软件安全性下降、创新减少、不兼容等问题。

随着开放源代码运动的进行,产生了许多实际性成果。

Richard M.Stallman 于 1985 年创立了自由软件基金会,并开启了 GUN 项目,后者是一个自由的操作系统,其内容软件完全以 GPL 的方式发布。

*Richard M.Stallman

加州伯克利大学的计算机研究团队发展并改进了 AT&T 的 Unix 系统,建立许多应用程序,并迅速成为“BSD Unix”,后来“BSD Unix”被苹果的 macOS 采用。

1991 年,Linux 内核被芬兰一名大二学生编写出来。

1999 年,Eric S.Raymond 出版了著作《大教堂与市集》,该书讲述了黑客文化史、Linux的开发过程、以及作者本人主持开发的开放源代码软件 Fetchmail 的经历,并讨论了软件开发的方法论。

*Eric S.Raymond

与“教堂式”对应的,开源软件开发模式被称为“市集式”,就是通过不同的软件开发爱好者,组成一个不同流程和不同方式的市集,共同开发软件。

市集式的代表便是 Linux,最初由芬兰大二学生 Linus Torvalds 于 1991 年首次发布 Linux 的内核,后来无数人加入合作使其可用性增强。现如今,采用 Linux 内核的系统已经运行在很多的设备上,比如大型计算机和超级计算机、服务器、手机(安卓)、路由器、电视等等。

*Linux 创始人 Linus Torvalds

开源的意义

在前面提到了,开放源代码运动旨在追求不阻碍合作、可共享的软件开发路径,并认为开放源代码更有利于提高软件的安全性、创新性和兼容性,这是开放源代码最直接的意义。

*Github 上的开源项目

将软件源代码公之于众,使得所有开发者都成为软件的潜在开发者,其中不乏许多优秀的网络人才,共同开发软件,能够让软件存在的漏洞很快被发现并弥补,同时,每个人的想法也能在软件上实现,促进了软件的发展和迭代,有利于软件的发展。

以上是软件开源在软件层面的意义,而像 Meta 将 Llama 2 开源,更多的是商业层面的考量,因为站在 Meta Llama 前面的是 ChatGPT 这个巨头。

Meta 将 Llama 2 开源,能争取更多的开发者支持,包括那些知名的合作企业,从而促进 Llama 的发展,提高市场占有率。过往不乏类似的案例。

Windows 从 3.0 开始取得了广泛的成功,占据了个人电脑操作系统的大部分市场,对微软不满的科技行业从业者,在 Linux 的基础上开发,将后者变成了网站和互联网应用的运行系统。

2007 年 1 月,苹果发布了初代 iPhone,并展示了强大的 iOS 系统。该年11月,谷歌向外界公布了安卓系统,与 84 家软、硬件企业以及电信运营商组成“开放手持设备联盟”,并以免费开源的方式,发布了 安卓的源代码,以此来与 iOS 竞争。

从互联网发展史来看,行业领先的巨头往往会选择闭源式开发,以保证技术领先,赚取更多的商业利益,而后来者选择开源,争取更多的市场和合作伙伴,以此抗衡行业领先者。

因此,“开源”成为部分企业以小博大的战略选择。

例如谷歌虽然不直接通过安卓系统授权获利,但却可以赚取 GMS 的授权服务费,而 Llama 如果取得成功,Meta 未来也能通过其他方式取得收益。

不过,现在站在 Meta 的 Llama 2 前面的巨头不只是 OpenAI 的 ChatGPT,还有 Google 的大语言模型 Bard——是的,将安卓开源的谷歌,在大语言模型开发上选择将 Bard 闭源。

对企业来说,开发软件选择开源还是闭源不是基于主义,商业利益才是最主要的考量因素。

不过值得一提的是,Meta 的 AI 首席科学家杨立昆是一名开源主义者,当初扎克伯格邀请他出任脸书的 AI 实验室主任一职时,他曾要求研究成果必须开源。

*杨立昆Yann LeCun

开源的缺点

在前面,老狐介绍的都是开源的优点,事实上,开源的缺点某种程度上也是其优点带来的,体现了一个事物的两面性。

首先是开源项目参与人数众多,且自发进行,这必然造成管理困难,需要项目领导者付出更多精力去整合项目,做好决策。

例如 80 年代与比尔·盖茨齐名的技术天才米切尔·卡普尔曾出资几百万美元启动一个名为 Chandler 的开源项目,旨在开发一个个人信息管理软件,但因为项目管理混乱,开发人员更迭,项目最后失败。

*米切尔·卡普尔

其次,开源项目迭代频繁,不断有新版本被开发出来,这需要软件用户不断安装新版本,这给用户带来了更高的使用成本。

最后则是开源软件未来的不确定性,因为其成员来自不同的人,软件的质量和未来发展都没法得到保证,一款软件用户正用着可能就没下文了。

以上开源的三个缺点恰好是闭源的商业软件的优势,以 Windows 为例,微软有专业团队负责开发,后期有稳定的更新和维护,能给用户减少许多的麻烦。

写在最后

读到这里,我想大家对“开源”已经有了大概的了解。

近些年,伴随着互联网的快速发展,尤其是大数据、物联网、AI 等技术的火热,开源软件的开发者逐渐增多,相关的开源项目也越来越多,促进了开源软件行业的发展。

一向封闭的微软,也在纳德拉上任后开始拥抱开源。2014 年,微软在开源社区 Github 上开设了账户,并成为社区的最大贡献者;2018 年,微软花费 75 亿美元收购了 Github,后者当时已是全球最大的开源社区和代码托管平台;如今,微软也将与 Meta 的 Llama 展开合作。

*纳德拉和扎克伯格

开源社区 Hugging Face 伴随着 AI 的兴起,成为了开源社区的顶流,如今 Hugging Face 上有超过 25 万个模型,包括 Meta 的 Llama 2、国内王小川创立的百川智能的大语言模型“百川”。

*Hugging Face上的大模型

现在回到文章开头的话题上来,小伙伴们认为 Llama 能通过开源的方式,击败闭源的 ChatGPT 和 Bard 么?

虽然结果老狐也无法预测,但非常乐意见到这样的竞争,这是一场技术落后者借助群众力量与技术领先者的竞争,也是开源的理想主义者与闭源的现实主义者的竞争,结果会怎样呢?

答案在时间里。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply