云素材PPT模板超市 ChatGPT与PPT 2023-08-03

ChatGPT时代的劳动市场：大型语言模型对工人的影响

文章主题：人工智能, 大型语言模型, ChatGPT, 失业风险

ChatGPT 的影响涵盖所有收入阶层，且高收入工作可能面临更大的风险。

ChatGPT 的出现似乎预示着失业的时代的来临，这并非空穴来风。在 GPT-4 发布之际，ChatGPT 迅速推出了新版本，这一举动让 OpenAI 首席执行官 Sam Altman 对自身的技术感到有些紧张。

类似于众多专家，Altman 也担忧人工智能技术过于强大可能会导致大量虚假信息的产生。与此同时，这项新技术将对经济、劳动力市场以及教育环境产生深远影响。

有人开玩笑说 Sam Altman 每天背着的同一个包，里面有紧急关停 AI 的红色按钮。

自古以来，艺术与技术的结合一直为人们所津津乐道。近年来，人工智能（AI）在绘画领域的应用更是引发了一场轩然大波。不少画师因此感到忧虑，担心自己的职业将被取代。近期，OpenAI 研究人员发布的一份报告进一步加剧了这种担忧。据报告估算，ChatGPT及其相关应用未来可能对美国约19%的工作岗位产生影响，而且这些岗位的50%以上的工作任务将面临被替代的风险。

ChatGPT的能力

这篇论文主要探讨了ChatGPT的性能，同时比较了GPT-3.5至GPT-4的性能提升程度。研究者基于多种专业测试和学术基准，得出了一个令人瞩目的结论：GPT-4的表现达到了与人类相媲美的地步，而且在各种标准化测试中均取得了近乎完美的成绩，这无疑是一项重大的突破。

上图充分显示了GPTs能力的快速跃迁已经普遍适用性。

因此，人们将这种技术称为“通用技术”或“通用人工智能（GPT）技术”。值得注意的是，GPT最初是指生成式预训练转换模型（Generative Pre-trained Transformers）。这一概念与本文的标题《此GPT亦彼GPT：大型语言模型对劳工市场影响的初步看法》相呼应，表明了大型语言模型在劳工市场上的潜在影响。

论文地址：https://arxiv.org/pdf/2303.10130v1.pdf

根据研究分析结果揭示，诸如GPT-4等大型语言模型所产生的影响具有广泛性。同时，那些收入较高、需要完成大量软件相关任务的工作，可能会更加容易被人工智能聊天机器人所影响。

在职业影响方面，受影响最大的职业包括报税员、口译员和笔译员、调查研究人员、校对和抄写员、作家。其中，100%受到影响的工作数学家、报税员、量化金融分析师、作家、网络和数字界面设计师、区块链工程师等等。

该研究还按行业细分了 ChatGPT 的影响。数据处理托管、出版业等行业最有可能受到影响。相比之下，体力劳动较多的行业 —— 食品、林业、社会援助等受到的潜在影响最小。论文还列出了最不可能受到AI影响的34大「铁饭碗」，让这些体力劳动者吃下一颗定心丸。

OpenAI 研究了美国超过 1000 个职业，并给他们贴上了执行这些工作所需的各种任务的标签。然后，研究人员使用人工注释器和 GPT-4 模型来评估访问由 ChatGPT 驱动的系统是否会将人类执行特定任务所需的时间减少至少 50%。

让我们看看这项研究具体在干什么：

研究介绍

我们先看总结，OpenAI 本次调查了 GPT 模型和相关技术对美国劳动力市场的潜在影响。他们根据人员职业与 GPT 能力的对应程度来进行评估，研究结果表明，大约 80% 的美国劳动力至少有 10% 的工作任务会受到 GPT 的引入影响，而大约 19% 的员工可能会看到至少 50% 的工作任务受到影响。这种影响涵盖所有工资水平，高收入工作可能面临更大的风险。值得注意的是，这种影响不仅限于近期生产率增长较高的行业。

通过分析他们发现，像 GPT-4 这样的大型语言模型带来的影响可能是普遍的。随着时间的推移，LLM 的能力不断提高，即使现在研究人员停止对新模型能力的开发，但它们带来日益增长的经济效应也会持续增长。该研究还发现，如果考虑到互补技术的发展，LLM 的潜在影响将显著扩大。这也恰恰说明了 GPT 正变得越来越通用。

为了分析，该研究还提出了一个新的标准来理解 LLM 的能力及其对工作潜在影响，该标准用来衡量关于 GPT 任务的总暴露数。

看完结论，接下来就该介绍数据集了。该研究使用 O*NET 27.2 数据集 (O*NET, 2023)，该数据集包含 1016 个职业信息，表 1 提供了数据集示例，包含任务 ID、职位等。

此外，数据集还包括他们从美国劳工统计局获得的 2020 年 – 2021 年员工就业和工资数据。该数据集包括职业头衔、每种职业的工人数量等。

在方法上，该研究根据 exposure rubric 来展示结果，Exposure rubric 定义为访问 GPT 或 GPT 驱动的系统是否会将人类执行特定 DWA 或完成任务所需的时间减少至少 50%。（注：DWA 全称 Detailed Work Activities ，即详细工作步骤，亦可将其理解为完成任务所需要的动作，例如表 1，对于计算机系统工程师，其 DWA 包括监控电脑系统性能，确保正常运作。）

该研究对每个 O*NET 数据集的 DWA 和所有 O*NET 任务的子集获得人工注释，然后在任务和职业级别上汇总这些 DWA 和任务得分。为了确保这些注释的质量，该研究亲自标记了大量任务和 DWA 样本，并招募了经验丰富的人工注释者，他们在 OpenAI 的对齐工作中广泛审查了 GPT 输出。

下表为模型与人的一致性比较与皮尔逊相关系数。一致性分数是通过观察两组人在注释上达成一致的频率来确定的 (例如 E0, E1 或 E2)。在本文中，该研究使用 GPT-4, Rubric 1。

该研究为感兴趣的因变量构建了三个主要度量：(i) ?，对应于上面 exposure rubric 中的 E1， (ii) ?，是 E1 和 0.5*E2 的总和，以及 (iii) ?，E1 和 E2 的总和。该研究在表 2 中总结了注释组和度量之间的一致性。

研究结果

OpenAI 的这项研究以 GPT 语言模型对经济具有普遍影响作为假设，我们来看一下具体的研究结果。

下表 3 是人类和 GPT-4 模型的总体 exposure 数据。其中，人类和 GPT-4 的数据表明平均 occupation-level ? 值介于 0.14 和 0.15 之间，这表明对于中等职业，大约 15% 的任务直接受到 GPT 影响。对于 ?，这个数字增加到 30% 以上，对于 ?，这个数字则超过 50%。

根据 ? 值，该研究估计 80% 的人属于至少一项工作任务受 GPT 影响的职业，而 19% 的人所处的职业有超过一半的工作任务被标记为受到 GPT 影响。

工资和就业

下图 3 描绘了 GPT 模型对经济的整体影响。

下图 4 描绘了工作薪资与对 GPT 等语言模型接触使用情况的关系。

然后，该研究又从不同的职业分类探究了 GPT 模型的影响，包括 ONET 数据库中的 5 个 Job Zone。其中，Job Zone 1 中的工作入职要求最低，Job Zone 5 则最高。

总体来说，OpenAI 这项研究发现，工作对科学方法和批判性思维的依赖程度与 LLM 接触使用情况呈负相关，而编程和写作技能与 LLM 接触使用呈正相关。

研究存在的缺陷

不过，该研究也承认：试图通过使用简单的标签来描述工作任务并代表每个职业，这种方法本身存在固有的偏见，并且可能忽略了一些特有的技能或任务。

当然，还有一个非常重要的问题是 GPT 模型目前仍存在很多缺陷，包括编造虚假信息，这使得人工监督工作成为必要。

写在最后

这并非OpenAI首次表示大型语言模型或导致许多人失去谋生能力。上周，OpenAI首席执行官Sam Altman承认ChatGPT可能会让很多工作消失得无影无踪，但坚称该技术也会创造出很多今天无法想象的全新工作。他表示，「我们可以拥有更高的生活质量。同时，人们需要时间来更新、做出反应、习惯这项新技术。」

参考内容：

https://www.cnbc.com/2023/03/20/openai-ceo-sam-altman-says-hes-a-little-bit-scared-of-ai.html

https://www.pcmag.com/news/openai-chatgpt-could-disrupt-19-of-us-jobs-is-yours-on-the-list

举报/反馈