ChatGPT化身政治说客:帮企业判断是否受政府新法案影响,甚至写信建议修改立法
大数据文摘出品
如果说纽约“华尔街”是国际金融中心的话,那么华盛顿的“K街”可谓是风云变幻的国际政治中心。
华盛顿的“K街”离白宫不远,这里有着一群专业的“政治说客”,每当美国政府有了新的法案草案,他们就会花费大量时间仔细研究法案草案,以评估它们是否与他们的客户相关,这些客户通常是各大企业。
美国政府各种法案的威力不用多说了,比如近期通过的《芯片与科学法案》,直接受到波及的半导体企业就为数不少,及时了解各类法案会不会影响到自己,成为企业政策研究的重中之重。
现在,这项工作也可能要被ChatGPT取代了。
斯坦福法律信息中心的研究员约翰 · 内(John Nay)最新的研究显示,AI模型能够在75%的情况下预测一份美国国会法案的摘要是否与特定公司有关,更重要的是,随后能够起草一封信给该法案的发起人,主张对立法进行修改,这个模型和ChatGPT一样,背后同样也是 OpenAI 的GPT-3 大语言模型(LLM)。
论文 arXiv 预印本:
https://arxiv.org/ftp/arxiv/papers/2301/2301.01181.pdf读政府法案,判断法案影响,准确率75%
约翰 · 内(John Nay)的论文显示,他基于OpenAI 的 GPT-3大语言模型(LLM) 开发的初级 AI 说客,可以在读取一份美国国会法案的摘要的基础上,判断一份美国国会法案的摘要是否与特定公司有关。
比如上面提到的芯片法案,如果你有一家涉及半导体产业的公司,但并非主要业务,你不确定芯片法案是否会影响到你的公司,那么这个AI就可以告诉你答案,准确率高达75%。
这是如何做到的呢?
首先,当然是AI如何理解文本的问题,这个需要大量的数据用来训练,约翰 · 内(John Nay)的方法是收集大量法案数据和企业数据,通过 OpenAI 的 API 为模型提供文本提示。
法案数据包括法案的标题、法案摘要、由国会确定的法案主题,公司数据由公司的名称以及该公司向美国证券交易委员会提交的业务描述作为数据组成。
给AI模型的任务示例如下:
你是一名游说者,分析国会法案对公司的潜在影响。鉴于该法案的标题和摘要,以及其 10K SEC 文件中有关公司的信息,你的工作是确定该法案是否至少与公司有一定的相关性(就是否会影响公司而言,如果它之后被实施)。法案的官方标题:{official_title}法案的官方摘要:{summary_text}法案的官方主题:{subjects}公司名称:{company_name}公司业务描述:{business_description}该法案是否与该公司潜在相关?以这种格式回答:回答:“是”或“否”(全部大写)。说明:您为做出回应而进行的逐步推理。置信度:0 到 100 之间的整数,用于估计您对答案的置信度(1 为低置信度,99 为高置信度)完成训练之后,约翰 · 内(John Nay)整理了335张法案的数据,然后对模型进行挑战,以预测它们是否与121家独特的公司有关。
因为大多数立法不会影响到大多数公司,他发现,只要总是说“不”,模型就可以猜对 70.9% 的情况。当他在2022年3月发布的旧版本 GPT-3上测试这种方法时,结果比那糟糕得多,预测准确率只有52.2% 。
但是,当在2022年11月才公布于众的 GPT-3.5模型(也就是ChatGPT的大脑)上进行试验时,它的准确率达到了75.1% 。在置信度评分超过90的法案上,准确率上升到79%。
如果法案与企业有关,还能自动生成法案修改建议
对于判定相关的情况,AI还会给出相关的理由,比如:
答:是
解释:Alkermes Plc 是一家生物制药公司,开发和商业化旨在解决主要治疗领域(包括成瘾和精神分裂症)患者未满足的医疗需求的产品。该法案要求医疗保险和医疗补助服务中心 (CMS) 与制药公司就医疗保险处方药福利所涵盖的药物价格进行谈判,这可能会影响 Alkermes Plc 的产品。
置信度:95
更重要的是,如果判断法案与企业有关,AI随后能够起草一封信给该法案的发起人,主张对立法进行修改。
比如这样的一封信:
论文没有评估起草的信件在影响政策方面有多大效果,约翰 · 内(John Nay)明确表示,这种方法还远远不能完成游说者的大部分工作。
但他表示,相隔数月发布的模型在预测性能方面的显著提升是值得注意的。他表示: “目前有一个明显的趋势,就是能力将迅速增强。”
“立法程序还没有为此做好准备,”同时他还表示。“这只是几天内构建的一个简单的概念证明。随着更多的资源和更多的时间花在这上面,特别是随着更多的关注于建立工作流程和用户体验与人类说客的日常工作联系在一起,这可能会建成一些相对复杂的东西。”
相关报道:
https://spectrum.ieee.org/ai-lobbyisthttps://arxiv.org/ftp/arxiv/papers/2301/2301.01181.pdf