最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？？？-科技今日热点

来源|科研圈（ID：keyanquan）

可用于ChatGPT的11个插件。｜OpenAI

撰文杜若云

编辑吴兰、魏潇

北京时间3月23日，OpenAI发布了第一批可接入ChatGPT的插件。这些插件由11个第三方提供，同时OpenAI官方也提供了两个官方插件Browsing和CodeInterpreter。

根据OpenAI官网的介绍[2]，第三方的插件可以用来查询航班，订机票（Expedia，KAYAK），对比商品价格，购物（KlarnaShopping，Shop，Instacart），检索实时消息（FliscalNote），进行数学计算（Wolfram），学习语言（Speak）等等。在这些插件的加持下，ChatGPT终于可以走出2021年之前的世界，与当下“联网”了。

Wolfram加持，数学能力显著提高

第三方插件的接入使得ChatGPT更加强大。作为大型语言模型（LLM）神经网络，ChatGPT强大的生成文本材料能力有目共睹，但它并不能去做复杂的计算推理工作，也无法系统地产生正确的（而不是“看上去正确”的）数据。但在接入计算功能强大的Wolfram插件后，ChatGPT不仅可以做这些事情，在计算层面上“胡言乱语”的习惯也可以被改正。

通过下面这道大学数学题，就能看出接入插件前后ChatGPT的不同表现。图1中的Genie来自代码编辑器VScode，它是该软件的ChatGPT扩展，能够代表没有接入插件前的ChatGPT。

图1没有接入计算插件Wolfram前，ChatGPT的“胡言乱语”。｜作者

图2接入插件的ChatGPT给出了正确的答案。｜[1]

通过简单的检查我们发现，在没有接入Wolfram插件时，ChatGPT给出了一个“看起来过程很完美”但是结果完全错误的回答，但是在接入Wolfram插件后的回答是完全正确的。那么，这个插件是如何避免ChatGPT“胡说”的？解决方法听起来很简单：ChatGPT会通过插件将问题发送给WolframAlpha进行计算，然后根据返回的结果来“决定”回答什么。同时用户可以点击“UsedWolfram”按钮来检查ChatGPT是否“编造”回答。这意味着，通过Wolfram插件我们可以判断出哪些信息（计算相关）是正确的，哪些是“编造”的。

对于与现实世界有关的问题，ChatGPT也可以靠这种方法给自己打上“补丁”。比如向无插件版ChatGPT提问土耳其的畜牧数量有多少时，它“郑重其事”地引用了土耳其统计局（TurkishStatisticalInstitute），并“编造”了一个看似合理的数据（图3）。当使用接入Wolfram插件的ChatGPT时（图4），这个回答和WolframAlpha（Wolfram公司的一款软件，也是Wolfram插件背后的“回答者”）中给出的答案完全相同，这也从侧面验证了该插件的工作原理。

图3无插件的ChatGPT对土耳其畜牧业问题的编造回答。

图4有插件后ChatGPT能够给出正确答案。来源：[1]

目前，Wolfram和ChatGPT的联动，仅限于ChatGPT将用户用自然语言询问的问题通过插件发送给WolframAlpha。由于WolframAlpha的构建初衷就是处理各种“混乱”的类人自然语言并给出答案，因此它可以处理来自ChatGPT的用户询问，并通过插件返回答案[1]，因此目前的Wolfram插件对于ChatGPT是一个简单版本，未来也许可以通过训练使ChatGPT“搞懂”更复杂更强大的Wolfram语言，这对于ChatGPT的计算能力提高更为关键，对科研职业的作用也更为明显。

数学家危险了？

那么这是否意味着，插件的接入会使ChatGPT的功能足够强大到影响以至于取代某些职业呢？

根据OpenAI最近发表在预印本网站arXiv.org上的研究论文[3]，我们可以看到不同职业对于GPT的“暴露”程度。这里的“暴露”是指将完成任务的时间减少至少一半，即当“暴露”程度达到100%，GPT能至少帮你将完成任务的时间减少一半。不同职业的“暴露”程度有所不同，最令人惊讶的是，数学家的暴露程度超越了很多看似技术含量不太高的工作，达到了100%。作为对比，财务经理和平面设计师的暴露程度为13%，公关专家和创意作家的暴露程度分别为67%和69%，而经常“被失业”的翻译和口译的暴露程度，也只有77%。

图5OpenAI关于AI对不同职业影响程度的研究结果来源：[3]

从论文发表的时间来看，这些数据是GPT-4发布后和ChatGPT插件发布前的数据，但从插件的作用和机制来看，插件的引入或许导致这些职业的“暴露”程度更高，同时会减少用户检查ChatGPT是否在“胡说八道”的时间。但这并不意味数学家将被取代，他们可以将大量繁琐的计算和代码工作交给ChatGPT来完成。这将大大提高科学家的工作效率，让他们有时间思考并进行原创性工作。如果ChatGPT可以帮助数学家和理论物理学家完成繁琐的计算，并得到大量结果，这也会对我们理解新科学大有帮助。

图6陶哲轩分享的ChatGPT使用心得来源：[7]

图7利用ChatGPT生成的arXiv论文检索结果的RSS。｜作者

除此之外，陶哲轩还会用ChatGPT帮自己备课，比如询问它在线性代数课堂中聪明的学生可能会提出的问题，来启发自己课程讲授以及布置作业的方向。在博客中他提到：“虽然这些AI工具无法直接帮助我完成核心任务——如尝试解决一个尚没有答案的数学问题，但是它们对于各种次要（但仍与工作相关）任务时非常有效（尽管之后需要一些手动调整）。”

隐私隐患如何解决

目前来看，这些职业是否会被AI取代，取决于后者的未来发展，但这毫无疑问会深刻改变我们的生活生产方式。OpenAI公共政策主管AnnaMakanju表示：“这项技术将深刻改变我们的生活方式。我们现在仍有时间来指导其发展轨迹、限制滥用并确保最广泛有益的结果。”[6]

除了职业安全问题，我们还需要关心一下自己的隐私。担心“聪明”的ChatGPT“窃取”用户隐私是一个AI诞生起就如形随形的问题，而第三方插件的引入使得这个问题更加复杂——我们难以保证这些插件不会利用ChatGPT获得用户隐私来牟利。3月20日，ChatGPT出了一个几乎引发全网骚动的bug，一些用户可以在自己的聊天页面里看到他人的聊天记录。OpenAI不得不将ChatGPT强制下线修复[4]，这令大批打工人叫苦不迭。更糟糕的是，ChatGPT下线的几个小时里，一部分活跃用户的姓名、电子邮件地址、支付地址、信用卡号的最后四位和信用卡到期时间也被泄露，尽管OpenAI官方认为泄漏的数据量很少，但如何采取措施确保用户隐私安全将成为所有AI公司的首要任务。

如上所述，ChatGPT这样的AI在未来肯定会深刻地影响目前社会的生产生活格局，改变人们的工作生活方式，因此如何确保新的“人+AI”模式顺利进行并对人类社会产生有益影响，对于政策制定者和AI公司有着极大的考验。

参考文献

[1]https://writings.stephenwolfram.com/2023/03/chatgpt-gets-its-wolfram-superpowers/

[2]https://openai.com/blog/chatgpt-plugins

[3]https://arxiv.org/pdf/2303.10130.pdf

[5]https://openai.com/blog/march-20-chatgpt-outage

[6]https://openai.com/safety

[7]https://mathstodon.xyz/@tao

封面图来源：Pixabay。

本文经授权转载自科研圈（ID：keyanquan），如需二次转载请联系原作者。欢迎转发到朋友圈。返回搜狐，查看更多

责任编辑：

未经允许不得转载：头条资讯网_今日热点_娱乐才是你关心的时事新闻 » 最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？？？

	德保公安发挥内部督察作用助推乡村振兴工作提效增质
	风太大！克拉玛依区属小学18日停课一天！
	“三甜伤肝，少吃，二苦养肝，多吃，”一起来了解一下吧
	国家药监局药审中心赴上海调研罕见病用药
	直播预告：“癌中之王”胰腺癌来时静悄悄？专家教你应对策略
	蔡司镜片贵，真的比几百块钱的镜片好很多吗？
	除了写《三国志》的陈寿，这些史学家也对三国历史流传贡献巨大
	她是明朝首位太后，被赞“女中人杰”，多活7年不会有土木之变
	倪萍91岁母亲病危，61岁倪萍连夜抢救守护，与母亲的手绑在一起
	福原爱找了个软饭男，从豪宅搬出，租房还房贷？

头条资讯网_今日热点_娱乐才是你关心的时事新闻

最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？？？

相关推荐

德保公安发挥内部督察作用助推乡村振兴工作提效增质

风太大！克拉玛依区属小学18日停课一天！

“三甜伤肝，少吃，二苦养肝，多吃，”一起来了解一下吧

国家药监局药审中心赴上海调研罕见病用药

直播预告：“癌中之王”胰腺癌来时静悄悄？专家教你应对策略

蔡司镜片贵，真的比几百块钱的镜片好很多吗？

除了写《三国志》的陈寿，这些史学家也对三国历史流传贡献巨大

她是明朝首位太后，被赞“女中人杰”，多活7年不会有土木之变

倪萍91岁母亲病危，61岁倪萍连夜抢救守护，与母亲的手绑在一起

福原爱找了个软饭男，从豪宅搬出，租房还房贷？

评论