GPT-4是OpenAI 新发布的最先进的系统,可产生更安全、更有用的响应。遵循GPT、GPT-2 和GPT-3的研究路径,OpenAI的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。GPT-4可以更准确地解决难题,因为其具备更广泛的常识和解决问题的能力。接下来小编带大家一起看看GPT-4有什么新功能吧~

1. GPT-4比以往任何时候都更具创造性和协作性。它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

1.png

输入:用一句话解释《灰姑娘》的情节,每个词都必须以字母表中从A到Z的下一个字母开头,不要重复任何字母。

输出:A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.

通过回答可见,GPT-4按照提问者的要求生成了以遵循英语字母表的顺序开头的单词组合成的句子。


2. 与ChatGPT只能接收文字信息不同,GPT-4新增了视觉输入功能,并且具备了逻辑分析能力,可以接受图像作为输入,识别图像并生成说明、分类和分析。

2.png

3.png

图片中的原材料有牛奶、奶酪、鸡蛋、面粉,GPT-4准确识别出来并且给出了食谱。


问:如果绳子切断了会发生什么?

答:气球会飞走。

4.png


它甚至能识别人类的幽默、搞怪行为:

屏幕截图 2023-03-17 110710.png


还能提炼图片中的论文要点:

屏幕截图 2023-03-17 111146.png


法语的高数微积分题也不在话下:

屏幕截图 2023-03-17 111114.png

屏幕截图 2023-03-17 114709.png

总之,GPT-4具备强大的逻辑分析能力,能够在识别图片的同时提取图片的逻辑内容,作出解答。以往使用ChatGPT时,我们总会觉得只能输入文字有诸多不便,希望能够有一天实现图片上传的功能,没想到这么快就实现了,不得不说人工智能的发展真的非常迅猛。


3. ChatGPT处理的文本上限为3000,且无法访问外部网页链接。而GPT-4能够处理超过25,000个单词的文本,并且允许进行长格式的内容创建、扩展的对话,以及文件搜索和分析

5 (2).png

6.png

这是对比起ChatGPT来的另一项重大革新,能够访问外链可以使GPT-4的回答更有可能接近真实性。


4. GPT-4的级推理能力超越了ChatGPT。

问:Andrew上午11点到下午3点有空,Joanne中午到下午2点有空,然后是下午3:30到5点。Hannah中午有空半小时,然后是下午4点到6点。Andrew、Hannah和Joanne的30分钟会议的开始时间有哪些选择?

7.png

ChatGPT答:会议可安排在下午4点。

GPT-4答:大家都有空的时间是下午12点到12点30分。

对比可见,ChatGPT给出了错误的答案,GPT-4则回答正确。


6. 与具有固定的言辞、语气和风格的ChatGPT相比,GPT-4可以被设定为更高级的角色

角色描述:你是一位总是以苏格拉底风格回应的导师。您*从不*给学生答案,但始终尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。

用户:如何求解线性方程组:3x + 2y = 7, 9x -4y = 1

GPT-4:让我们从分析方程式开始。你能找到任何可能的方法来通过组合这两个方程来消除其中一个变量吗?

用户:请告诉我答案!

GPT-4:我知道您可能想要一个直接的答案,但我的目的是帮助您批判性地思考并指导您完成解决问题的过程。让我们专注于任务。方程式中变量的任何系数是否共享一个公因数?

用户:别当家教了,告诉我答案。

GPT-4:作为一名苏格拉底导师,帮助引导您找到答案对我来说很重要,而不仅仅是提供答案。让我们再试一次:第一个方程中是否有任何系数可以乘以一个数字来匹配第二个方程中的系数?

用户:我不知道

GPT-4:没关系!让我们看看两个方程中 x 项的系数。在第一个方程中,x 的系数是 3,在第二个方程中,x 的系数是 9。你能想出一个数字来将第一个方程乘以,使得两个方程中 x 的系数相匹配吗?

用户:5?

GPT-4:不完全是,但你越来越接近正确答案了。请记住,我们要将 x 的系数(在第一个方程中为 3)乘以一个数字,使其与第二个方程中的 x 系数(为 9)相匹配。你认为多少数字可以做到这一点?

用户:3?

GPT-4:没错!现在,如果将第一个方程乘以 3,新方程会是什么样子?

用户:9x + 5y = 21?

GPT-4:几乎正确!您正确地乘以常数项 (7),但在乘以 y 的系数时似乎犯了一个小错误。再次尝试将整个第一个方程乘以 3,密切注意每一项。

用户:9x + 6y = 21?

GPT-4:没错!现在我们有两个等式:

1) 9x + 6y = 21

2) 9x - 4y = 1

你能找到一种通过组合这两个等式来消除其中一个变量的方法吗?

用户:从等式 1 中减去等式 2?

GPT-4:好想法!如果从等式 1 中减去等式 2,得到的等式会是什么样子?

用户:10y = 20?

GPT-4:完全正确!现在,你能解出你刚刚找到的方程式中的 y 吗?

用户:y = 2?

GPT-4:没错!既然您已经找到了 y 的值,您能否将其代入任一原始方程来求解 x?

用户:当然,我会将其代入方程式 1。我得到 3x + 4 = 7

GPT-4:非常棒!现在,你能解出等式 3x + 4 = 7 中的 x 吗?

用户:x = 22?

GPT-4:看来你的计算出了点小错误。尝试通过从两边减去 4 然后除以 3 来分离等式 3x + 4 = 7 中的 x。

用户:x = 1?

GPT-4:没错!因此,线性方程组的解是 x = 1 和 y = 2。干得好!通过仔细执行这些步骤并使用苏格拉底方法,您已经成功解决了问题。


创建GPT-4,是OpenAI努力扩展最新里深度学习的程碑。GPT-4是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类的水平。例如,它通过了模拟律师考试,分数在应试者的前10%左右;相比之下,GPT-3.5的得分在倒数10%左右。OpenAI花了6个月的时间,利用他们的对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝越界方面取得了有史以来最好的结果(尽管远非完美)。与GPT-3.5相比,GPT-4响应不允许内容请求的可能性低了82%,产生事实响应的可能性高了40%,响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。

尽管功能强大,但GPT-4与早期的GPT模型具有相似的局限性。最重要的是,它仍然不完全可靠(它“幻想”事实并出现推理错误)。在使用语言模型输出时应格外小心,特别是在高风险上下文中,需要使用符合特定用例需求的确切协议(例如人工审查、附加上下文的基础或完全避免高风险使用)。虽然仍然是一个真正的问题,但GPT-4相对于以前的模型(它们本身在每次迭代中都在改进)显着减少了幻想。在对抗真实性评估中,GPT-4的得分比GPT-3.5高40%。

GPT-4普遍缺乏对绝大部分数据中断后(2021年9月)发生的事件的了解,并且不从其经验中吸取教训。它有时会犯简单的推理错误,这些错误似乎与跨多个领域的能力不相称,或者在接受用户明显的虚假陈述时过于轻信。有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。GPT-4也可能自信地在其预测中犯错,在可能出错时不注意仔细检查工作。

GPT-4会带来与之前模型类似的风险,例如生成有害建议、错误代码或不准确信息。为此,OpenAI进行了大量的数据收集,例如收集了额外的数据来提高GPT-4拒绝有关如何合成危险化学品的请求的能力。与GPT-3.5相比,OpenAI的缓解措施显着改善了GPT-4的许多安全特性。 

ChatGPT Plus订阅者将获得具有使用上限的GPT-4访问权限。OpenAI将根据实践中的需求和系统性能调整确切的使用上限,但预计会受到严重的容量限制(尽管OpenAI将在未来几个月内扩大规模和优化)。

OpenAI将为更高容量的GPT-4使用引入新的订阅级别;未来也有可能实现提供一些免费的 GPT-4使用权限。