影音先锋播放 OpenAI发布首款具备推理身手的模子o1 领有初步的事实查核身手

发布日期:2024-09-27 22:39    点击次数:64

影音先锋播放 OpenAI发布首款具备推理身手的模子o1 领有初步的事实查核身手

4D572D8282E2B8E7A1C1C8B657C8BA8892404D9B_size75_w1920_h1081.webp影音先锋播放

关于 OpenAI 来说,o1 代表着它向类东谈主东谈主工智能的更世俗指标迈进了一步。更本质的是,它在编写代码和处置多智商问题方面比往日的模子作念得更好。但与GPT-4o 比较,它的资本更高,速率更慢。OpenAI 将此次发布的 o1 称为"预览版",以强调它的雏形。

ChatGPT Plus 和 Team 用户从今天运转不错访谒 o1-preview 和 o1-mini,而 Enterprise 和 Edu 用户将鄙人周初访谒。竖立者访谒 o1 的用度极端 腾贵:在 API 中,o1-preview 每 100 万个输入令牌(即模子领悟的文本块)收费 15 好意思元,每 100 万个输出令牌收费 60 好意思元。比较之下,GPT-4o 的价钱为每 100 万个输入词组 5 好意思元,每 100 万个输出词组 15 好意思元。

OpenAI的研讨阐明东谈主杰里-特沃瑞克(Jerry Tworek)告诉我,o1背后的教师与前代居品有骨子区分,不外公司对具体细节暧昧其辞。他说,o1"继承了全新的优化算法和专诚为其定制的新教师数据集"。

OpenAI 正在培训往日的 GPT 模子效法教师数据中的模式。在使用 o1 时,OpenAI 哄骗一种名为"强化学习"的本事教师模子自行处置问题,该本事通过赏罚来调换系统。然后,它使用"念念维链"来处理查询,这与东谈主类逐步处置问题的方式访佛。

OpenAI 暗意,由于继承了这种新的教师挨次,模子应该会愈加准确。"咱们防御到,这个模子产生幻觉的情况减少了,"Tworek 说。但问题依然存在。"咱们不成说咱们处置了幻觉问题"。这个新模子与 GPT-4o 不同之处主要在于,它能比前代模子更好地处理复杂问题,如编码和数常识题,同期还能阐发我方的推理。

OpenAI的首席研讨官鲍勃-麦格鲁(Bob McGrew)告诉我:"这个模子在处置AP数学检会方面十足比我强,而我在大学里辅修的是数学。他说,OpenAI 还用国外数学奥林匹克竞赛的阅历窥察对 o1 进行了测试影音先锋播放,GPT-4o 只正确处置了 13% 的问题,而 o1 则达到了 83%。"

"咱们不成说咱们处置了幻觉问题"

在被称为"Codeforces"的在线编程竞赛中,这种新模子在参赛者中的名次达到了第89位,OpenAI宣称,这种模子的下一个更新版块将在"物理、化学和生物学限制具有挑战性的基准任务中得回与博士生访佛的流露"。

同期,o1 在好多方面的身手王人不如 GPT-4o。它在对天下的本质了解方面作念得不够好。它也不具备浏览网页或处理文献和图像的身手。尽管如斯,该公司仍觉得它代表了一种全新的身手。它被定名为 o1,暗意"将计数器重置回 1"。

麦克格鲁说:"诚实说,我觉得咱们在传统定名方面作念得很灾祸。是以我但愿这是咱们迈出的第一步,咱们会用更新、更千里着耐心的名字,99bt更好地向天下其他所在传达咱们正在作念的事情。"

McGrew 和 Tworek 本周通过视频通话展示了o1。他们条目它处置这个难题:"当公主的年岁是王子年岁的两倍时,公主的年岁即是王子年岁的两倍。王子和公主的年岁是若干?请提供该问题的整个谜底"。

模子运算了 30 秒钟,然后给出了正确谜底。OpenAI 经营的界面不错在模子念念考时败露推明智商。让我印象深入的并不是它展示了我方的使命--GPT-4o 不错在辅导下作念到这少许--而是 o1 是怎样刻意效法东谈主类的念念维。诸如"我很酷爱"、"我正在念念考"和"好的,让我望望"这么的句子营造出一种循序渐进的念念考假象。

但这个模子不会念念考,更不是东谈主类。那么,为什么要把它经营得像东谈主相通呢?

我很酷爱"、"我正在念念考"、"好的,让我望望"等短语会让东谈主产生一种循序渐进的念念考错觉。

Tworek 觉得,OpenAI 并不折服东谈主工智能模子的念念维等同于东谈主类念念维。但他说,该界面旨在展示模子怎样花更多时辰处理和深入处置问题。"在某些方面,它比之前的模子更多情面味"。

动漫里番

麦克格鲁说:"我想你会发现,它有好多让东谈主嗅觉有点生疏的所在,但也有让东谈主嗅觉非凡东谈主性化的所在。该模子处理查询的时辰有限,因此它可能会说:哦,我没时辰了,让我快点找到谜底吧。早期,在它的念念维链中,它也可能看起来像是在头脑风暴,并会说:我不错作念这个或阿谁,我该怎样作念?"

大型话语模子并不完全智能。它们骨子上仅仅凭证从多数数据中学到的模式来展望单词序列以提供谜底。就拿 ChatGPT 来说,它陆续会误觉得"草莓"这个词只好两个 R,因为它莫得正确地剖析这个词。不外,新的 o1 模子也曾不错正确地回应这个问题。

据报谈,OpenAI但愿以令东谈主瞠观念1500亿好意思元估值筹集更多资金,其发展势头取决于更多的研讨冲突。该公司之是以将推理身手引入 LLM,是因为它看到了自主系统或代理的畴昔,它们粗略代表你作念出方案并弃取动作。

关于东谈主工智能研讨东谈主员来说,破解推理是迈向东谈主类智能水平的热切一步。他们的想法是,如若一个模子不仅能进行模式识别,还能在医学和工程学等限制齐全冲突。但现在,o1 的推理身手相对较慢,不像代理,竖立东谈主员使用起来也很腾贵。

麦格鲁说:"咱们也曾花了好几个月的时辰来研讨推理影音先锋播放,因为咱们觉得这本质上是关键性的冲突。从根柢上说,这是模子的一种新模式,以便粗略处置果然贫困的问题,从而向东谈主类智能水平迈进。"