aime - 搜索 News

虎嗅网6 小时

一文回顾OpenAI系列发布会：从工具到AGI，OpenAI的12天进化论

现在，仅需“几十个例子”甚至12个例子，就能够让模型有效学会特定领域的推理。根据OpenAI的研究数据，经过强化微调的o1mini模型，其测试通过率比传统的o1模型高出24%，相比未经过强化微调的o1mini则提升了整整82%。

腾讯网1 小时

o3、应用生态、Sora、产品形态，四个问题看懂 OpenAI 12 天发布会

文｜黎诗韵编辑｜郑玄历史上第一次有公司会连续开 12 天的产品发布会——当 OpenAI 宣布这个决定之后，全球科技圈的期待值被拉满了。但直到发布会接近尾声，「就这？就这？」一位 AI ...

14 小时

OpenAI o3震撼觉醒，AGI今夜降临？血洗o1，破解陶哲轩最难数学题

在AIME 2024数学竞赛评测中，o3取得了96.7%的准确率，性能直接飙升13.4%；在博士级科学问答基准GPQA Diamond上，o3准确率为87.7%，相较于上一代o1提升9.7%。

21 小时

击败99.9%的程序员！o3来了！AGI测试实现跃升！网友：推理scaling law太 ...

首先，作为被大模型率先盯上的生产力变革领域，大模型的编程能力，o3刷新了先有模型的基准。在流行的SWE基准测试上，o3达到了惊人的71.7的分数，可以理解成1000道编码工程问题，o3可以直接为717道问题生成正确的代码布丁并通过单元测试，而且用时还 ...

23 小时

【国金电子】行业周报：OpenAI o3大模型亮眼，关注2025年CES展消费电子 ...

OpenAI ...

DOIT13 小时

这两天头条都被谷歌和OpenAI抢了！AI界“双雄”争霸——谷歌版o1突发 ...

新的Thinking模型是以刚发布的2.0 Flash版本为基础，使用了类似o1模型的慢思维思考方式，可以深度可视化展示整个思维链过程，尤其是在执行数学、编程等复杂问题方面，能持续输出全部推理过程，而不是直接给出答案。

腾讯网14 小时

OpenAI发布o3说明前五的互联网巨头今年千亿美元投入值了

任泓宇（左）本科毕业于北大，后在斯坦福获得博士学位，负责o3-mini的训练12月20日，OpenAI发布o3、o3-mini模型, 重新获得大模型能力测评领先:数学竞赛评测:在AIME 2024数据集上, ...

搜狐8 天

AMC竞赛大捷！思铺学子全球卓越奖占比翻三倍，揭秘AIME备考攻略！

🎉今日喜讯传来，2024年美国数学竞赛AMC分数线已公布，思铺学院学子在激烈的竞争中脱颖而出，荣获全球卓越奖1%（Honor Roll of Distinction）的比例 ...

14 小时

本周观点精华（1223-1227）丨产品消化跟不上生产扩张

错位一：产品消化跟不上生产扩张。

14 小时

港股概念追踪 | “剑指”AGI！OpenAI发布新一代推理模型o3 大模型落地 ...

智通财经APP获悉，OpenAI离AGI (artificial general intelligence，通用人工智能)似乎又更近了一步。上周五，在“OpenAI 12天活动”的第12天，OpenAI首席执行官萨姆·奥特曼宣布了其最新的人工智能“推理”模型o3和o3-mini，这两款模型是在今年早些时候推出的o1模型的基础上开发的。 OpenAI声称，至少在某些条件下，o3模型可以接近实现AGI ...

来自MSN12 小时

OpenAI 发布 o3 模型，成为首个突破 ARC-AGI 测试的模型

就在不久之前也就是 OpenAI 的第十二天发布会上发布了全新的推理模型 o3 和 o3-mini，这个模型创造了记录成为首个突破 ARC-AGI 基准测试的 AI 模型，得分高达 87.5%。什么是 ARC-AGI 呢？ARC-AGI ...

三易生活 on MSN1 天

OpenAI推出o3系列模型，号称已接近实现AGI

继不久前在“12 Days of OpenAI”线上新品发布活动中，OpenAI方面宣布上线正式版o1推理大模型后。在当地时间12月20日举行的“12 Days of ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果