谷歌于近日正式发布多模态推理模型 Gemini 2.0 Flash Thinking,这一新型 AI 模型在推理能力、处理速度和透明度方面均实现突破性进展,向 OpenAI 的 o1 ...
视频理解被视为人工智能领域的新前沿,但你是否想过,并非所有视频都是一样的?纽约大学谢赛宁(Saining ...
新的Thinking模型是以刚发布的2.0 Flash版本为基础,使用了类似o1模型的慢思维思考方式,可以深度可视化展示整个思维链过程,尤其是在执行数学、编程等复杂问题方面,能持续输出全部推理过程,而不是直接给出答案。
现在,仅需“几十个例子”甚至12个例子,就能够让模型有效学会特定领域的推理。根据OpenAI的研究数据,经过强化微调的o1mini模型,其测试通过率比传统的o1模型高出24%,相比未经过强化微调的o1mini则提升了整整82%。
蓝鲸新闻12月23日讯(记者 ...
【导读】 李飞飞、谢赛宁团队又有重磅发现了:多模态LLM能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现了空间意识!李飞飞兴奋表示,在2025年,空间智能的界限很可能会再次突破。
一项研究显示,每个 o3任务大约消耗1,785千瓦时的电能,这相当于一个美国普通家庭在两个月内的用电量。根据 Salesforce 的 AI 可持续发展负责人 Boris Gamazaychikov 的分析,这一电能消耗大约对应684千克的二氧化碳当量排放,这与五箱满油的汽油的碳排放量相当。
近日,OpenAI与谷歌在推理模型领域上演了一场精彩的“擂台战争”,引发了广泛关注。OpenAI于12月20日正式宣布,正在测试其新的推理模型o3和o3mini。根据OpenAI的说法,o3较之前的模型大幅提高了性能,尤其在SWEBenchVerif ...
在AIME 2024数学竞赛评测中,o3取得了96.7%的准确率,性能直接飙升13.4%;在博士级科学问答基准GPQA Diamond上,o3准确率为87.7%,相较于上一代o1提升9.7%。
报告中还写道,尽管每项任务的成本很高(o3 在低计算量模式下每个任务需要 17-20 美元,高计算量模式下每个任务数千美元),但这些数字不仅仅是将暴力计算应用于基准测试的结果。OpenAI 的新 o3 ...
6个月前,马蒂厄·格拉芬斯塔登 (Matthieu Graffensttaden)和劳伦斯(Laurence Auzière-Jourdan) 夫妇由法国飞往中国深圳。他们此行的目的之一是采集中国当代艺术家王郁洋的口腔DNA,为新作《梅莱斯新世界》收集素材。 劳伦斯-格拉芬斯塔登,这对国际艺术组合以其医学跨界DNA艺术而闻名。他们的作品通过结合生物学和技术,探讨人类身份和遗传信息的艺术表达,将艺术 ...
智通财经APP获悉,OpenAI离AGI (artificial general intelligence,通用人工智能)似乎又更近了一步。上周五,在“OpenAI 12天活动”的第12天,OpenAI首席执行官萨姆·奥特曼宣布了其最新的人工智能“推理”模型o3和o3-mini,这两款模型是在今年早些时候推出的o1模型的基础上开发的。 OpenAI声称,至少在某些条件下,o3模型可以接近实现AGI ...