近日,北卡罗来纳大学教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一个联合团队。他们发布的论文表明,逆向思维可以显著 LLM 的推理能力,并且不限于数学任务。他们还提出了一个名叫 RevThink ...
在科技日新月异的今天,知识蒸馏这一概念已经日在机器学习特别是自然语言处理(NLP)领域广泛应用。最近,腾讯优图实验室与中国科学技术大学共同开发了一种创新的知识蒸馏方法,名为SinKD,基于Sinkhorn距离的全新设计,提供了一种告别传统散度蒸馏的新思路。
近日,斯坦福大学发布了《2024年AI指数报告》。这份报告深入分析了当前AI领域的发展趋势和面临的挑战,揭示了AI技术如何影响我们的日常生活。我们截取了报告部分精华内容,与大家分享。
开局一张图,故事全靠编。以前可能是个网络热梗,但是现在,可能成为真的了。作为AI领域影响力最大的女性和华人之一 ,AI学者、斯坦福大学教授人工智能科学家。李飞飞 ...
腾讯优图实验室 投稿量子位 | 公众号 QbitAI 用大模型“蒸馏”小模型,有新招了! 甚至能在不同类型和架构的LLMs(大语言模型)上达到新SOTA。 这就是来自中科大、腾讯优图实验室提出的一种基于Sinkhorn距离的知识蒸馏方法,能把大的、复杂的教师模型的知识“蒸馏”到小的、简单的学生模型中,从而让小模型也能像大模型一样工作。 之所以提出新方法,主要是现有的知识蒸馏(KD)方法都有各自的局 ...
最终,通过在两个流行的自然语言处理测试集(GLUE和SuperGLUE)上测试,新方法在编码器、编码器-解码器以及解码器等不同架构的所有类型LLMs上均 ...