谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%-科技今日热点

IT之家5月21日消息，谷歌公司上周发布技术报告，表示Gemini1.5Pro模型在经过专门的数学领域训练之后，大幅提高了数学成绩，并成功解决了国际数学奥林匹克竞赛的部分问题。

谷歌针对数学场景有针对性地训练Gemini1.5Pro模型，并通过MATH基准、美国数学邀请考试（AIME)和谷歌内部的HiddenMath基准进行测试。

根据谷歌的数据，数学型Gemini1.5Pro在数学基准测试中的表现“与人类专家的表现相当”，与标准的非数学型Gemini1.5Pro相比，数学型Gemini1.5Pro在AIME基准测试中解决的问题明显增多，在其他基准测试中的得分也有所提高。

谷歌针对数学场景有针对性地训练Gemini1.5Pro模型，并通过MATH基准、美国数学邀请考试（AIME)和谷歌内部的HiddenMath基准进行测试。

谷歌官方分享的三个示例中，两个是由数学专用的Gemini1.5Pro解决的，而一个是由标准的Gemini1.5Pro变体错误解决的。这些问题通常要求解题者回忆代数中的基本数学公式，并依靠它们的分段和其他数学规则得出正确答案。IT之家附上相关截图如下：谷歌官方分享的三个示例中，两个是由数学专用的Gemini1.5Pro解决的，而一个是由标准的Gemini1.5Pro变体错误解决的。这些问题通常要求解题者回忆代数中的基本数学公式，并依靠它们的分段和其他数学规则得出正确答案。IT之家附上相关截图如下：

除了问题之外，谷歌还分享了Gemini1.5Pro基准测试的重要细节。这些数据表明，在所有五项基准测试成绩中，Gemini1.5Pro都领先于GPT-4Turbo和亚马逊的Claude。

谷歌表示数学衍生版Gemini1.5Pro单个样本MATH基准准确率为80.6%，在对256个解决方案进行采样并选择一个候选答案时（rm@256），准确率达到91.1%。

参考Gemini1.5:Unlockingmultimodalunderstandingacrossmillionsoftokensofcontext除了问题之外，谷歌还分享了Gemini1.5Pro基准测试的重要细节。这些数据表明，在所有五项基准测试成绩中，Gemini1.5Pro都领先于GPT-4Turbo和亚马逊的Claude。

谷歌表示数学衍生版Gemini1.5Pro单个样本MATH基准准确率为80.6%，在对256个解决方案进行采样并选择一个候选答案时（rm@256），准确率达到91.1%。

参考Gemini1.5:Unlockingmultimodalunderstandingacrossmillionsoftokensofcontext

未经允许不得转载：头条资讯网_今日热点_娱乐才是你关心的时事 » 谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%

	新款iPad Pro再现内存门？苹果的傲慢可不止于此
	索尼佳能徕卡新机或将延期原因竟是欧盟新规？
	iPhone SE4定价、配置、外观设计全曝光！
	架构优先、先易后难，华为的制造业生成式AI方法论
	再续“父辈”之荣耀？荣耀小折叠V Flip手机曝光，若隐若现华为身影
	60天卖出200万台！骁龙8Gen2+2K屏+1999 元起，这次又要卖爆了
	骁龙8Gen3旗舰突降1359元，16GB+1TB+100倍变焦，售价再创新低
	国足名单“新意”背后是伤病，战泰国伊万将押宝归化球员
	谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%
	刘亦菲舒淇上演罗马假日宛如美神在世

头条资讯网_今日热点_娱乐才是你关心的时事

谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%

相关推荐

新款iPad Pro再现内存门？苹果的傲慢可不止于此

索尼佳能徕卡新机或将延期原因竟是欧盟新规？

iPhone SE4定价、配置、外观设计全曝光！

架构优先、先易后难，华为的制造业生成式AI方法论

再续“父辈”之荣耀？荣耀小折叠V Flip手机曝光，若隐若现华为身影

60天卖出200万台！骁龙8Gen2+2K屏+1999 元起，这次又要卖爆了

骁龙8Gen3旗舰突降1359元，16GB+1TB+100倍变焦，售价再创新低

国足名单“新意”背后是伤病，战泰国伊万将押宝归化球员

谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%

刘亦菲舒淇上演罗马假日宛如美神在世

评论