近日,第十七届评价学:评价科学与工程大会(简称Bench 2025)在四川广汉召开。会议由国际测试委员会(Bench Council)主办,旨在促进各行各业评价科学与工程的发展。中国中检华北区域公司受邀参加,并于会上发布了相关研究成果——“面向AI终端的端侧大模型Benchmark体系”。
面向AI终端的端侧大模型Benchmark体系,由中国中检华北区域公司与中国信息通信研究院联合立项研发,聚焦手机、平板电脑、智能穿戴设备等智能终端设备,围绕Token吞吐率、首Token时间、计算时长、初始化时长、准确率等多项核心指标展开评测,旨在为消费者选购适合自身使用需求的产品提供数据参考,同时也为智能终端设备厂商提供公正独立的数据基准,推动行业规范与持续进步。此次发布为阶段性研究成果,后续将持续深入研究,尽快推出评测榜单(Benchmark)。
会议期间,华北区域公司参会代表参加了科技成果评价圆桌论坛,并分享了华北区域公司在科技成果评价方面的实践与经验。