中国邮政鸿雁大模型平台工程OCR大模型微调训练平台软件投标人相关资质采前公示公告
时间:2025-08-07     来源:采购平台

 

中国邮政鸿雁大模型平台工程

OCR大模型微调训练平台软件投标人相关资质采前公示公告

各潜在投标人:

为全面推动邮政智能化转型与技术创新,开展智能化应用,推进大模型平台在邮政的应用,降低企业管理成本。中国邮政集团有限公司(以下称“中国邮政”)已批准中国邮政鸿雁大模型平台工程建设。OCR大模型微调训练平台软件已具备招标条件,现公开招标前就资质认证要求、产品核心技术功能指标要求、团队核心成员资质业绩要求关键资质进行公示,如果潜在投标人对公示关键资质要求存疑,可在公示起止时间内,通过公示受理渠道反馈。

一、公示关键资质

(一)资质认证要求

  1.   (废标项)乙方及其供应商必须为中华人民共和国合法注册的企业,乙方及其供应商须向甲方提供企业营业执照的复印件,甲方需要时乙方要提供原件备查。
  2.   (废标项)乙方应为拟投产品原厂商或唯一代理商,要求供应商提供软件开发与集成服务(含维保)为原厂服务的承诺函。
  3.   (评分项)提供拟投产品近五年(2020年1月1日以来)在央企总部(国资委履行直接出资人)、大型寄递企业(顺丰、中通申通、圆通、韵达、德邦、京东)总部、运营商(中国移动、中国电信、中国联通)总部、中央金融企业(财政部履行直接出资人)总部、全国性股份制商业银行总部、保险机构总部及省分公司(以国家金融监督管理总局发布的保险机构法人名单为准)、中国邮政系统(含中国邮政储蓄银行总行、中国邮政集团各省分公司)中国邮政速递物流股份有限公司总部或上述企业控股公司的与本次采购内容相关的4个(含)以上的OCR大模型类成功应用案例(需至少提供合同首页、产品内容页、签章页)及系统架构或方案、服务内容及合同甲方出具的完成情况介绍,如验收报告等,单个案例合同金额(或同一框架协议下的订单总额)不得低于80万元,案例需填写案例情况表。(注:1:若非上述企业直签,由控股公司签署的,还需提供控股关系证明;2:中国移动总部包含:中国移动通信集团有限公司、中国移动通信有限公司;中国电信总部包含:中国电信集团有限公司、中国电信股份有限公司;中国联通总部包含:中国联合网络通信集团有限公司、中国联合网络通信有限公司、中国联合网络通信股份有限公司)
  4.   (评分项)拟投产品原厂商的人工智能专利数应达到30个以上,并提供相应资质证明。
  5.   (评分项)软件原厂商需具有CMMI3及以上资质。
  6.   (评分项)软件原厂商需具有ISO9001和ISO20000资质。
  7.   (评分项)合同签订后,卖方向买方提交合同总价5%的履约保证金,保证金有效期为一年。

(二)产品核心技术功能指标要求

对应章节

类型

产品核心技术功能指标

1.22

废标项

乙方拟投产品可应用范围为邮政系统各单位,包括但不限于中国邮政集团有限公司及其各控股公司、子公司、参股公司,各分支机构,寄递事业部,各省、自治区、直辖市分公司,直属各单位等。

1.23

废标项

乙方拟投产品须根据甲方需要,提供新环境部署、节点扩容、授权许可扩容,不得收取额外费用。

3.1

废标项

OCR大模型微调训练平台(含OCR基座大模型)软件和集成部署、实施及维护服务。其中OCR基座大模型须具备端到端能力,并对多版式手写体、中英文、拼音及机打手写混合等复杂场景的文字识别和结构化输出。实施包括但不仅限于:扁平信函识别引擎、明信片识别引擎、国际面单识引擎的训练产出、部署、安装、联调测试和系统集成(包括但不限于通用开源组件等软件的安装和操作系统、数据库等软件的性能调优),并与相关系统进行集成、联调测试等。OCR大模型微调训练平台须支持不限license产出模型,并且平台无使用期限要求。

4.1

废标项

要求实现的主要功能项

一级模块

二级模块

功能点

功能点详细描述

数据管理

数据导入

数据集上传

1. 支持本地导入zip包或pdf文件生成图片数据集

2. 支持利用一个已有数据集再次导入复制得到一个新数据集

3. 支持数据集上传进度实时展示及上传报错日志展示

数据集追加

支持针对某数据集继续追加图片数据

已有标注文件上传

支持指定数据集上传对应的离线标签文件(标签文件内容需满足平台指定格式规范)

数据集下载

1. 支持仅下载该数据集的标签文件

2. 支持同时下载该数据集的原始图片+标签文件

数据删除

1. 支持对整个数据集进行删除

2. 支持对数据集中指定图片进行删除

数据浏览

1. 支持查看全部、已标注、未标注图片及其数量

2. 支持预览已标注数据的标注结果,支持直接在图片上展示标注框和标注文字等

3. 浏览时支持修改数据图片的文件名称

数据分组

1. 支持数据集按用途分组为训练集、测试集,支持划分任意份数

2. 支持用户自定义抽取比例、或按照文件名称灵活自定义分组规则

3. 支持将图片加入或移出指定分组

数据搜索

支持用户依据“图片名称”对数据集中的图片进行模糊匹配搜索

数据集标注类型

支持2种不同OCR场景的标注类型:检测结构化

数据集标注作业台

标注工具支持:旋转矩形、旋转四点、矩形

支持自动标注检查提高人工标注质量,展示疑似错误标注

支持在标注工作台中查看图片文件名称,以及依据文件名称进行图片搜索定位

支持标注过程中对标注结果进行快捷查看,并可进行调整字体和字号方便标注

支持图片放大、快速修改标注文本、清空标注文本、标注框移动等快捷键操作

支持撤销标注动作,回退上一步

支持标注过程中倒置图像的自动旋正,且后续标注预览展示均按正向展示

智能标注

支持辅助标注,在用户自定义画框后:框的大小会自动优化吸附在文字边缘;会自动识别框中的文字内容

支持全图预标,一键预测该图片的标注结果,用户仅需进行点亮确认修正

应用中心

应用发布

新建应用

支持业务类型的应用发布:智能结构化(检测+识别+智能结构化)

应用评测

支持利用测试集对应用效果进行评测,输出评测报告和badcase分析报告,包含应用整体以及各字段的精确率和召回率指标等

指定模型微调训练

支持指定该应用的某个模型进行再次优化训练

应用导出

支持应用镜像的导出和下载;

部署后启动的在线服务支持传入图片的base64参数或url地址

配置后处理

支持通过脚本配置该应用的后处理逻辑

应用删除

支持删除应用

应用测试

发布快速测试服务

支持指定应用进行一键发布成在线服务(非正式部署的模型服务);支持发布状态的实时展示

调用快速测试服务

1. 支持直接上传单图测试,可视化返回预测结果

2. 支持上传批量的zip包或pdf文件进行测试,输出可下载的预测结果文件

在线测试服务删除

支持删除在线服务

模型中心

开始训练

训练任务类型

支持2种场景类型的训练任务:智能结构化、不同版式检测

新建训练任务

  1. 支持一键启动训练任务,只需指定任务类型、算法框架、预训练模型、训练集分组、GPU型号和卡数、配置epoch即可开始训练
  2. 平台须支持多卡训练

内置算法框架和预训练模型

支持用户直接选择内置的算法框架及预训练模型进行训练

支持OCR大模型训练

增量训练

预训练模型除可选择内置模型外,还支持用户选择已保存的自定义模型进行增量训练

高级参数配置

支持专业用户对高级参数BatchSize MaxLength等进行自定义配置

训练管理

训练过程监控

1. 支持对训练时长、训练进度、训练状态进行监控

2. 支持查看中间结果上报指标

3. 支持查看训练日志

4、支持训练集loss值和精度指标的查看

5、支持自定义配置训练集的验证间隔

训练溯源

支持对该训练任务使用的数据集、算法框架、预训练模型及参数等信息进行查看

训练模型保存

1、支持按照epoch保存中间模型

2、支持自定义设置训练模型自动保存间隔

训练模型评测

1. 支持自定义选择中间模型进行评测,支持多次及重新评测

2. 支持按照业务应用类型模拟端到端效果输出整体和字段级别的精确率/召回率评测指标

3. 支持输出badcase分析报告

4. 输出的结果框位置,需与图片上相应字段对应。

5.支持F1评测指标展示,同时支持所有指标对比展示

6.支持评测指标排序

训练任务管理

支持统一管理训练任务,可查看每个训练任务的耗时以及模型评测记录,支持按照训练状态筛选训练任务

管理中心

项目管理

新增项目

1. 支持新增/删除项目;

2. 支持按照项目维度进行资源配置,项目间资源隔离

项目管理

1. 支持查看平台已有项目;

2. 支持查看项目可用资源及总机器资源配额

成员管理

支持在该项目下新增、删除、查看成员

资源管理

全平台耗卡策略配置

支持对全平台耗卡策略配置;支持关停及启动策略;支持查看策略状态;支持查看每个策略资源消耗

机器节点详情

支持查看机器详情,可查看机器IP及机器卡数

查看平台运行中任务

支持查看正在占用GPU资源的任务列表,查看任务对应的消耗资源及剩余时间、进度;支持查看该任务关联的项目

查看平台排队中任务

支持查看排队等待GPU资源的任务列表,查看任务创建人和关联的项目

个人中心

个人中心

1. 支持查看个人信息,及密码重置;

2. 支持查看个人所属的项目及该项目对应的可用及总配额

操作日志

操作日志

1.支持展示操作时间、操作用户、IP地址等日志信息

2. 支持按照时间等关键字搜索平台日志

4.2

废标项

乙方须实现具体业务需求参见《中国邮政鸿雁大模型平台工程总体方案(节选)》。

4.3

评分项

详细描述以下各项功能以及实现方式与效果,提供具体功能设计方案及演示视频,演示视频应包含以下所有功能并按功能点顺序逐条说明,视频总时长不超过3分钟,格式为“.MP4”,演示视频以u盘形式随纸质版投标文件一同密封递交。

1、支持自定义选择后端模型进行智能标注。

2、若未勾选保存模型,支持自定义设置模型保存时间。

3、效果测试时,支持展示图片中相关字段的置信度(score值)。

4、智能预标模型优化:数据集导入后,用户可先进行小批量的数据试标,然后平台针对试标的数据进行智能分析,输出分析报告,包括推荐首次启动训练的图片数量、推荐必选key清单,利用试标的图片优化内置模型,提升模型在未标注图片的预标效果。

5、应支持智能辅助纠错,用户可在名词库中配置 key 字段对应可选的 value 值集合,平台自动根据配置信息进行纠错。

4.4

评分项

应保证OCR大模型微调训练平台及产出引擎服务支持部署时统一负载,使得产出引擎和接口服务集群能够实现热上线,而不影响正在提供的服务,并需支持容器化部署。此外除满足平滑升级需求外,还需支持各服务的灰度上线功能。

4.5

评分项

应提出系统上线期间的业务割接、过渡解决方案和应急预案。

4.6

评分项

应提供系统运行监控调用接口,可纳入甲方现有监控体系,可支持通过阈值设定进行主动式的应用软件故障预警、告警和故障场景快照,应按照甲方对本系统的通用应用监控需求和本系统的个性化监控需求,接入中国邮政应用系统运行监控管理平台,对本系统的运行状态等进行监控、告警等。

5.7

评分项

系统的处理应该满足多线程多用户的架构,系统应支持并发访问量100用户的使用需求。

5.8

评分项

系统产出引擎线上部署后,实际业务响应时间应不高于1s,业务功能处理成功率不低于99.99%。

5.9

评分项

乙方需在技术建议书中具体说明平台软件的技术指标、算法优势、第三方权威机构评价数据、授权许可数量、部署方式,如容器镜像、虚拟机、物理机部署、war包、动态库等。

5.10

评分项

OCR基座大模型能力指标应达到以下指标:

1)OCR基座大模型无样本训练的情况下,字段召回率不低于90%。

2)OCR基座大模型通过少于100张少样本训练后,字段召回率不低于93%。

3)在测试图像识别的字段数不超过10个,分辨率不高于400万像素的情况下,推理耗时不高于1s/张图像。

5.11

评分项

产出扁平信函识别引擎应达到以下指标:

1)扁平信函字段识别平均准确率达90%以上(字段平均准确率为正确识别的字段数/总字段数*100%)。

2)单台单卡T4 GPU服务器单笔处理时间小于1秒/笔,并发处理能力不低于3笔每秒。

3)扁平信函关键字段包括但不仅限于收件人地址、单位/机构(针对存在单独的单位/机构字段的情况)。

5.12

评分项

产出明信片识别引擎应达到以下指标:

1)明信片字段识别平均准确率达90%以上(字段平均准确率为正确识别的字段数/总字段数*100%)。

2)单台单卡T4 GPU服务器单笔处理时间小于1秒/笔,并发处理能力不低于3笔每秒。

3)明信片关键字段包括但不仅限于收件人地址、姓名、电话、邮编。

5.13

评分项

产出国际面单识别引擎应达到以下指标:

1)国际面单字段识别平均准确率达90%以上(字段平均准确率为正确识别的字段数/总字段数*100%)。

2)单台单卡T4 GPU服务器单笔处理时间小于1秒/笔,并发处理能力不低于3笔每秒。

3)国际面单(中文、英文、拼音)关键字段包括但不仅限于收件人地址。

5.14

评分项

乙方提供的应用软件,应支持适配国产化服务器、芯片(包括ARM和海光)、操作系统(包括支持麒麟和统信)、数据库等,支持部署在国产化环境中。并提供国产化数据库、国产化操作系统、国产化服务器兼容说明材料。

6.4

评分项

乙方提供的应用软件应部署在甲方提供的私有云环境上,并充分利用私有云组件实现系统架构。

6.5

评分项

系统应支持容器化集群部署,且支持可按租户定义的隔离机制,可根据租户设置引擎的路由策略,具备自动化弹性伸缩和负载均衡能力。乙方应在技术建议书中提出上述实现方案,尤其是应用软件的实现方式及所需环境。乙方应负责对应方案的制订、测试和在全国中心的实施。

11.1

废标项

乙方须保证甲方拥有乙方提供的第三方和自主版权产品的使用权、修改权。

11.2

废标项

乙方全面承担由乙方产品中涉及到的第三方产品所引起的一切法律和经济责任。

13.6

评分项

竣工验收后,乙方需免费提供1人年(每周5*8小时)的驻场支持服务。驻场人员要求从事所投产品建设或运维工作2年以上,对所投产品的使用和维护具有较为丰富的经验,能够胜任日常运维全部工作,能够处理日常故障,出现故障能够第一时间调动原厂商和集成商二线资源处理问题。能够按照甲方各项要求开展工作,遵守保密要求。服务内容如下:

(1)负责所投产品的日常维护和例行监控,并提供维护服务记录。

(2)快速解决由于设备或软件本身原因造成的故障和问题,并恢复业务;对于重大问题,直接升级到原厂专家,提升问题处理效率,并全程跟踪问题的处理进展,定期回顾。

(3)协助变更责任人制定平台变更实施方案,对变更实施方给予必要的指导和配合。

(4)每月输出所投产品运行报告,报告内容包括但不限于各环境服务运行情况、资源(CPU、内存、存储、网络等)使用情况等。

(5)协助甲方进行现有业务系统或新系统使用产品的方案制定以及实施等。

(6)由于所投产品本身产生的缺陷,乙方应尽快针对缺陷提供修复方案并完成缺陷修复及验证。

13.7

评分项

乙方应明确保证期结束之后对所提供的软件系统的服务支持方式和费用标准,包含运维形式(现场、远程)、运维工作内容和第一至第三年的运维报价(人员数量、单价、人员级别等),且应承诺后续甲方在选择乙方进行系统运维时,前三年的运维费用将不高于本次报价,且积极提供运维服务。

(三)团队核心成员资质业绩要求

  1.   (评分项)在项目实施的全过程中,乙方须指定专门项目经理,负责项目的实施管理。项目经理应具备至少8年(截止投标日期)以上项目管理经历,并近3年主持过不少于2项实施央企总部、国有商业银行总行、全国性股份制商业银行总行、邮政集团有限公司(含各省分公司)、地级市及以上行政单位,电信运营商(中国电信、中国移动、中国联通、中国广电、中信网络)同类项目的建设项目,提供项目经理智能引擎系统同类项目案例(提供项目经理简历、学历证明并加盖公章,包括参与同类项目案例的清单)。
  2.   (评分项)在质保期内如甲方需要,乙方应提供现场服务。并且在本项目实施过程中,甲方认为乙方项目经理无法有效组织项目成员完成该项目所要求的工作内容时,有权要求乙方更换项目经理,乙方有义务接受并更换。
  3.   (评分项)乙方项目团队中须至少有1人获得PMP或信息系统项目管理(高级)证书,须提供复印件,如甲方需要,可提供原件备查;乙方软件架构主要设计人员应具有系统集成项目管理师相关认证证书,5年以上软件设计开发经验,3年以上本项目相关领域经验。

二、公示起止时间

2025年8月8日至11日

三、公示受理渠道

项目公示受理邮箱:zhouchen@chinapost.com.cn

项目公示受理电话:010-58853812 / 15210146076

备注:如需提交详细反馈信息的,请填写附件1加盖公章后将扫描件发送公示受理邮箱。

附件1:公示存疑详细情况反馈表

中国邮政鸿雁大模型平台工程OCR大模型微调训练平台软件投标人相关资质采前公示存疑详细情况反馈表

厂商名称:

联系人:

联系人电话:

联系人邮箱:

详细情况描述:

 

 

 

日期

(此处应加盖公章)