文档包含正文,附件:数据采集实施方案、数据清洗与处理详细规范、数据标注规范、数据存储与安全保障措施、培训及技术支持、验收标准及流程。
AI模型训练数据管理协议
一、约定方基本信息
1.签署方:本协议为甲方和乙方应请的合同。
o甲方:公司名称、注册地址、签署方法人、联系电话:95022435,网
站:www.wengaogao.com,邮箱:mail@wengaogao.com。
o乙方:公司名称、注册地址、签署方法人、联系电话:95022435,网
站:www.wengaogao.com,邮箱:mail@wengaogao.com。
2.协议主题:甲方委托乙方进行AI模型训练中所需数据的采集、清洗、标注
与数据管理服务。
3.协议有效期:本协议自签订之日起至所有义务履行完毕止,有效期为2
年,如需延长需双方协商一致并签署补充协议。
4.协议修改与补充:任何对本协议的修改与补充均需双方书面签字盖章确
认,未经正式签署的修改条款不具有法律效力。
二、数据类型及范围
1.数据类型及范围:甲方需求采集的数据包括但不限于新闻文章、企业报
告、社交网络信息等符合国家法律法规规定的内容。文本数据及图像数据应
按照甲方提供的标准进行采集、编码与标注,以满足AI模型训练的具体需
求。
2.数据合法性及合规性:乙方在采集数据过程中应确保所有数据的合法性,
需从合法授权的数据源获取数据,避免侵犯第三方知识产权及违反国家法律
的行为。所有数据来源需具有相关授权文件。
3.数据清洗:乙方在数据清洗过程中需确保数据不包含重复记录、不完整或
损坏的记录以及不符合甲方需求的内容。清洗过程需严格执行甲方提供的标
准,所有处理步骤需详实记录,以确保清洗的可追溯性及准确性。
4.数据标注:标注工作需严格按照甲方提供的分级标准和标签系统执行,需
明确每个数据类别的定义与使用标准,确保标注的准确性达到至少95%。标
注过程需有完整记录,确保所有操作可追溯,并能提供必要的复核依据。
三、任务审核与接收标准
1.数据采集审核标准:甲方要求乙方使用符合国家标准的设备进行数据采
集,所有采集内容需经甲方验收确认。采集的每个步骤均需由具备资格的人
员完成,并提供采集过程的详细记录,包括采集设备类型、数据采集方法、
采集人员及时间等信息。
2.数据清洗及验证:乙方在完成数据清洗后,需向甲方提交详细的清洗报
告。报告内容包括数据量变化情况、异常数据处理的详细过程、数据保留及
剔除标准、清洗工具及技术使用等。甲方收到报告后应在5个工作日内进行
审核,如审核未通过,乙方需在3个工作日内完成重新清洗及整改。