高端数据标注基地

简介

围绕“高技术含量、高人才素质、高质量把控、高行业价值”四个目标,立足海淀、面向全国,打造全国首个高端数据标注示范基地,为智能驾驶、生物医药、医学影像、教育教学等领域开发高质量数据集提供数据标注平台、工具与服务,助力海淀全面构建数据产业生态体系,推动数据要素市场化配置改革和人工智能产业高地建设。

简介

东升科技园三期东畔科创中心(海淀区数据要素产业园),规划面积3100平方米,分为数据标注区、产教融合实训区、生态服务展示区。建设周期一年。

简介

计划部署4套数据标注平台,分别为商业数据标注平台、政务数据标注平台、生态数据标注平台、产教融合实训平台,配套建设云基础与云安全防护体系,打造“一平台+三中心”能力服务体系。

简介

数据标注平台是基于大模型、垂类模型和策略三位一体的智能引擎,可实现全方位的标注任务自动化,帮助业务提效。核心技术包括: 自动化标注(利用机器学习和人工智能技术) 多模态标注(对多种数据模态进行混合标注,如文本、图像、视频、音频等) 大模型标注(具备大模型预训练、继续训练、SFT、RM等全流程标注能力) 机器辅助(支持高性能AI算法运行自动标注算法的准确率高于95%)

高质量数据集

交通数据集

自动驾驶数据集

视频数据集

教育数据集

医疗数据集

数据要素产业生态示范区展厅

数据申请表单