English

高质量数据集是AI硬通货,科杰科技打通‘采、集、用’动脉

2026-04-16

近日,工业和信息化部启动工业数据筑基行动,提出到2026年底打造一批高质量、标准化、可流通的行业数据集,赋能大模型与工业智能体落地。这项政策将“高质量数据集”从技术概念推向了产业实践的前台,也引发了一个值得思考的问题:究竟怎样建设高质量数据集?

高质量数据集建设的关键,不在于建库本身,而在于数据能否被AI高效使用。这需要技术底座、工程化能力和产业协同三方面的支撑。

科杰科技作为AI数据基础设施领域的先行者,长期专注于Data&AI基础软件研发。核心产品KeenData Lakehouse以“AI-in-Lakehouse”为理念,融合存算分离、Data&AI一体化、智能数据治理能力,覆盖从数据集成到模型训练、推理的全链路。过去几年,这套技术底座已在能源、金融、零售、制造等多个行业落地。去年在苏州落成的高质量数据集项目,围绕数据治理标准化这一核心命题,系统完成了多源数据接入、清洗、标注、治理全流程,构建了面向AI训练的高质量行业数据集,并成功支撑了多个智能应用场景。该项目完整展现了高质量数据集从治理构建到AI应用的有效路径。

01
数据治理的标准化,是高质量数据集的第一道门槛

高质量数据集不是“存得越多越好”,而是“用得越准越值钱”。

许多企业误以为数据量大就是高质量,但真实产业场景中,数据必须经过治理,做到标准统一、可流通、可直接用于AI训练。科杰科技通过KeenData Lakehouse内置的数据资产管理、质量监控、元数据管理模块,帮助企业重构数据资源目录、统一数据标准、建立质量管控体系,使数据具备可被AI直接消费的能力,让每个业务的人都能精准找到自己要的AI数据,且数据可直接用于AI模型训练。

这才是高质量数据集的本意。

02
数据集的价值,最终要以业务结果来度量

工信部此次行动特别强调,高质量数据集要赋能行业大模型和工业智能体等应用落地。数据集的终极目标不是“存”,而是“用”——尤其是被AI用起来。如果数据集无法产生可量化的业务价值,则沦为成本。科杰科技坚持从业务KPI倒推数据治理目标,确保每个AI数据环节对准具体的业务场景。在金融领域,这意味着风控模型的实时拦截能力;在零售行业,意味着经营报表的决策响应速度。以业务结果为牵引,才能避免“为建库而建库”的误区。科杰科技的DataOps能力支持从数据采集到服务输出的全链路自动化,确保数据开发与业务需求同步对齐,这是AI数据治理与业务价值闭环的核心支撑。

03
工业“采、集、用”瓶颈的突破,需要工程化能力

高质量数据集建设不是一套标准软件能解决的问题,而是需要深入行业know-how、结合真实业务场景的工程化能力。

协议不兼容、实时接入困难、历史数据质量参差、安全流通机制缺失……这些在制造业中普遍存在的难题。科杰科技的KeenData Lakehouse支持多源异构数据的实时接入和批量处理,内置数据湖存储和湖仓一体引擎,能够同时处理结构化与非结构化数据;其智能调度和任务编排能力,可以应对复杂的工业数据流水线。经过多年服务工业客户的积累,科杰科技逐步沉淀了一套覆盖数据接入、治理、安全流通的方法论,并通过产品化的方式固化下来。工信部此次行动中提出的“突破工业数据‘采、集、用’瓶颈”,正是对这个行业痛点的精准回应。

04
产业链协同,是高质量数据集建设的必答题

高质量数据集建设,是一场需要“真功夫”的长期战役,要产业链多方协同。公共数据基础设施是其中不可或缺的一环。在政务先行先试示范区和城市数据集团等项目中,科杰科技完成了可信数据空间、数据安全防护等核心模块建设,打通了数据加工到模型评测的全链路,践行了“供得出、流得动、用得好、保安全”的AI数据要素流通模式。科杰科技是国家数据局首批可信数据空间方向标准/技术文件验证试点典型单位,在可信数据流通生态中持续贡献力量。同时,公司积极参与工业数据标准体系建设,与行业伙伴共同研制数据采集、数据集质量评估等关键标准。KeenData Lakehouse具备适配国产GPU芯片的能力,支持信创环境下的算力适配。

工信部工业数据筑基行动为行业画出了清晰的路线图。但真正决定产业高度的,不是政策文件,而是每一个真实场景里的实干。从苏州高质量数据集项目到覆盖20多个行业、服务近200家大型组织,科杰科技在高质量数据集建设领域已经积累了系统化的实践能力。作为AI数据基础设施提供商,科杰科技致力于与生态伙伴共同推动数据从“资源”走向“资产”,让人工智能真正成为新型工业化的核心驱动力。

  • 产品介绍
  • 业务咨询
  • 联系我们
  • 回到顶部

业务咨询(09:00-18:00)

010-64703560

技术支持

携手科杰科技,
构建AI-Native时代 Data & AI 一体化平台

×
提交问题

感谢咨询,我们会在1个工作日内联系您

×