新黄河记者从山东省国资委了解到,近期,我国信息通讯研究院人工智能研究所联合清华大学核算社会科学与国家管理实验室、我国人工智能工业开展联盟数据委员会发布《人工智能高质量数据集建造攻略》(以下简称《攻略》),旨在为业界建造高质量数据集供给有实操价值的辅导和参阅。浪潮卓数大数据作为重要参编单位,深度参加《攻略》编撰,为推进人工智能数据基础设施建造贡献了厚实的实践经验和数智力气。
《攻略》系统梳理了高质量数据集建造的布景,清晰了高质量数据集的界说、特征、分类、建造主体以及“三大建造难点”,提出了人工智能数据工程的“五大中心要素”和企业建造高质量数据集“三步走”战略,剖析了高质量数据集建造的中心技能,展现了各范畴高质量数据集建造实践,并对未来高质量数据集建造的趋势做了展望,为业界推进高质量数据集建造供给有力支撑。
作为国内抢先的大数据服务运营商,浪潮卓数大数据以“DATA+AI”双才能建造为主线,聚集数据价值开释与AI才能出产,立异推出“模数工坊”产品系统,以数据车间、练习车间、模型车间和智能体车间四大功能模块,推进职业数据集建造与职业智能体使用的规模化、模块化、智能化出产。其间,数据车间作为数据“出产中心”,可完成数据收集、清洗、标示与质检全流程作业,输出可追溯的高质量数据集。一起,浪潮卓数大数据自主研制高质量数据集服务渠道,面向AI企业、科研机构及数据工业链上下游供给数据集市、东西链、供需对接等服务于一体的归纳才能,继续推进高质量数据集高效供给与工业使用深度协同。
根据海量数据资源优势与抢先的技能才能,现在浪潮卓数大数据已构建掩盖全国3.7亿市场主体的企业征信数据集和掩盖全网150+电子商务渠道的电商经济数据集,不仅为AI模型的练习与优化供给了坚实“养料”,更经过场景化使用推进金融、商务职业的数智化转型。下一步,浪潮卓数大数据将继续活跃做出呼应国家方针召唤,深化数据要素市场化实践,为构建合规高效、敞开协同的人工智能数据生态继续输出“浪潮”才智。