数据准备供应商非常有效地共享研究,突出了获取数据准备好供组织使用的昂贵性质:确定正确的来源;清洗和验证数据;测试语境和相关性;创建适当的集成。业务和技术团队可以更好地了解为什么数据集成和数据准备很重要,以及为什么必须做得好。这些并不是微不足道的工作,需要复杂的技术来生产许多商业活动所需的可用数据集。
如今,已经出现了大量的数据准备技术,以帮助将更多的业务人员连接到分析和数据集成所需的数据,从而大大减少生成数据所需的准备时间。数据集成和数据准备确实具有相互交织在一起的命运,因为它们的目标应该是可靠的业务就绪的数据。数据准备依赖于数据质量过程,这些过程已经是数据集成的非常重要的一部分,如同数据沿袭一样。
看起来数据准备解决方案正在创建下一级别的工具,通过利用机器学习等新技术的应用程序,更快速地实现可靠的数据。数据预处理产品包括集中的机器学习/算法功能,实现自动化更多的数据测试和质量,以及数据集成方法。
显然,数据准备的核心方面是通过SaaS/云平台的自助服务。这些自助服务产品背后的供应商显然有兴趣扩展业务和技术角色的多样性,可以利用数据准备平台。现在,主要用户是技术熟练的数据集成专家和技术精通的业务分析师。但是,各种供应商正在努力包括低技术的LOB业务角色,以及LOB开发人员。这些供应商似乎理解不同的用户角色需要不同的用户界面,功能,指导和治理以及数据访问。