一、大数据与大数据平台的关系
大数据一词代表了概念、特性、功能和能力,而平台则不然,平台需要体现以一种以服务为主导的支撑模式。
纵观大数据十年发展,从单一细粒度的技术突破到复杂业务形态的成熟运用,有些企业聚焦于数据收集和预处理,有些聚焦于大数据处理和分析,还有些聚焦于数据可视化领域。
为此,大数据绝不是仅提供某种属性的知识沉淀,而是将自身产品打造成为一个能被社会认可的平台级产品,后续的服务和运营才是这场游戏的开始。
二、大数据平台如何提升到企业级能力支撑
作为一个标准的大数据平台,系统应具备数据采集抽取、数据预处理转换、数据存储和分析等诸多能力,但正如上文所述,整个层次结构应该是层级递进的、环环相扣的,因此这个平台并非形同虚设,它应该具备以客户视角俯瞰自身企业经营的能力。大数据平台的这种能力是可拉伸的——小型初创公司的规模小、人员少且能力有限,他们的平台级产品可能只是应对并解决某个单一的简单问题;大型企业结构复杂、人员部门多、开展的业务形态复杂多样。所以,大数据平台的整体能力输出才是重点,因此这中平台一定是企业级的、规模化的。
三、什么是竞争门槛
作为竞争门槛,一定有三种特点值得我们总结。
1、做与众不同的产品,在某一方面用另一种思维去解决客户痛点,换个视角看问题,难点自然迎刃而解;
2、技术方面勇于创新、开拓完善,就算是开源技术的“拿来主义”,也仍然需要不断测试、优化、迭代和完善;
3、成为某一领域的行业佼佼者,永远冲锋在行业前锋,任何情况下与绝不姑息和妥协市场地位;
所以,作为当今最盛行的企业级大数据平台,提高竞争门槛才是硬道理。
第一个技术门槛就是跨行业数据云模型。
你可能听说过数据模型,是的。数据模型(data model)是数据特征的抽象。数据(data)是描述事物的符号记录,模型(model)是现实世界的抽象。数据模型从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表示与操作提供了一个抽象的框架。简单的理解:数据模型就是为了支撑某一领域的业务问题,在数据库表达层面预先定义好后续能支持的访问模式。但现实社会中每种行业特点不同,有零售业、制造业、电信业、金融业、保险业、互联网业等等,对于某一领域的业务支撑和应用访问,底层的数据结构和表的设计一定是差异化的,固然数据模型各有千秋。但如果能结合多种行业特点,构建起一个能支撑不同行业特点的数据模型,这就叫做跨行业数据云模型。况且在今天这个时代,很少有企业秉承单一行业特点去“一根筋“经营(比如某手机制造行业并不靠卖手机赚钱,但却靠”养粉”和后续广告获取收益和盈利),类似这种形式企业就必须懂得混业经营。依托数据模型的构建理论,基于大数据处理和分析能力,形成行业内的数据模型,便于后期数据运营。所以为了支持大型企业的混业经营,如果在底层支持跨行业数据云模型,那么这样的平台产品就是有门槛的。
第二个技术门槛就是数据开放和共享。
大数据发展的前五年,家家都在搞理论、搞培训、搞硬件、搞平台,先不说能力是否施展的开,就单拿知识输出来讲就一直处于“闭塞”状态。因为那会这些企业并没有搞清楚大数据平台未来朝什么方向演进。伴随着时间的演进才逐渐清晰数据能力开放和资源共享的重要性,所以后来这五年才有paas统一开放平台、多租户开发管理平台等,而且这个领域的能力加强和功能完善才是拼搏的砝码。将数据通过api、文件等方式开放给外部系统或其他行业,实现数据交换和开放共享,这也是平台产品的竞争门槛。
第三个技术门槛就是数据管控平台。
当企业数据规模达到一定量级,数据管理者面临着维护压力、数据使用者面临着访问压力,海量数据资源的管理成为了一个重大问题。元数据如何管理?数据质量如何管理?数据安全如何保障……这些问题的暴露逐渐让企业数据管理者更加注重数据治理的重要性。将数据处理与数据规范有机结合,以元数据为驱动形成数据资产治理、规划、运营、监控等能力,从而提高企业大数据平台的竞争门槛。
欢迎关注我的头条id:分析世界讲方案