大数据行业价值分析,看这篇就够了

千际投行2021-04-27 10:10

第一章 行业概况

大数据行业指提供大数据技术服务的行业。大数据是超过传统数据库系统处理能力的数据。需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据(Big Data),IT行业术语,是指无法在一定时间内用常规软件工具对其内容进行抓取、关联和处理的大量而复杂的数据集合。大数据具有5V特性:Volume数据规模大,Variety数据类型多,Value价值密度低,Velocity数据流转快,Veracity数据真实。从2011年至今,大数据概念势头依然不减。从人都在讲概念,到商业化应用典型案例出现,可以清晰地看到大数据在逐步落地。

图 大数据产业链结构

资料来源:同花顺iFind 资产信息网 千际投行

1.1 大数据结构

▷ 结构化数据:即固定格式和有限长度的数据。也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。

▷ 非结构化数据:数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML, HTML、各类报表、图像和音频/视频信息等等。

▷ 半结构数据:在做一个信息系统设计时肯定会涉及到数据的存储,一般我们都会将系统信息保存在某个指定的关系数据库中。我们会将数据按业务分类,并设计相应的表,然后将对应的信息保存到相应的表中。

图 大数据结构

资料来源:资产信息网 千际投行

1.2 大数据的三个层面

第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。

第二层面是技术,技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。

第三层面是实践,实践是大数据的最终价值体现。在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。

图 大数据的三个层面

资料来源:资产信息网 千际投行

1.3 大数据的三大特征

第一个特征是数据类型繁多。包括网络日志、音频、视频、图片、地理位置信息等等多类型的数据对数据的处理能力提出了更高的要求。

第二个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。

第三个特征是处理速度快、时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。

1.4 大数据5V特点

(1) Volume大量:数据的采集,计算,存储量都非常的庞大。

(2) Variety 多样:种类和来源多样化。种类有结构化、半结构化和非结构化数据等,常见的来源有网络日志、音频、视频、图片等等。

(3) Value 价值:数据价值密度相对较低,犹如浪里淘金,百炼成钢般才能获取到大量信息中的部分有价值的信息。

(4) Velocity 高速:数据增长速度快,处理速度也快,获取数据的速度也要快。

(5) Veracity 真实:数据的准确性和可信赖度,即数据的质量。

图 5V特点

资料来源:资产信息网 千际投行 公开资料整理

图 大数据产业链数据价值实现流程

资料来源:资产信息网 千际投行

2016年大数据上升为我国国家战略,十三五规划纲要全文第二十七章明确提出“实施国家大数据战略”,彰显了国家对于大数据战略的重视。在国家政策的推动下,我国大数据行业市场规模高速增长。根据信通院报告,2016年中国大数据市场规模约为168亿人民币。我国大数据领域专利申请数量自2010年以来飞速增长。2013年即达到2010年的十倍多。2016年,专利申请数量达到634件。大数据产业商用价值仍未完整展现,市场前景一片广阔。

第二章 商业模式和技术发展

2.1 产业链价值链商业模式

2.1.1 大数据产业链

图 大数据产业链

资料来源:资产信息网 千际投行

大数据产业链可以从数据源、大数据产品、大数据服务应用这三大块来讲。目前,我国的数据来源包括政府部门、企业数据采集及供应商、互联网数据采集及供应商、数据流通平台等。而大数据产品包括大数据平台、云储存、数据安全等基础软件产品;加工分析、解决方案等软件产品;大数据采集、接入、存储、传输等硬件设备产品。大数据服务方面,主要为应用服务、分析服务、基础设施服务等供应商。

产业链上游分析

图 数据安全与基础设备

资料来源:Wind 资产信息网 千际投行

(1) 数据标准与规范

大数据标准体系是开展大数据应用的前提条件,没有统一的标准体系,数据共享、分析、挖掘、决策支持将无从谈起。大数据标准包括体系结构标准、数据格式与表示标准、组织管理标准、安全标准和评测标准。在标准化建设方面,参与单位主要包括中国电子技术标准化研究院、各个数据库公司、数据拥有部门以及各个行业的标准化组织。

(2) 数据安全

随着海量数据的不断增加,对数据存储和访问的安全性要求越来越高,从而对数据的访问控制技术、加密保护技术以及多副本与容灾机制等提出了更高的要求。另外,由于大数据处理主要采用分布式计算方法,这必然面临着数据传输、信息交互等环节,如何在这些环节中保护数据价值不泄露、信息不丢失,保护所有站点的安全是大数据发展面对的重大挑战。在大数据时代,传统的隐私数据内涵与外延有了巨大突破和延伸,数据的多元化与彼此的关联性进一步发展,使得对单一数据的隐私保护方法变得极其脆弱,需要针对多元数据融合的安全提出。在数据安全环节上主要参与单位包括中国电子科技集团公司第30研究所以及奇虎360、瑞星等杀毒软件公司

产业链中游分析

图 数据采集、存储与分析

资料来源:Wind 资产信息网 千际投行

(1) 数据采集

政府部门、以BAT为代表的互联网企业、运营商是当前大数据的主要拥有者。除此之外,利用网络爬虫或网站公开API等途径对网络数据进行采集也是大数据的主要来源。现实世界中的数据大多不完整或不一致,无法直接进行数据挖掘或挖掘结果不理想,需要对采集的数据进行填补、平滑、合并、规格化、检查一致性等数据预处理操作,并且往往需要大量的人工参与,因此数据采集和清洗成为大数据产业链的一个重要环节。

(2) 数据存储与管理

大数据存储与管理的主要参与者以传统数据库企业为主,国际上主要有IBM、Oracle、Intel、Green-plum、Informatica Cloudera等;国内主要有中兴、华为、用友、浪潮、托尔思、数据堂、九次方、亿赞普、达梦等。各家企业针对大数据应用开展各具特色的数据库架构和数据组织管理研究,形成针对具体领域的产品。

(3) 数据分析与挖掘

大数据分析与挖掘的意图主要集中在两方面:一是从大量的机构结构化和半结构化数据中分析出计算机可以理解的语义信息或知识,二是对隐性的知识,如关联情况、意图等进行挖掘。常用的方法包括分类、聚类、关联规则挖掘、序列模式挖掘、时间序列分析预测等。数据分析与挖掘的核心算法与软件主要掌握在大型数据库公司及高校的手里,国际上主要参与者包括IBM、甲骨文、微软、谷歌、亚马逊、Facebook等,国内主要参与单位包括数据库企业、高校、以BAT为代表的大型互联网企业等。数据分析与挖掘的能力直接决定了大数据的应用推广程度和范围,是大数据产业的核心。

产业链下游分析

图 数据运维与数据应用

资料来源:Wind 资产信息网 千际投行

(1) 数据运维

由于数据的重要性得到普遍认可,除政府部门不具备数据运维服务条件外,数据的采集者通常就是数据运维者。各地政府方面则通常利用大数据平台建设来推动政府大数据的公开与共享,如云上贵州,吸引个人和企业用户开展创新与创业,积极推动大数据的增值服务。

(2) 数据应用

大数据对传统信息技术带来革命性挑战,正在重构信息技术体系和产业格局。国内以阿里巴巴、百度、腾讯、人大金仓、浪潮、曙光、南大通用为代表的互联网企业、云计算和数据库厂商纷纷加大应用推广力度,在国际先进的开源大数据技术基础上,形成独自的大数据平台构建和应用服务解决方案,以支撑不同行业不同领域的专业化应用。虽然这些企业在平台构建上有着得天独厚的优势,但是在某些具体业务领域,并不擅长或者关切。传统企业以及从事大数据的微型企业是具体业务领域上大数据应用的主力军。应用是大数据价值的体现,是大数据发展的原始推动力。当前大数据的应用正倒逼软件技术、数据架构、数据共享方式的转变,在转变思维过程中需要积极转变思维,明确出数据共享的方式是什么,数据拥有者的利益如何平衡,商业模式如何开展等等。

2.1.2商业模式

随着大数据炒作期的结束,国内外大量企业开始投入大数据实战,大数据生态产业链逐渐形成。整体而言,全球的大数据应用处于发展初期,中国大数据应用才刚刚起步。目前,大数据应用在各行各业的发展呈现“阶梯式”格局:互联网行业是大数据应用的领跑者,金融、零售、电信、公共管理、医疗卫生等领域积极尝试大数据。现阶段制约大数据发展的因素有三方面,分别是数据、技术和应用。

大数据产业链的参与者主要包括:数据提供商、分析技术提供商、基础设施提供商、业务应用提供商。

图 大数据产业链构架

资料来源:资产信息网 千际投行

目前,在大数据产业链上有三种大数据公司:

▷ 基于数据本身的公司(数据拥有者)︰拥有数据,不具有数据分析的能力

▷ 基于技术的公司(技术提供者)︰技术供应商或者数据分析公司等;

▷ 基于思维的公司(服务提供者)︰挖掘数据价值的大数据应用公司。

"数据拥有者”的商业模式

数据拥有者,这样的公司有三类:

(1) 大数据是业务核心,对大数据的重复利用是其发展的原动力。例如Google、Amazon、Inrix等。这种公司具有很强大的大数据技术能力,多数时候大数据技术本身主要用于自身的运作,具有三种产业链角色:数据(+技术)+服务。

(2) 大数据是作为提高生产效率、增加业务收入或者创造新的收入的使能器,非厂商的主流业务。例如运营商、银行等,运营商的主要业务是通过通信设备提供的各种网络语音和数据业务,目前运营商本身并不通过数据的重复利用为主要手段来盈利。

(3) 数据中间商,本身不具有创造数据的能力,从各种地方搜集数据进行整合,然后再提取有用的信息进行利用。

图 数据拥有者及基础设施提供

资料来源:资产信息网 千际投行

它们的商业模式有:

(1) 面向企业或者公共政府部门,提供数据分析结果的服务。Inrix在交通信息领域,面向GPS生产商、和交通规划部门、FedEX和UPS等物流公司等,出售完整的当前甚至未来的交通状况的模式图或者数据库。

(2) 面向个人,提供基于数据分析结果的服务。Inrix提供一个免费的智能手机应用程序,一方面它可以为用户提供免费的交通信息,另一方面它自己就得到了同步的数据。

(3) 租售数据/信息模式(数据资产分享和交易平台),新的商业模式,把数据/信息作为资产直接进行销售。Twitter把它的数据都通过两个独立的公司授权给别人使用;VISA和MasterCard收集和分析了来自210个国家的15亿信用卡用户的650亿条交易记录,用来预测商业发展和客户的消费趋势。然后,它把这些分析结果卖给其他公司。

“技术提供者”的商业模式

技术提供者的商业模式是目前的主流,有4种类型:

(1) 提供单点技术,pure-play为主。Teradata为沃尔玛和Pop-Tarts这两个零售商提供大数据分析技术,来获得营销点子。

(2) 提供整体解决方案,IT厂商为主。IBM提供软硬一体的大数据解决方案;华为基于IT基础设施领域在存储和计算的优势,提供整体大数据解决方案。

(3) 大数据空间出租模式:大数据计算基础设施上(与云结合),通过出租一个虚拟空间,从简单的文件存储,逐步扩展到数据聚合平台。腾讯开放云战略为大数据创业者提供了廉价的数据基础设施,使中小企业也有机会在大数据领域创新业务。

(4) Bigdata as a Service,新的商业模式,提供E2E在线大数据技术或者解决方案。

技术提供者的商业模式,目前较少,与cloud结合后有很大的空间,未来是趋势。

图 分析技术提供商

资料来源: 资产信息网 千际投行

“服务提供者”的商业模式

服务提供者有两种:

(1) 应用服务提供者,基于大数据技术,对外提供服务。面向企业或者公共政府部门,提供数据分析结果的服务;面向个人,提供基于数据分析的服务。

(2) 咨询服务提供者,提供技术服务支持、技术(方法、商业等)咨询,或者为企业提供类似数据科学家的咨询服务;定位在某一具体行业,通过大量数据支持,对数据进行挖掘分析后预测相关主体的行为,以开展业务;利用数据挖掘技术帮助客户开拓精准营销或者新业务,有时企业收入来自于客户增值部分的分成。

图 汽车电子基础设施建设及相关厂商

资料来源:资产信息网 千际投行

2.2 技术发展

对大数据行业的各个专利申请人的专利数量进行统计,排名前十的大数据行业公司依次为:烽火通信、航天信息、广电运通、网宿科技、泰豪科技、奇安信、思特奇、易事特、三六零、亨通光电等。

表 国内专利排名前十大数据行业公司

资料来源:Wind 资产信息网 千际投行

图 大数据技术框架

资料来源:资产信息网 千际投行

(1) 云技术

大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理框架来向数十、数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。

图 大数据与云计算

资料来源:资产信息网 千际投行

(2) 存储技术

大数据可以抽象的分为大数据存储和大数据分析,这两者的关系是:大数据存储的目的是支撑大数据分析。到目前为止,还是两种截然不同的计算机技术领域:大数据存储致力于研发可以扩展至PB甚至EB级别的数据存储平台;大数据分析关注在最短时间内处理大量不同类型的数据集。

(3) 分布式处理技术

分布式处理系统可以将不同地点的或具有不同功能的或拥有不同数据的多台计算机用通信网络连接起来,在控制系统的统一管理控制下,协调地完成信息处理任务—这就是分布式处理系统的定义。

图 淘宝的海量数据产品技术架构

资料来源:资产信息网 千际投行

(4) 感知技术

大数据的采集和感知技术的发展是紧密联系的。以传感器技术,指纹识别技术,RFID技术,坐标定位技术等为基础的感知能力提升同样是物联网发展的基石。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,都会产生海量的数据信息。

(5) 数据湖

数据湖是个庞大的数据存储库,从不同来源收集数据,并以自然状态存储起来。切莫与数据仓库混为一谈,数据仓库基本上执行同样的功能,但不像数据湖那样以自然状态存储数据,而是对数据明确结构以便存储起来。

(6) Hadoop生态系统

Apache Hadoop这种开源框架用于大数据集的分布式处理。它已发展得很庞大,足以容纳相关软件的整个生态系统,许多商业大数据解决方案基于Hadoop。

(7) Apache Spark

Apache Spark是一种用于在Hadoop中处理大量数据的引擎,比Hadoop的标准引擎MapReduce快100倍。人们对这项技术的兴趣正变得越来越浓厚。

2.3 政策监管

大数据的移动互联网综合服务提供商,主要利用大数据能力提供面向移动应用开发者的技术服务、面向广告主的移动互联网营销服务,以及面向其他垂直领域客户的数据服务,属于移动互联网大数据行业中垂直化应用的细分领域。

行业主管部门和行业监管体制

大数据垂直化应用行业的主管部门为工业和信息化部,其他监管部门根据大数据的最终应用行业的不同而有所区别。具体来说,移动应用开发者服务等互联网相关服务主要受工业和信息化部的监管,而移动互联网营销服务除工业和信息化部外,还受国家工商总局和各地方的工商行政管理部门等广告行业主管部门的约束。

(1) 工业和信息化部

工业和信息化部以及各省、自治区、直辖市设立的通信管理局是互联网信息服务行业的行政主管部门。其中:工业和信息化部主要负责制订互联网信息服务行业的产业政策、产业标准、产业规划,对行业的发展进行宏观调控,总体把握互联网信息服务内容;各地通信管理局对互联网信息服务业务实施政府监督管理职能。

(2) 国家工商总局

国家工商总局和各地方的工商行政管理部门是广告行业的主要管理部门。国家工商总局是国务院管理广告行业的直属机构,其责任是引导广告行业发展,进行广告活动的监管工作。国家工商总局里设置广告监督司,其主要职责是“订立广告业发展规划与政策措施并组织实施、订立广告行业监督管理的具体办法、措施;组织监督管理广告活动;监管各类媒介广告发布情况;查处虚假或违法广告;指导广告审查机构工作和广告业组织的工作;深入开展广告专项整治,维护公平竞争的市场环境;促进广告业健康、协调、可持续发展”。县级以上工商行政管理部门负责辖区内的广告发布活动和广告经营活动的监督管理工作。

另外,中国广告协会、中国商务广告协会、中国商务广告协会综合代理专业委员会是主要的广告行业自律组织。

图 相关政策

资料来源:资产信息网 千际投行

第三章 行业估值、定价机制和全球龙头企业

3.1 行业综合财务分析和估值方法

图 综合财务分析

资料来源:资产信息网 千际投行

图 行业估值和市场比较

资料来源:资产信息网 千际投行

图 指数PE/PB

资料来源:资产信息网 千际投行

图 指数市场表现

资料来源:资产信息网 千际投行

大数据行业估值方法可以选择市盈率估值法、PEG估值法、市净率估值法、市现率、P/S市销率估值法、EV/Sales市售率估值法、RNAV重估净资产估值法、EV/EBITDA估值法、DDM估值法、DCF现金流折现估值法、NAV净资产价值估值法等。

表 腾讯控股为例分析主营结构

资料来源:资产信息网 千际投行

表 以谷歌为例分析主营结构

资料来源:资产信息网 千际投行

表 境外汽车电子领域公司估值对比

资料来源:资产信息网 千际投行

表 中国上市汽车电子概念公司估值对比

资料来源:资产信息网 千际投行

3.2 行业发展和驱动机制及风险管理

3.2.1 行业发展和驱动因子

自互联网的诞生以来,数据就一直以惊人的速度增长。门户网站﹑搜索引擎﹑购物网站﹑社交软件使得数据不断的膨胀。智能移动端的流行让数据如虎添翼,智能手机每天都在收集用户的信息,比如位置﹑运动轨迹﹑生活信息等数据。以及5G时代推动着物联网进一步革新,而物联网又要依赖于各种传感器,传感器收集的数据会以爆炸式的方式增长。

大数据行业发展历程

从文明之初的“结绳记事”,到文字发明后的“文以载道”,再到近现代科学的“数据建模”,数据一直伴随着人类社会的发展变迁,承载了人类基于数据和信息认识世界的努力和取得的巨大进步。然而,直到以电子计算机为代表的现代信息技术出现后,为数据处理提供了自动的方法和手段,人类掌握数据、处理数据的能力才实现了质的跃升。信息技术及其在经济社会发展方方面面的应用(即信息化),推动数据(信息)成为继物质、能源之后的又一种重要战略资源。

图 国内大数据产业发展阶段

资料来源:资产信息网 千际投行

“大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域。2007年,数据库领域的先驱人物吉姆·格雷(Jim Mashey)在一个国际会议报告中指出:随着数据量的快速增长,必将出现数据难理解、难获取、难处理和难组织等四个难题,并用“Big Data大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域。

图 大数据时代与传统时代数据处理流程对比

资料来源:资产信息网 千际投行

大数据于2012、2013年达到其宣传高潮,2014年后概念体系逐渐成形,对其认知亦趋于理性。大数据相关技术、产品、应用和标准不断发展,逐渐形成了包括数据资源与API、开源平台与工具、数据基础设施、数据分析、数据应用等板块构成的大数据生态系统,并持续发展和不断完善,其发展热点呈现了从技术向应用、再向治理的逐渐迁移。

图 大数据企业服务范围区域分布

资料来源:资产信息网 千际投行

政府部门、BAT为代表的互联网企业、运营商是当前中国大数据的主要拥有者。除此之外,利用网络爬虫或公开应用程序接口API等途径对网络数据进行采集也是一大重要来源。在大数据时代,拥有数据就拥有了核心资源。工业时代,石油是最大的巨头,数据时代,BAT等因为拥有最多、最全的搜索、电商和社交数据,也成为绝对的王者。

图 国内大数据行业申请专利数

资料来源:资产信息网 千际投行

驱动因素

(1) 数字化社会的来临

大数据主要是消费者驱动和消费者导向。世界上大多数数据都是由消费者产生的,他们现在都是“永远在在线”。大多数人现在每天花费4到6个小时,并利用各种设备和(社交)应用软件产生数据。每次点击,滑动或发消息,都会在世界各地的数据库中产生新的数据。一些研究估计,60%的数据是在过去两年内产生的,这很好地表明了数字化社会发生的速度。

图 数字化转型四阶段

资料来源:资产信息网 千际投行

(2) 技术成本直线下降

与收集和处理大量不同(各种各类)数据相关的技术变得越来越便宜。数据存储和处理器的成本不断下降,使小型企业和个人能够参与大数据的各种分析与解析活动。对于储存设备的容量,经常引用的摩尔定律仍然认为储存密度(因此容量)是每两年翻一番。大数据可以让人类承受且应用的第二个关键因素是开源大数据软件框架的开发。最流行的软件框架(现在几乎被认为是大数据的标准)是用于分布式储存和处理的Apache Hadoop。由于这些软件框架在开源中具有高可用性,因此在组织中启动大数据的工作变得越来越便宜。

(3) 经过云计算实现连接

云计算环境(数据远程储存在分布式储存系统中)使得快速扩展或缩小IT基础架构并促进按需付费模式成为可能。这意味着想要处理大量数据(因此具有大量储存和处理要求)的组织不必投资大量IT基础架构。相反,他们可以许可他们所需的存储和处理能力,只需支付他们实际使用的金额。因此,大多数大数据解决方案利用云计算为企业提供解决方案变为了可能。

图 大数据和云计算﹑人工智能的关系

资料来源:资产信息网 千际投行

(4) 增加对数据科学的了解

在过去的十年中,数据科学和数据科学家这个名词已经变得非常流行。2012年10月,“哈佛商业评论”称数据科学家为“21世纪最性感的工作”,其他许多出版物近年来都在这个新的工作岗位上描述了许多,也助推了对数据科学家(以及类似职位)需求的增加,许多人积极参与数据科学领域。因此,关于数据科学的知识和教育已经非常专业化,并且每天都有更多的信息可用。虽然统计和数据分析以前大多仍然是一个学术领域,但它很快成为学生和社会人士的一项热门话题。

(5) 社交媒体应用

每个人都了解社交媒体对日常生活的影响。然而,在大数据研究中,社交媒体起着至关重要的作用。这不仅是因为每天通过Twitter,Facebook,LinkedIn和Instagram等平台产生的大量数据,还因为社交媒体提供了关于社交媒体数据可用于识别客户对产品开发的偏好,针对未来购买的新客户,甚至针对选举中的潜在选民。社交媒体数据甚至可能被认为是大数据最重要的业务驱动因素之一。

(6) 物联网(IoT )

物联网(IOT)是实体的设备,如车辆,家用电器和其他嵌入有电子设备,软件,传感器,执行器等连接物所构成的网络,使这些物体能够连接和交换数据。随着消费品供货商开始在家用电器中加入“智慧”传感器,它越来越受欢迎。这些对准连接之后,所需要处理的数据,将会更可观,也是这些对象联机价值发掘的根本之处。

3.2.2 行业风险分析和风险管理

(1) 宏观经济波动风险

当前国内、外宏观环境存在较多不确定性,全球疫情蔓延、中美贸易摩擦等。宏观环境的不利因素将可能使得全球经济增速放缓,居民收入、购买力及消费意愿将受到影响。若宏观环境的不确定性长时间无法得到有效控制,则相关影响将给行业带来一定冲击和挑战。

(2) 技术成熟性风险

目前大数据行业仍处发展初期,存在产品成熟性和稳定性方面的风险。而且大数据建设商用时间还较短,还未接受过大流量、大连接、高可靠、低时延的充分考验。

(3) 管理风险

大数据行业近年来处于高速发展阶段,不断在电子、通信等领域进行业务拓展,体系内经营主体较多且相对分散,加之中美贸易摩擦与全球疫情的冲击,客户对公司产能布局国际化程度要求越来越高,这些都对公司经营管理能力及优质人才储备提出了更高要求。若公司管理水平不能支撑自身规模的快速发展,公司将面临一定的管理风险。

(4) 规律的丧失和严重失真

大数据意味着更多的信息,但同时也意味着更多的虚假关系信息。来源不同的各种信息混杂在一起会加大数据的混乱程度,统计学者和计算机科学家指出,巨量数据集和细颗粒度的测量会导致出现“错误发现”的风险增加。

3.3 竞争分析

随着人工智能、AIoT、云计算等技术的推动,全球大数据市场规模逐年增长,2018年全球大数据市场规模54.9十亿美元,同比增长9.58%;2019年全球大数据市场规模59.6十亿美元,同比增长8.56%。2019年以来,全球大数据技术、产业、应用等多方面的发展呈现了新的趋势,也正在进入新的阶段。

目前,大数据相关的技术和工具非常多,给企业提供了更多的选择。企业越来越希望能将自己的各类应用程序及基础设施转移到云平台上。就像其他IT系统那样,大数据的分析工具和数据库也将走向云计算。大数据要走向云计算,还有赖于数据通信带宽的提高和云资源池的建设,需要确保原始数据能迁移到云环境以及资源池可以随需弹性扩展。

图 2019国际主要大数据企业

资料来源:公开资料整理 千际投行

“2019胡润全球独角兽榜”揭露全球共494家独角兽企业,其中,上榜2019年全球大数据行业独角兽企业排行榜的共18家,占总市值的2%。上榜企业市值总计2720亿元,其中,Palantir Technologies以1000亿元的市值位列第一位,Snowflake Computing、Databricks分别位居第二位和第三位。上榜企业数量最多的国家为中国(9家),其次为美国(8家);榜单前十企业的市值为2160亿元,占榜单总市值近8成;分别为Palantir Technologies、Snowflake Computing、Databricks、Mu Sigma、天下秀、盘石股份、秦淮数据、Celonis、Collibra、DotC United。

图 2019中国大数据企业10强

资料来源:资产信息网 千际投行

中国大数据行业发展面临的问题

(1) 数据孤岛情况严重,数据整合能力不足的问题

具体来看,当前国内经济社会大数据领域比较离散,政府部门之间、企业之间、政府和企业之间由于信息不对称、制度法律不具体、共享渠道缺乏等多重因素,导致大量数据存在“不愿开放、不敢开放、不能开放、不会开放”的问题,造就了一个个企业和政府管理部门的数据孤岛,以致无法构建全景的大数据。

(2) 技术创新滞后的问题

国内在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,对开源技术和相关生态系统影响力弱。同时,大数据应用水平不高。国内发展大数据具有强劲的应用市场优势,但是目前还存在应用领域不广泛、应用程度不深、认识不到位等问题。

(3) 相关人才缺失的问题

一方面,人才不足限制了大数据产业创新发展的成效,据相关数据披露,未来3至5年中国需要180万数据人才,但截至目前中国大数据从业人员只有约30万人。另一方面,大数据行业选才的标准也在不断变化,也促使人才跟不上时代的脚步。

(4) 行业应用不深入的难题

互联网、金融和电信三大领域的大数据应用在各行业总规模中所占比重超过70%;健康医疗领域和交通领域虽然近年不断“上架”新应用,但实际上行业规模占比仍相对较小;而在其他众多民生领域,大数据应用仍处于浅层次信息化层面,行业发展水平参差不齐。

3.4 中国企业重要参与者

中国主要企业有三六零[601360.SH]、国联股份[603613.SH]、光环新网[300383.SZ]、人民网[603000.SH]、网宿科技[300017.SZ]、优刻得-W[688158.SH]、壹网壹创[300792.SZ]、上海钢联[300226.SZ]、吉宏股份[002803.SZ]、金科文化[300459.SZ]、腾讯控股[0700.HK]、百度集团-SW[9888.HK]、网易-S[9999.HK]、哔哩哔哩-SW[9626.HK]、万国数据-SW[9698.HK]、汽车之家-S[2518.HK]、明源云集团控股[0909.HK]、中国有赞[8083.HK]、移卡[9923.HK]、宝尊电商-SW[9991.HK]、闻道网络[836261.OC]、莞银股份[871429.OC]、风格信息[430216.OC]等。

图 A股及港股上市公司

资料来源:Wind 资产信息网 千际投行

(1) 百度集团-SW[9888.HK]是全球最大的中文搜索引擎以及最大的中文网站。公司致力于为用户提供“简单、可依赖”的互联网搜索产品及服务,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求。在面对用户的搜索产品不断丰富的同时,百度还创新性地推出了基于搜索的营销推广服务,并成为最受企业青睐的互联网营销推广平台。

(2) 孔明科技[872061.OC]是大数据产品和解决方案供应商,提供包含数据分析、建模、机器学习和人工智能的完整SAAS产品。通过自主研发的数据产品,让企业通过数据工具的应用,最高效地完成不同目标。公司提供以数据和技术为驱动的一站式服务解决方案,为跨行业不同企业提供数据、技术、咨询、策略及执行的服务。自成立以来,公司已经服务包括快消、电商等多个行业超过4万家客户。

(3) 微瑞思创[833495.OC]主营业务为大数据技术产品研发、销售及服务。并自成立以来,专注于大数据信息业务,自主研发了具有知识产权的大数据技术平台,大数据应用平台等产品,并获得专利及软件著作权。

(4) 万国数据-SW[9698.HK]万国数据控股有限公司是中国领先的高可用数据中心基础设施和服务提供商之一,数据中心覆盖中国国内重点核心城市。该公司拥有世界级新一代数据中心与高可用IT服务经验及卓越的产业链整合能力,是基于世界级数据中心的高可用IT服务提供商。万国数据能够提供从数据中心设计、建设和运营,到数据中心托管,IT管理运营外包,业务连续性管理及灾难恢复的整合解决方案、咨询、服务和培训。目前已广泛服务于银行、证券、能源、制造、物流、互联网等多个行业及政府机构。万国数据还通过其创新的CloudMiXTM平台,为客户提升访问和管理多云服务的能力。

3.5 全球重要竞争者

全球非中国主要企业有谷歌(ALPHABET)-A[GOOGL.O]、FACEBOOK[FB.O]、SHOPIFY[SHOP.N]、中国主要企业有百度[BIDU.O]、MERCADOLIBRE[MELI.O]、网易[NTES.O]、SNOWFLAKE[SNOW.N]、推特[TWTR.N]、SCOUT24[G24.DF]、NEW WORK[NWO.DF]、MYHAMMER HOLDING[MYRK.DF]、TELES[TLIK.DF]、ASKNET SOLUTIONS[ASKN.DF]、RIGHTMOVE[RMV.L]、AUTO TRADER[AUTO.L]、GLOBALDATA[DATA.L]、MONEYSUPERMARKET.COM[MONY.L]、KAPE TECHNOLOGIES[KAPE.L]、雅虎日本[4689.T]、DENA[2432.T]、SHOPIFY[SHOP.TO]等。

图 国外上市企业

资料来源:Wind资产信息网 千际投行

(1) IBM[IBM.N]是全球最大的信息技术和业务解决方案公司。其主营业务部门包括全球技术服务部(GTS),全球商务服务部(GBS),系统与技术部,软件部和全球金融部。硬件方面:IBM为计算机产业长期的领导者,在大型/小型机和便携机(ThinkPad)方面的成就最为瞩目。其创立的个人计算机(PC)标准,至今仍被不断的沿用和发展。

(2) Agil Data以为大数据处理和数据建模提供敏捷方法为目标,提供了高性能流处理平台,可帮助组织快速高效地通过飞速生成的数据获得有意义的洞察力。

Agil Data提供的解决方案和服务可以帮助用户实现大数据承诺,对复杂的MySQL数据基础结构进行扩展。Agil Data为商业智能分析、数据管线编排、数据清洗(Data Wrangling)、事件处理提供了可无缝集成的最佳大数据解决方案。它与不同公司合作以转型工程实践,缩短开发周期,降低运维工作量,充分利用数据集构建全新的价值流。

(3) 甲骨文(ORACLE)[ORCL.N]是世界上最大的企业级软件公司,是世界领先的信息管理软件供应商和继Microsoft后全球第二大独立软件公司。公司向多个国家的用户提供数据库、工具和应用软件以及相关的咨询、培训和支持服务。甲骨文公司是第一个跨整个产品线(数据库、业务应用软件和应用软件开发与决策支持工具)开发和部署100%基于互联网的企业软件的公司。

(4) SNOWFLAKE[SNOW.N] Snowflake Inc.的云构建数据平台通过跨多个云提供即时弹性、安全数据共享和每秒定价实现了这一目标。它将数据仓库的强大功能、大数据平台的灵活性和云的弹性结合在一起,成本仅为传统解决方案的一小部分。

第四章 未来展望

以下为大数据行业发展的五个趋势:

1. 政府大数据从“数据资产管理”走向“大监管大服务”

随着数字政府和新型智慧城市建设的持续推进,与社会治理、民生服务、政务应用密切相关的政府大数据应用成为热点。中国政府掌握着80%的高价值公共数据,如何盘活这些海量数据资源,是未来政府大数据发展的关键。未来,通过结合5G、人工智能、大数据、云计算和物联网等诸种信息技术,顺应数字经济和数字政府建设浪潮,落地城市大脑、平安城市、社会信用、交通感知与管理、社会舆情管理等应用,切实提升政府服务能力,将成为政府大数据发展的机会点所在。

图 大数据将为政府带来便利

资料来源:资产信息网 千际投行

2. 金融大数据:从“强管控”走向“创新服务”

金融大数据是隶属于金融科技的关键技术,它服务于金融机构的核心业务环节,解答诸如贷不贷款、贷款多少、风险如何等关键问题。2017年以来,随着金融监管日趋严格,基于数据规范行业秩序,降低金融风险,成为金融大数据的主流应用场景。

图 金融大数据发展方向

·

资料来源:资产信息网 千际投行

3. 大数据安全从“技术安全”走向“综合治理”

传统数据安全已经无法满足大数据场景下的安全防护要求。大数据时代,数据的获取方式、存储规模、访问特点、分析方法和技术架构都有了很大不同,与此同时,企业的组织架构和业务流程也相应发生了转变,这些新特征对于数据安全提出了全新挑战——数据安全更难防护、认证系统不完善、系统更易被入侵、安全策略更难实行等。未来大数据安全将逐步从重安全技术转变为重治理,其重点落在核心数据资产的梳理和防护,以及围绕大数据治理所开展的体制机制建设。

图 大数据安全

资料来源:资产信息网 千际投行

4. 工业大数据围绕“小场景”从“项目”走向“产品”

未来,工业大数据将围绕“小场景”从“项目”走向“产品”。小场景由于投入相对少,需求更精准,有助于在短期内取得成效,培育企业的数字化认知,也便于供应商积累行业数据和经验,降低实施成本,推动从项目到标准产品的转变。通过以龙头企业和行业特色企业为引领,加速布局一批小场景,持续推进工业设备数据化和应用产品化,工业大数据有望加速落地。

图 工业大数据

资料来源:资产信息网 千际投行

5. 健康医疗大数据从“大”数据走向“精准”数据

中国的医疗信息化建设持续推进,年增速保持在20%以上的较高水平。从面向医院管理信息化(HIS),到以患者和医疗过程为核心的医院临床管理医疗信息化(如PACS、LIS、RIS、EMR等),再到区域医疗服务信息化(GMIS),广覆盖的医疗信息化建设项目累积了海量数据,为健康医疗大数据业务的开展奠定了坚实基础。健康医疗大数据将从当前简单的“大”走向“精准”,通过获取更高质量、更精准的数据,助力健康医疗服务的提升。 

(作者:千际投行 )