本篇文章4533字,读完约11分钟

151

温书平

齐宏伟认为自己不是一个简单的技术人员,他在技术的江湖上游荡了14年,但总是喜欢送“商海”。

五年前,我彻底告别了技术,戴上了创始人的新标签。也就是说,2011年,他创建的数据大厅诞生在中关村。2014年,新三板成功上市。

经过仔细研究发现,在这个以人才为导向的领域,数据大厅有两个突出的内务处理技巧:一个是非结构化数据处理技术,另一个是大规模数据处理技术。这两项技术离不开经验。也许这就是齐宏伟骄傲的根源。“从学校到nec,我已经在技术领域工作了14年,有时单个处理数据的信息量就达到10亿。”齐龚伟的中性欢快的笑声是用洁白的牙齿印出来的,一副近视眼镜戴在一张中国人的脸上。

千亿数据堂猜想

在数据处理领域,在一定程度上,不是处理了多少信息,而是处理了大量信息后的准确度。现在,数据大厅可以达到90%。其他数据处理的精确度有时只有50%到60%。

据了解,齐宏伟是中国第一批涉足数据业务的人,他的创建团队曾被视为中国数据之塔的顶尖人物。

就像人类发现石油一样。

目前,它可能真的被称为一个数据时代,在这个时代,各种各样的大数据被开发出来,以实现交易现实的应用。例如,医学领域的大数据,大型制药巨头,瞄准癌症,收集患者的大数据,从而准确地研究和开发新的目标药物,从而防止20年内无效浪费20亿美元。在大数据领域,这一类别被称为专业领域。数据大厅所做的是全面的社会数据,包括交通、健康、信用信息,智能是人工智能数据,o2o是纯粹的食品、服装、住房和旅游数据。在这些领域中,数据大厅在广泛收集、挖掘、研究和分析数据之后,提取信息价值并将其出售给数据应用企业。

千亿数据堂猜想

以人为本、辐射式的数据挖掘被业界称为集成大数据服务提供商。随着商业市场的变化,准确定位消费者,提高企业的原始经济价值,正成为越来越多企业的商业需求。因此,数据处理企业正迅速流行起来。

与五年前相比,数据对人的影响大不相同。

齐宏伟从中国科学院自动化研究所毕业后,进入日本nec中国研究院进行数据研究和开发。在那个时候,数据仍然是一个抽象的概念,它的价值是未知的,或者它没有影响人们的生活。收集数据也极其困难。

当时,齐宏伟在做交通数据信息采集时,为了得到实时路况数据,他要求北京1039电台配合。“当时,他们的大部分数据没有被广播,这意味着这些数据没有被使用,最后他们被闲置。它已经浪费了很长时间。”齐宏伟认为,这种价值被严重低估和浪费,如果开发出来,将具有不可估量的经济价值。

一面是无意识的浪费,另一面是迫切的需求,这是商机。大约在2000年,丰田向日本电气寻求帮助。当时,在美国发生刹车门事件后,丰田想知道用户对整辆车的改进评价。Nec通过数据挖掘给出建议。同样,大众迈腾的新款后车也因缺乏美感而受到许多车主的批评。齐宏伟的团队在数据收集和分析后给出了改进建议,这一举措也让大众迈腾在后续销售中一马当先。“数据可以为企业创造巨大价值。”齐宏伟深深感到,这在未来肯定会是一个大市场。

千亿数据堂猜想

当时,他最直观的感觉是,就像人类发现石油一样,一种资源在那里诞生,但尚未被开采,但他知道这绝对是一件好事。“数据,相当于小麦,从各行各业收集大量的小麦数据,加工后将小麦加工成面粉,然后将面粉卖给制作面包、汉堡和比萨饼的人,也就是做数据应用的人。”齐宏伟认为这是一笔好生意,会随着信息化的发展持续很长时间。他决心向制作面包、汉堡包和比萨饼的人提供面粉,这样这个层次的商人就不再有基本原料的困难。

千亿数据堂猜想

随着时间的推移,在2011年,互联网的社会发展趋势已经开始显现,互联网公司已经成长起来。“我们有做数据的感觉。这一次已经是围绕数据开展业务的早期萌芽。”齐宏伟说道。

2011年9月1日,由四人组成的创业团队以100万元人民币正式登陆中关村数据大厅。

信息和人

据齐宏伟和几家投资银行介绍,数据大厅是最早的专业数据服务企业。

成立于2011年9月,是2012年的市场布局阶段。2012年,数据大厅业务收入达到数百万,盈亏初步平衡。2013年,它实现了约300万元的利润。今年,数据大厅推出了人群大厅,实现了社会参与和贡献数据的数据采集模式。到目前为止,大约有60万人参加了这次活动。随后,推出了信用信息服务。到2014年,利润将达到数千万。根据投资银行的估计,数据大厅2015年的收入更加客观。

千亿数据堂猜想

数据大厅的成功一半是踏上了时代的列车,另一半可能与其核心业务竞争力有关。数据大厅有两种内务处理技能,一种是非结构化数据处理技术,另一种是大规模数据处理技术。

非结构化数据处理技术包括:图像理解、语音识别、语义理解等。在这三种技术中,图像理解对应于视频和图像,语义对应于大量的单词。尤其是在现代社会,80%的数据以非结构化数据的形式存在,如微信、朋友圈图像、小视频和一段语音。

大规模数据处理技术是指规模为pb的信息数据。一般来说,如果一台笔记本的容量是500克,那么pb的数据量相当于2000多台笔记本的容量。在这个领域,对于大规模的数据处理,不是要建立一个大型的云平台,而是要同时拉动数百台笔记本电脑进行处理。关键是连接数百台笔记本电脑的控制软件平台,实现数百台笔记本电脑的调度和管理软件。如果这项技术失败,数据将是不准确的。在一些数据处理器中,当处理数百个笔记本时,往往会在合并信息和提取值方面存在差异,因此准确率只有50%左右。

千亿数据堂猜想

齐宏伟在nec的时候,联系了汽车之家、爱歌、搜狐汽车频道等。在一个项目中,从15亿条评论中提取数据,但有时一条评论可能达到2000字,而且各种各样的评论和意见都包含在其中。例如,这一次,我们主要提取了关于油耗和外观的数据,所以我们需要从这15亿条帖子中提取40亿条评论,然后对信息进行分类。例如,一位网友评论说,昨天刚买的kk在倒车时不小心撞上了树脂,挂了一层漆。kk汽车油漆很软,信息分类为:“汽车系统:丰田;型号:凯美瑞;用户评价部分:汽车油漆;评价倾向是:车漆不好。”也就是说,大数据的处理就是集中数亿条帖子的信息。

千亿数据堂猜想

然而,一些数据供应商处理10亿个语义并分析5亿个语义,所以准确率只有50%,这太低了。

这些数据的处理依赖于机器,而机器的技术依赖于人。可以说,这是一个更加依赖人才的领域。

齐宏伟曾经工作过的Nec是世界上最大的R&D机构。在全球范围内,微软和ibm当时并肩站在一起。当时,nec将大型项目的整合作为其核心业务之一,包括大型项目的整体解决方案。电信,汽车,最强的业务。Ibm最强的是银行业。

当时,齐宏伟被逐渐提升为nec的经理,领导一个全球项目。“nec中国研究院牵头,这是一个集成非结构化处理技术的大型数据处理平台项目。当时我从日本拿了一些图像技术,文字的语义理解来自中国研究院,而声音来自德国研究院。在这种整合模式中,行业中有专业,但每个人都有不同的专业。他们声音的核心处理技术在美国图像中很强。项目落地后,它被用于丰田项目。”他说。

千亿数据堂猜想

冯强则是他在齐宏伟创建团队中的同事。齐宏伟负责管理团队,冯负责技术。另一位创始人是中国科学院的肖永红,他在客户解决方案和咨询方面有着多年的经验,拥有丰富的市场经验。另一位是飞信转型大师柴,他在互联网产品运营和策划方面很有名气。

“天鹅融资”

在对合作伙伴的评价上,林洪伟有一个共同的理解,那就是“他很聪明,具有技术人员的实际特点。”“我一直认为世界属于知识分子。齐宏伟能创建一个数据大厅并将其推至新三板,不是因为他聪明,而是因为他的知识结构为他的技术人员找到了另一个人生出口。”京东金融一位与齐宏伟联系的人士认为,齐宏伟所要做的就是没有人发现,不想进入,但齐宏伟参与了进来。

千亿数据堂猜想

2014年1月,数据大厅获得了1300万轮天使融资。

当时,市场上的天使轮大多在300万到500万元之间。投资银行界认为,数据大厅的这轮融资不能称之为天使,而是天鹅,因为天使没有那么胖。"

天使之轮是由国家发展和改革委员会和北京发展和改革委员会的一个产业基金和田溯宁云基地组成的投资。投资者认为,大数据将是未来支持工业发展和提升现有经济价值的强大基础,因此应该提前规划。

在获得天使轮融资后,这只略胖的天鹅振翅空,同年12月,它成功地在新的第三板上市。截至今年5月,首轮融资已完成,陈达风险投资和天使轮后续投资总计5000万元。

仅在7个月内,11月6日,数据大厅宣布完成融资金额为2.4亿元的B系列融资。“虽然目前还没有竞争对手,但我不得不考虑一下,这块地会突然杀了一棵柳树。”齐宏伟认为,跑得快,别人赶不上,直到他们赶不上,才使他们在高山上休息时感到安全。

庞大的资金需求背后,实际上是齐宏伟规划的深层布局。据介绍,目前有150名员工,春节前将有230名员工。据了解,在目前的150人中,有一半人天生就有技术。尽管齐宏伟拒绝透露市场计划,但目前的布局显示,未来将进一步深化。目前,数据大厅在镇江、南京和天津设有子公司,在美国硅谷设有全资子公司,并设有专门的信用报告子公司。

千亿数据堂猜想

在业务渗透方面,数据大厅计划制作云图片,培育创新型中小企业。在这个层面上,由于垂直着陆,所需的行业数据将更加广泛和庞大。“说到底,数据大厅表面上看起来是一个类似淘宝和京东的电子商务平台。它的背后是深度和垂直的企业服务。”北京的一位投资银行家表示,这也预示着未来信息商业价值的最大化。“现在,在大数据时代,我个人认为2015年是已经开始的第一年。前年是准备。除了远见之外,有些人正在发挥先发优势。真正的大规模爆发是今年,明年将是一个大爆发,明年可能会更大,但现在整个大数据行业才刚刚开始。用万里马拉松来形容,我觉得自己刚刚跑完1000米、1500米,一切才刚刚开始。”齐宏伟说道。

千亿数据堂猜想

在这个即将爆发的商业浪潮中,投资银行和许多互联网人士相信空.将会有一万亿市场例如,马云的淘宝网每年有数百亿的大数据销售额,京东的数据销售额也相当可观。如果把交通、医疗、物流、食品、教育、婴幼儿等行业计算在内,将会释放出一个巨大的市场。根据商务部的规划纲要,未来大健康产业的空空间将达到8万亿元,大数据的出现和应用必将延伸产业链,推动现有企业转型和产品改进。因此,包括电子商务在内,大数据发布的空空间将超过1000亿元。

千亿数据堂猜想

“国务院发布的大数据纲要,包括最近的互联网发展思路,可以在提高效率方面发挥巨大作用,无论是在商业还是个人生活中。从微观角度来看,数据中心的增长速度是每年三至四倍,甚至五至六倍。”齐宏伟相信大数据市场有着光明的未来。

目前,数据大厅的资本市场估值为20亿英镑。根据许多投资银行家的分析,未来随着大数据在中国的应用发展,数据大厅可能会成为一家市值1000亿元的综合大数据公司。“一方面,数据大厅本身的扩展和数据业务的扩展已经重新估价;另一方面,通过再融资,市场价值迅速增加。”运输、物流和医疗保健,这三个领域都是大市值领域。如果数据大厅的发展保持下去,所拥有的数据资源就有足够的质量,迅速提高估价是不可避免的。”一位投资银行家表示。

千亿数据堂猜想

此人还认为,随着大数据热潮的爆发,未来还会出现其他大数据服务企业,这可能会冲淡当时数据大厅的先发优势。那时,竞争可能是数据的质量。以及大量的数据。

标题:千亿数据堂猜想

地址:http://www.7mne.com/rbxw/7558.html