百度开放的大数据引擎将如何改变医疗和交通

2014-04-25 佚名 生物探索

还记得百度斥巨资建立的致力于人工智能技术开发的深度学习研究院么?接下来,它将不再只为百度自己所用了。而且,百度的其它大数据技术也将会与它一起走出象牙塔。 昨天,百度正式开放了其名为“大数据引擎”的技术体系。简单来说,“大数据引擎”指的是对大规模的数据进行收集、存储、计算、挖掘和管理的一套系统。通过百度的深度学习技术和数据建模技术,能够让数据分析变得更实时和精准。此前,百度已经将这些技术用在了自

还记得百度斥巨资建立的致力于人工智能技术开发的深度学习研究院么?接下来,它将不再只为百度自己所用了。而且,百度的其它大数据技术也将会与它一起走出象牙塔。

昨天,百度正式开放了其名为“大数据引擎”的技术体系。简单来说,“大数据引擎”指的是对大规模的数据进行收集、存储、计算、挖掘和管理的一套系统。通过百度的深度学习技术和数据建模技术,能够让数据分析变得更实时和精准。此前,百度已经将这些技术用在了自己的一些产品中,而这次对外开放的,主要包括数据中心的硬件、数据分析技术和深度学习技术。

百度把这个“大数据引擎”分为三个层次:开放云、数据工厂和百度大脑。

开放云指的是这套引擎的基础架构——分布式的低能耗数据中心,也就是前文提到的硬件部分。其中包括数据中心的服务器设计、数据中心规划和设计、分布式系统、超大规模集群自动化运维、大规模GPU并行化平台等。其次是数据工厂,它可以支持超大规模的异构数据查询和大数据分析,也就是调用硬件,来完成数据的挖掘和分析。而百度大脑,其实是对单集群规模数据能力的扩展——基于深度学习技术,让机器模拟人类大脑多层神经元的思维模式做出预测模型。

所以,我们可以一句话概括“大数据引擎”是如何运转的:百度对自己以及各行各业的数据进行挖掘,利用“数据工厂”和“百度大脑”分析它们,输出数据分析结果,为自己和合作伙伴提供解决方案。




先来看看百度是如何在自己的产品上使用大数据引擎的。

最常见的是一些百度产品功能上的应用。比如,百度图片搜索的“以图搜图”功能。当用户上传一张图片到图片搜索之后,系统将会自动将这张图片与百度服务器上数亿计的图片比对,并查找出相似的图片,然后实时展示出来。而百度输入法中中文语音转换成中文文字的功能也是利用了相似的原理——将语音数据进行收集、分析、比对,然后找出准确的文字进行对应。

还有数据模型的建立。比如,百度会对人们在网上对某个旅游景点进行搜索的行为和实际旅游人数的数据进行比对分析,依此绘制出某个景点在两个星期内的“热力图”,以显示这个景点的拥挤程度。现在,百度的旅游预测模型已经可以精准到两个星期。你或许记得今年春节时百度发布的“百度迁徙”——一张全国范围内的春运热力图,就是基于相似的模型实现的。这些数据分析技术同样地被应用在了百度的广告系统中。

那么,在百度的这一套“大数据引擎”开放之后,它会首先被应用在哪些场景上?在昨天的发布会上,百度深度学习研究院常务副院长余凯称,医疗将会是首个被大数据技术改变的行业。

如今,随着可穿戴计算设备的兴起,人们可以记录下大量的生活方式,比如每天的运动量和运动时间、睡眠量、久坐时间、身高、血压等,这些被量化的数据涵盖了我们身体状况的方方面面,将会成为病情分析的重要依据。而对于医院来说,这些数据无时无刻不在产生、零散分布在各个平台上,已经超出了医院IT系统的数据存储和分析能力。所以,余凯认为“大数据引擎”将可以帮医院解决这样的问题。

另一个例子是交通拥堵的治理。基于百度地图,百度已经可以实时地收集整个城市的交通状况,通过分析之后得出结果,可以帮助政府进行决策。例如对城市中某些区域的红绿灯的时间进行微调,用不同的策略实现整个城市交通状况的提升。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1588790, encodeId=3d501588e906c, content=<a href='/topic/show?id=00742438078' target=_blank style='color:#2F92EE;'>#交通#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=37, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24380, encryptionId=00742438078, topicName=交通)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=84fb17623791, createdName=yuandd, createdTime=Sun Apr 27 02:07:00 CST 2014, time=2014-04-27, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1591867, encodeId=757d159186e9d, content=<a href='/topic/show?id=8e61e186563' target=_blank style='color:#2F92EE;'>#百度#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=39, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=71865, encryptionId=8e61e186563, topicName=百度)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=9b0c18038643, createdName=tcm105hq, createdTime=Sun Apr 27 02:07:00 CST 2014, time=2014-04-27, status=1, ipAttribution=)]
    2014-04-27 yuandd
  2. [GetPortalCommentsPageByObjectIdResponse(id=1588790, encodeId=3d501588e906c, content=<a href='/topic/show?id=00742438078' target=_blank style='color:#2F92EE;'>#交通#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=37, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24380, encryptionId=00742438078, topicName=交通)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=84fb17623791, createdName=yuandd, createdTime=Sun Apr 27 02:07:00 CST 2014, time=2014-04-27, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1591867, encodeId=757d159186e9d, content=<a href='/topic/show?id=8e61e186563' target=_blank style='color:#2F92EE;'>#百度#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=39, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=71865, encryptionId=8e61e186563, topicName=百度)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=9b0c18038643, createdName=tcm105hq, createdTime=Sun Apr 27 02:07:00 CST 2014, time=2014-04-27, status=1, ipAttribution=)]
    2014-04-27 tcm105hq

相关资讯

IBM收购Aspera 突破大数据传输瓶颈 有望应用于医疗领域

医疗大数据有一个重大的特点是数据“大”,一张CT或MR片子约300M,如果提高清晰度,所需容量更大,大量的影像学数据资料的传输瓶颈,限制了医疗信息化,以及远程诊疗的普及。因为,几乎没有足够的带宽能做到实时传输。 但最近的技术突破,有望解决这一难题。来自美国加州埃默里维尔市的Aspera公司,使用创新的FASP技术,能使大数据传输时间减少99.9%,可以使一个24G的文件传输从原来的26小时减少到

李兰娟:云计算与大数据将成为医疗改革利器

“第六届中国云计算大会”将于2014年5月20-23日在北京国家会议中心隆重召开。本次大会将历时四天,内容更加精彩,预计参会者将大大超过上一届的12000多人次。每届中国云计算大会,都有两院院士的精彩演讲。本届大会上,李德毅、怀进鹏、倪光南、李伯虎、杨学军、张尧学、李未、梅宏、高文、李兰娟等10位两院院士将集体亮相,与广大参会者共同把脉云计算与大数据的未来技术发展和应用方向。大会召开前夕,CSDN

科学家解读流感病毒:或可用大数据预测暴发

今冬,H7N9禽流感“卷土重来”。最近几日,各地又陆续出现了不少确诊病例。为何流感病毒总对人类“死缠烂打”?人类是否能够战胜拥有庞大亚型且变异迅速的流感病毒?昨晚做客第174期新民科学咖啡馆的两位科学家表示,在人类和流感病毒之间的这场永不停歇的“军备竞赛”中,科学研究跟踪病毒的脚步近年来已快了许多。 今冬H7N9“大流行”? 流感病毒的个头实在是太小(100纳米),只有头发丝直径的千分之一

医疗未来场景:大数据化的管理与决策体系

题注:与健康相关的数据正在呈爆炸式增长。一家纽约医院从硅谷招来顶级人才,正加紧步伐为“大数据化”的医疗未来做准备。在那个未来中,医院将可分析和预测病人的健康需求,甚至将颠覆我们对疾病的认知。杰夫·哈默巴德(Jeff Hammerbacher)是西奈山伊坎医学院的研究人员,他的办公室坐落于全美国经济两极化最彻底的地区之一。放眼望去,办公室南边是纽约时髦上东区的联排别墅,北部则是落后的东哈莱姆贫民

李嘉诚捐300万美元助斯坦福牛津研究医疗大数据

    美国斯坦福大学23日表示,该校医学院又获李嘉诚基金会捐赠300万美元研究“大数据”,将与英国牛津大学合作,利用庞大生物医学数据库改善人类健康,减低医疗成本。    斯坦福大学称,“大数据”被视为生物医学科学的下一轮革命,有助在减低成本的同时,加快开发新药及为病人提供更佳的个人化疗程。    英国生物样

PNAS:改善大数据集分析的准确性

日前,来自哈佛医学院等机构的研究人员发现,整合了交叉验证的一种数据集分析技术可能有能力识别出从生物信息学到语言学等领域的多维数据集的模式。 对大数据集的自动分析可能识别出数据的模式,但是无法评估发现的模式的显著性,这可能导致无意义的结果。 研究人员发展了一种数据分析方法,它包括了一个交叉验证步骤,从而识别出最显著的模式,这种方法称为通过准确性最大化的知识发现(KODAMA)。一个迭代过程评估了