谁能通俗的告诉我什么是大数据?
谁能通俗的告诉我什么是大数据?
-
用最通俗的语言跟你解释一下。
举个例子,你想要买一双鞋,打开淘宝搜索了半天,感觉不太合适,然后又一想,晚点买也可以,于是退出了淘宝,打开了抖音,开始看某些土味视频。
当你下一次打开淘宝的时候,淘宝一定会给你推荐各种新款式的鞋,并且会给你推送相关的活动。而你每次打开抖音,看到的大部分都是土味视频。
其原因就是因为你在淘宝上用了大部分时间去搜索鞋子,淘宝通过测算觉得你对鞋子感兴趣,于是你每次进淘宝都会给你推荐鞋子。除非你下次用更多的时间去搜索另外一个东西。而抖音觉得你比较喜欢土味视频,因此这种视频便一直出现。
这就是我们所说的大数据,通过对你各种行为分析,为你推荐更符合你口味的东西。
会销售的售货员在卖东西的时候一定不会仅仅去说产品,他肯定会通过各种方法去了解你的信息,等到信息足够后再去为你推荐更加合适的产品,而此时你成交的概率非常大。
所以不妨回忆一下,买东西的时候有没有售货员跟你聊除产品以外的东西?比如家庭?
生活中的大数据有很多,打开歌曲APP,每日推荐就是大数据;打开今日头条,推荐你最感兴趣的内容也是大数据;打开视频APP,推荐的视频同样是你最爱看的,这也是大数据。
因此,只要能通过某种途径,了解到你的详细信息或者行为,根据这些信息或者行为进行推荐你所感兴趣的东西,就叫做大数据。
不知道你清楚了没有?
2020-05-11 23:09:11 -
相信大家对于这次新冠肺炎疫情期间社区防控力度之严、强度之大深有体会。但在杭州滨江区,在疫情爆发之初,却面临着社区疫情防控人手不足的问题。对此,国家电网杭州分公司研发了全国首个“电力大数据+社区网格化”算法,实现了收集、研判电力数据功能,并对滨江157476户居民、超过1000万条电力数据,进行了收集和分析。为了精准判断细微的用电数据差别,该公司在算法中开发了居民短暂和长期外出、举家返回、隔离人员异动等3个场景6套算法模型。通过3轮150余万条次电力大数据巡航,精准判断出区域内人员日流动量和分布,还可以实时监测居家隔离人员、独居老人等特殊群体347户。这让社区人员得以根据电量波动判断业主状况,提高了登记和服务的效率,从而解决了人手不足的难题。
听完这个例子,不知道你有没有什么感触呢?看似“高大上”的大数据,实际上就是这么的“接地气”。今天呢,我主要是想纠正一些大家对于大数据的误解,对大数据有一个更清晰且正确的认识。
二、大数据是什么?
其中,第三范式和第四范式都是由计算机来进行计算的,二者之间有什么区别呢?
引用维克托·迈尔·舍恩伯格撰写的《大数据时代》中的话来说,就是:大数据时代最大的转变,就是放弃对因果关系的渴求,取而代之关注相关关系。第四范式相对于第三范式来说,更关注“是什么”,而不需要知道“为什么”,就像人类总是会思考事物之间的因果联系,电脑却更擅长相关性分析。这也是为什么有人提出第三范式是“人脑+电脑”,人脑是主角,而第四范式是“电脑+人脑”,电脑是主角。
也许会有同学提出疑问,这是不是与我们科学研究的理念相违背?毕竟,如果通篇只有对数据相关性的分析,而缺乏具体的因果解读,这样的文章一般被认为是数据堆砌,是不可能发表的。
这里我又想给大家举一个例子了,让大家更好的理解第四范式的意义所在。拿我们近年来特别关心的雾霾来说,我们想要研究雾霾的产生机制,从而进行针对性的预防。
按照第三范式的思路,我们需要先在一些具有“代表性”的地方建立气象站,收集与雾霾形成有关的参数,包括大气化学成分、地形、风向、温度、湿度等气象因素。需要注意的是,第三范式下,我们所收集的参数都是我们认为可能会影响到雾霾形成的因素,实际上已经人为地排除了某些不重要的参数。从研究的可行性角度出发无可厚非,但是从准确性上来说,已经是根源性的错误了。如果能够获取更全面的数据,即不加筛选地收集各类参数数据,进行更细致的数据分析,那么就能得出更科学的预测,这就是第四范式的出发点。
相信通过上面的解说,大家对大数据有了一个基本的认识,下面呢我来对大数据做一个简单的定义:大数据(big data),指的是在一定时间范围内不能以常规软件工具处理(存储和计算)的大而复杂的数据集。这些大数据集包括结构化、非结构化和半结构化数据,需要经过进一步的数据处理和分析才能形成有价值的信息。
第一、数据体量巨大
这点相不难理解,我们日常生活中使用的微信、支付宝、微博、抖音等软件每天都会产生数百亿条以上的数据,这仅仅是移动应用一天的数据量,此外其他各行各业也都会产生各式各样的数据,其总量绝对超出了你们的想象。举个具体的例子,据英特尔预测,全球数据总量在2020年将达到44ZB,而中国产生的数据量将为8000EB,8000EB是什么概念?整个地球上所有沙粒总数的10倍!
第二、数据类型繁多
正如我刚才所提到的,大数据包括结构化数据、半结构化数据和非结构化数据。结构化数据指数据的属性相同,可以用统一的结构进行表示;非结构化数据缺少固定的结构,通常整体存储,比如各种图片、视频、音频等,非结构化数据越来越成为数据的主要形式,据IDC数据显示,企业中80%的数据都是非结构化数据;而半结构化数据则介于两者之间,比如HTML和XML文档,其内部用成对的标签记录对应的数据,但每个文档内部的标签又不是统一的,没有固定的规律。
第三、价值密度低
大数据的价值很高,但是单条记录却基本无意义,缺乏有效信息,这也对我们收集数据提出了要求,数据分析一定要建立在大量的数据集的基础上。举个例子,张三是某电商平台的忠实用户,我们作为后台,如果单看他的某一条购物记录,无非是知道了他买了什么东西,消费了多少钱,但是我们一旦利用大数据分析系统对张三所有的购物记录进行分析,那么我们就能得出他的一个消费画像,了解其购买偏好,从而对他进行精准的商品推荐。
第四、处理速度快
如今5G时代,数据产生的速度越来越快,这就要求数据后台能够快速处理掉无用信息,因为需要控制存储成本。同时更快速地处理信息,能够获取更多的有效价值,才能够在商业竞争中取得优势。两方面因素都刺激着数据处理技术的高速发展,目前采取流式数据处理技术可以达到毫秒级甚至微秒级的处理时间,满足实时监控分析用户行为,从而提供个性化服务的需求。
三、结语
最后,引马云的一句话作为结尾:未来的时代将不是IT时代,而是DT的时代。这里的DT就是data technology, 希望各位对大数据有了一个新的认识,也希望大家能够在这个万物互联的时代,把握时代机遇,掌握信息技能,做一朵勇往直前的“后浪”。
2020-05-17 08:56:23 -
随着互联网时代的到来,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,人们生活息息相关的事情都会变成网络中的数据,而大数据就是这个高科技时代的产物,所以大数据是非常重要的一个资源。
大数据是每时每刻都在变化变动,是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要,所以我们要把这些数据进行深度的挖掘和分析,扩大他们的价值。
大数据是需要通过大量的统计了解大家的喜好,想要的东西,从而得到他们想要的、想做的,而对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键,比如精准营销,征信分析,消费分析等等。
实践表明,大数据在推动经济转型升级、服务社会民生、促进政府治理体系和治理能力现代化等方面发挥了重要并且越来越明显的作用,大数据之所以成为时代变革力量,在于它通过追随意义而获得智慧,而随着时代发展,科技进步,会有越来越多的高科技时代的产物,大数据只是其中之一。
数通畅联专注于企业IT架构、SOA综合集成、数据治理分析领域,感谢您的阅读与关注
2020-08-10 13:14:10 -
大数据通俗来说就是有个机器,把你生活中的点点滴滴都记录下来,形成一种特定的形式!
2020-05-11 22:21:15 -
举个例子,大数据记录了一个爱抽烟的男人。晚上一般是先抽烟以后刷牙。有一天男士刷了牙以后抽烟。第二天app开始推送了tt。根据两天的记录了刷牙到抽烟的时间,第三天app推送了加厚版的tt。一个半月后某天记录到男人一直抽烟,便推送了某家专科医院。再过了一个月,发现男人再无抽烟,推送了铂爵旅拍。
大数据就是根据过去和现在记录的,不同纬度的数据进行分析,从而对未来不同场景各项应用的推演。
2020-05-11 22:37:49 -
题主您好,小白系统为您解答什么是大数据,如果对您有帮助请关注小白系统头条号,谢谢
\"大数据\"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。
\"大数据\"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。
数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
数据存取:关系数据库、NOSQL、SQL等。
基础架构:云存储、分布式文件存储等。
数据处理:自然语言处理(NLP,NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机\"理解\"自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage
Understanding),也称为计算语言学(Computational
Linguistics。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等。
数据挖掘:分类 (Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity
grouping or association rules)、聚类(Clustering)、描述和可视化、Description and
Visualization)、复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
模型预测:预测模型、机器学习、建模仿真。
结果呈现:云计算、标签云、关系图等。要理解大数据这一概念,首先要从\"大\"入手,\"大\"是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。
第一,数据体量巨大。从TB级别,跃升到PB级别。
第二,数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。
第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
大数据技术是指从各种各样类型的巨量数据中,快速获得有价值信息的技术。解决大数据问题的核心是大数据技术。目前所说的\"大数据\"不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统。大数据研发目的是发展大数据技术并将其应用到相关领域,通过解决巨量数据处理问题促进其突破性发展。因此,大数据时代带来的挑战不仅体现在如何处理巨量数据从中获取有价值的信息,也体现在如何加强大数据技术研发,抢占时代发展的前沿。
2017-09-22 15:22:23 -
大数据,很明显从字面上理解就是大量的数据。大,意思就是数据的量级很大,不上TB都不好意思说是大数据。数据,就是日常生活中人们的各种行为所产生的痕迹,不仅仅是数字,也有很多新闻事件等等。
同时,一旦数据量上来了,我们就需要存储,一个服务器硬盘可以存储的空间有限,就可以用分布式系统,将数据存储到成百上千个系统中,进而方便我们查询。
2022-07-17 09:58:40 -
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给大数据出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
这一切都始于数字时代到来后我们所产生的数据量的指数激增。这主要是因为计算机、因特网和技术能够从我们生活的真实世界中获取信息,并将其转化为数字数据。在2017年,当我们上网时、当我们携带配备GPS的智能手机时、当我们通过社交媒体或聊天应用程序与我们的朋友沟通时、以及我们在购物时,我们会生成数据。你可以说,我们所做的涉及数字交易的一切都会留下数字足迹,这几乎是我们生活的一切。
除此之外,机器生成的数据量也在快速增长。当我们的“智能”家庭设备彼此通信或与他们的家庭服务器通信时,数据就会生成和共享。世界各地的工厂和工厂的工业机械越来越多地配备了传感器来收集和传输数据。很快,自动驾驶的汽车将走上街头,将他们所到之处周围的环境实时、四维的地图发送回家。
2020-05-11 22:45:07 -
给你打个比方,以前你是单家独户,自己砍柴做饭,种田种菜,喜欢什么,爱好什么最多只有你爸妈知道,日子过的封闭,至今还是屌丝一枚。
自从村里来了新村长,村长想:村里每家每户都这样足不出门,不打招呼,每个家庭情况连村长也不清楚也不是个办法,于是,他成立一个联络调查小组,专门负责跑腿汇报给村长,调查摸底每家每户的需求喜好。
比如你喜欢文静点的妹纸,村长派来的组长了解了你的喜好,汇报了给村长,村长一翻记录表,刚好隔壁组的二狗子大闺女是这类型的,比较适合你。隔壁王大爷腿脚不好,村长听到汇报,就派了村口的赤脚医生过来看脚。你今天去相亲了,明天家里没盐了,组长一汇报,村长全知道。
这个,以村长为首的联络调查小组就是大数据,负责登记做报表的书记就是“云”。由他来采集你们每个人的每天信息,干过什么,什么爱好,需要什么,他再给你安排你想要的东西,甚至你哪天没钱了,偷了王大妈的鸡蛋,村长就想:这小子今天偷鸡蛋,明天可能偷村储蓄所的钱,于是,他提前给储蓄所所长和派出所所长都打了电话,让他们提前防范。


2019-03-11 04:42:29 -
大数据简单来说:就是海量的信息!不论用途,不论方向,就是简单地信息收集,参数收集,所有这些汇总起来就是大数据。大数据,不是随机样本,而是所有数据!
而大数据分析,就是针对这些信息进行识别,再进行分类,将其有事件变为数据化,概率化,然后应用于各种商业用途。
以上是对大数据简单地解读。那么大数据的意义何在呢?
随着大数据的发展,企业的技术研发、应用和落地在前期就能获得预期,能避免很多无所谓的浪费,以便于将有限的资源集中到开发更适合时代的企业产业。
商业决策可以通过数据分析来获取更为准确的信息和方向,最终能帮助决策者能更为准确直观的指导业务实践。
人工智能离不开数据。随着人工智能的发展,数据能模拟的更加人性化,也更个人化,也更适合于各种不同场景的应用。大数据的价值在于它是目前解决这个时代更新最有效的方法。
但对于我个人而言,比较抵触过度的大数据和互联网,原因如下:
一、当各类app通过我的使用习惯,推荐各种我搜索过一次的各种商业广告时,我会有种隐私被人冒犯的愤怒;
二、当你在使用各类软件时,都会被要求提供个人信息以便于获得更好的用户体验,这无形中增加了个人数据泄露的风险;
三、当数据化盛行,似乎人性变得无处安放;
四、一旦行业固化,人们想要突破阶层将变得不可能,拥有大量数据的将遥遥领先,后发的行人,将一辈子连望其项背的资格都没有,可以预见社会将会成为一潭死水,毫无兴趣和生机。
2020-05-11 23:24:43 -
大数据简单的说就是市场调研的升级版。包括腾讯,阿里巴巴等这些具有大量用户的公司,对其客户在其平台的所有行为发布的所有内容进行采集分类和分析。而这些数据有分成共性和个性。从所有人中采集出共性有助于发觉商机,了解客户痛点,更好地推出客户满意的产品,比如很多化妆品公司就会跟淘宝购买数据从而研发出更贴合市场需求的产品。而从你个人采集的数据属于个性,系统会通过你个人的数据采集进行相对于的推荐和改变,也就是我们经常说的ai智能,例子像我们的淘宝现在都是千人千面,每人手机打开的淘宝推荐的东西都不一样,这些就是大数据的效果。
2020-05-11 23:13:29 -
给你打个比方,以前你是单家独户,自己砍柴做饭,种田种菜,喜欢什么,爱好什么最多只有你爸妈知道,日子过的封闭,至今还是屌丝一枚。
自从村里来了新村长,村长想:村里每家每户都这样足不出门,不打招呼,每个家庭情况连村长也不清楚也不是个办法,于是,他成立一个联络调查小组,专门负责跑腿汇报给村长,调查摸底每家每户的需求喜好。
比如你喜欢文静点的妹纸,村长派来的组长了解了你的喜好,汇报了给村长,村长一翻记录表,刚好隔壁组的二狗子大闺女是这类型的,比较适合你。隔壁王大爷腿脚不好,村长听到汇报,就派了村口的赤脚医生过来看脚。你今天去相亲了,明天家里没盐了,组长一汇报,村长全知道。
这个,以村长为首的联络调查小组就是大数据,负责登记做报表的书记就是“云”。由他来采集你们每个人的每天信息,干过什么,什么爱好,需要什么,他再给你安排你想要的东西,甚至你哪天没钱了,偷了王大妈的鸡蛋,村长就想:这小子今天偷鸡蛋,明天可能偷村储蓄所的钱,于是,他提前给储蓄所所长和派出所所长都打了电话,让他们提前防范。
2019-03-11 04:42:29 -
大数据时代,今天的的网络科技时代
2017-11-03 09:53:36 -
什么是大数据,应该很好理解!简单通俗的说就是你在大数据面前就是赤裸裸的!任何事情都隐藏和瞒着不了!
从百度的搜索引擎开始,如果准确的说是从美国的谷歌开始,这样的引擎搜索功能应该是大数据的前身吧,这个是我个人的理解!不知道有没有问题!
搜索引擎把所有的数据显示出来,并分析出来,找到大家想要的数据!这个就是大数据!
但是目前为止,大数据都是通过云计算来实现的,除了搜索引擎的公司外,还包括阿里啊,头条啊;京东呀等等!
而头条之所以发展快就是依靠大数据而生的,不论是抖音的智能推荐,还是头条的文章推荐!都是依靠大数据来实现的!如果夸张一点的说,没有了大数据,就没有头条系!
数据,数据,就是准确的数字量化,通过对准确的数字计算来判断数据结构,得到数据结果!
比如一个人喜欢旅游,日常生活中购买物品的东西都会多少跟旅游有关,每天的行程线路也都会通过数据展现出来!而通过对这个人的日常行为规范进行大数据处理,就会得出这个人的生活习惯,日常爱好及生活细节!从而得出大数据的结论!
应该说,现在已经离不开大数据了!因为我们已经进入到了大数据时代!
2020-05-12 11:42:00 -
就是很多很多的信息,主要指合法取得,且可合法实用的用户身份信息,住址信息,联系方式,生活习惯,消费习惯等。
2020-05-11 23:05:48 -
网上抄一段谁都会,又长又空。所以尝试用我自己理解的东西简单说一下,若有问题请指出,仅供参考。
大数据,大数据,最重要的特点,毫无疑问,那就是大!大!数据量相当的大。这里说的大可以从两方面理解,一个是数据条数(比如1万亿个整数),另一个是容量(比如1百万个TB)。
可千万别小看数据量大这个特点。普通人根本无法处理如此大体量的数据。比如1百万TB,一个普通硬盘也就1TB,那么得需要1百万个硬盘来装,那得堆起来多高!一般的服务器也扛不住,说不定得搬1万台电脑。你说这种技术难不难?在大数据提出来之前,人们也是可以处理的,比如谷歌百度搜索,比如网易电子邮箱。不过这些技术都是人家的看家本领,不外传之秘籍。而自从谷歌2004年公布了它的mapreduce技术,并且有人在2006年前后公布了hadoop源码后,世人马上就可以很轻松地使用了,大数据突然就火了。
曹操称象,都听过吧?大象很大,很重,三国时期根本没有那么大的秤,怎么办?就把大象放到船上,看船在水中的位置。然后大象牵走,运很多石头上去,让船到同样的位置。这个思想就是mapreduce,大数据处理海量数据的核心思想。它把一个很大的任务分解为等效的很多小部分,然后让成千上万的普通电脑(服务器)去计算,最后再把结果“加”起来。专业术语叫分布式处理。这项技术早就有了,只不过hadoop的兴起,让它的门槛瞬间变低很多很多。门槛低了,这项技术就火了。
从某种程度上说,hadoop就是大数据的代名词。如果你不用hadoop,都不好意思在“行家”面前说叫大数据。hadoop简单说就是一个软件,具体的信息大家网上搜,我就不复制粘贴了。当然现在也有一种不好的现象,那些对hadoop一知半解的,随便用用,就几个GB或几个TB也号称叫大数据,炒作概念。可以这么说,连1000TB都没有,根本算不上什么大数据,那只不过是借助hadoop故弄玄虚罢了,就好比买几十本世界名著放在客厅书架上(但却几乎不看),就号称是文化人文学人一样。
大数据除了数据量大外,第二个特点就是数据种类多。
举个例子,传统大超市,它可以借助收银系统掌握每天每时的货物售出情况。这个数据就比较单一。而再看网上商城,它不但可以掌握货物流动,还能知道购买者的性别,年龄,地区,浏览过哪些商品,在哪些商品上看了多长时间,浏览商品时是在什么位置(GPS定位)。后者就符合大数据数据种类多的特点。
大数据还有一个特点就是有价值的数据比例少。请注意是比例。比方说你存了1亿条数据,可能只有其中1千条是有价值的。另外还有一些数据可能是错的,还有一些是缺失的。这种思路与传统思维不一样。传统软件设计认为要存数据就存有用的,正确的,还要尽量避免数据缺失。比如传统银行就是要求数据不能错,近期交易信息不能丢。而网上购物就不一样了,用户的浏览历史记录,实际上就是可有可无的,多一条少一条关系不是很大。存起来只不过为了数据挖掘而已。后者就符合大数据价值密度小的特点。
再来说说为什么大数据现在火了,难道这些大数据的特点和优点以前想不到吗?
首先,刚说过了,hadoop的兴起(再外加云计算,特别是公有云),让普通开发者处理大数据的能力瞬间提高一个档次,门槛变低。第二,硬件特别是存储设备成本变低。而以前的系统遇到没有价值的数据就丢了,要来干啥,浪费空间。我记得以前用手机的时候发短信有30条的限制,那都是挖空心思删除没用的短信,不然提示收件箱已满。现在聊天记录几十万条都懒得删,反正手机装的下。
第三,物联网技术,传感器技术,GPS定位,移动设备,网上交易等的发展。还有,实名认证机制。这些种种发展,导致了数据的种类一下子变多了。而且由点到线,由线到面,看似没有价值的数据连在一起就变得有价值了。如果大家都用手机地图开车,那么这些大数据就可以联系起来,知道哪里拥堵,指导如何避免拥堵,还可以统计不同类别的人(实名认证)开车的喜好,比如哪类人喜欢去公园,哪类人喜欢去大饭店。
大数据和数据挖掘,人工智能有什么区别和联系?这个说法不一。我认为大数据侧重点是数据量大,强调如何使用特定的技术快速处理海量的,异构的数据。一定是使用分布式技术。如何使用分布式,是大数据的一个重要特征。而数据挖掘则是强调数学上的算法,而不过分关注在分布式集群上实现的细节。数据挖掘通常都要借助大数据技术,但不是必须,“小数据”也可以挖掘。这就好比算账和计算器的关系。算账就是数据挖掘,计算器就是大数据。两者密不可分,通常,算账离不开计算器,计算器主要用来算账。算账需要理解业务甚至要学会计知识,而计算器关注的是电子技术,浮点数运算,泰勒级数展开等等。另外数据挖掘不总是强调性能和实时性。比方说我可以用100小时的时间用一台破电脑去进行一个分类学习或叫训练(正如同我用笔算也可以算账一样,虽然慢一点)。但是大数据一般动辄出动数十台服务器,在几分钟甚至几秒钟就要出结果。所以两者侧重点不一样。
而人工智能包括机器学习,也包括数据挖掘。但是平常所说的人工智能,或者说狭义的人工智能,通常都是使用了神经网络,更准确地说是深度学习(可理解为深度神经网络)。
2017-10-25 01:31:16 -
大数据是公司获取或接收的一组高容量数据,例如统计数据和关系数据库,其速度.和可变性使分析变得困难。这些数据可以是结构化的或非结构化的。大数据是对海量数据的管理和分析,这些数据由于其大小无法以常规方式处理。这些数据被转换成信息,从而有助于在公司,组织或政府中做出战略决策。
什么大小的数据被认为是大数据,将被称为大数据?对于\"大数据\"一词,我们有许多相对假设。对于初创公司来说,可能有50 TB的数据量被认为是大数据,但对于Google和Facebook这样的公司来说,可能不是大数据。这是因为它们具有存储和处理这些数据量的基础结构。
大数据是指超出技术有效存储,管理和处理能力的数据量。
大数据是指其规模,多样性和复杂性需要新的体系结构,技术,算法和分析来管理它并从中提取价值和隐藏知识的数据。
大数据是高容量,高速度和多样化的信息资产,它们需要经济高效的创新形式的信息处理方式,以增强洞察力,决策和流程自动化。
大数据指的是涉及常规,技术和基础架构无法有效处理的,过于多样化,快速变化或海量数据的技术和计划。换句话说,数据的数量,速度或种类太大。
大数据通常被描述为具有以下3个属性:
1.卷:数据的卷应该非常大,足以使一台计 算机无法处理该卷。
2.速度:数据到达的速度非常高。一个示例是来自传感器等的连续数据流。
3.多样性:大数据可以由多种格式的数据组成,包括结构化,半结构化和完全非结构化。
大数据技术的优势:
大数据已在商业世界中变得很重要,因为通过有效使用大数据,公司可以获得有关其内部流程的许多问题的答案。所获得的数据被视为真实的参考,并且对于做出旨在优化程序的决策具有决定性作用。
根据大数据收集和分析的能力,与不使用大数据集分析以获取利益的公司相比,该公司将获得巨大的优势。
更好的决策:
信息量大,将作为参考。通过正确的分析,它将帮助您更快,更安全地做出最准确的决策。
了解公众利益:
通过从网络中人员的搜索或互动中收集大量信息,您的公司可以很好地了解您的受众正在寻找什么。这将使您可以根据客户和新时代的利益调整报价和业务。
即时反馈:
尽管可以收集的数据量巨大,但是可以立即对其进行分析以获得客户对产品的意见,并可以积极地改善产品。
缺点:
存储——过时的存储解决方案不足以存储每天生成的如此庞大的数据量。而且,数据的种类是不同的,因此需要分开存储数据以有效使用。
访问和处理数据的速度一尽管硬盘容量增加了,但是在访问或处理数据的速度方面并没有做太多的开发。
大量数据可能会减慢分析速度一尽管大数据量可以使人们对某些事物有更真实的了解,但也带来了极大的不便。这会减慢信息分析的速度。尽管该领域的专业人员知道如何选择和忽略大数据模式。
虚拟安全性——近年来,由于数据的脆弱性,网络攻击主要针对大数据。这使得有必要使用工具和标准来进行大数据中的有效和负责任的工作。
2020-09-10 14:46:36 -
大数据通俗的解释就是海量的数据,顾名思义,大就是多、广的意思,而数据就是信息、技术以及数据资料,合起来就是多而广的信息、技术、以及数据资料。
2020-05-11 22:14:28 -
大数据其实是一种信息资产的集合。说白了就是信息。至于能干什么嘛,你现在能想到的除了人力劳动,其他的几乎都可以用得到大数据。比如,写新农商网,你不好奇为什么那么多的看头条的人为什么偏偏要选择我来让你邀请回答吗?原因很简单,可能是我前段时间一直在写大数据的内容,也有可能是我前段时间一直浏览着大数据的相关内容等等一切关于大数据的,这成为了大数据判定我是个大数据从业者的依据,所有邀请界面出现了我而不是其他人。再举个简单的例子,你在淘宝上搜了一件衬衣,下次打开淘宝的时候发现它会给你推各种各样的衬衣或者是周边产品。道理是一样的。大数据会根据你的习惯来判定你需要什么。这就是大数据的魅力所在。
2019-04-22 16:40:09 -
大数据这个词其实流行了很久了,与我们的生活息息相关,并不陌生,现在我们生活中的大平台基本上都用到大数据,淘宝,拼多多,美团,滴滴等都用到大数据,如今大数据基本上无处不在。
一、大数据是什么意思
大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
二、大数据特征
容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息;
种类(Variety):数据类型的多样性;
速度(Velocity):指获得数据的速度;
可变性(Variability):妨碍了处理和有效地管理数据的过程。
真实性(Veracity):数据的质量。
复杂性(Complexity):数据量巨大,来源多渠道。
价值(value):合理运用大数据,以低成本创造高价值。
三、大数据的历史发展
人类诞生以来,数据就开始膨胀,时代交替,工业革命,互联网时代,5G时代,人工智能时代,都是数据的一次次发展,数据的不断精准,加快了人类的新陈代谢,大数据推动历史发展。
四、大数据意义
大数据的价值体现在以下几个方面:
1、对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;
2、做小而美模式的中小微企业可以利用大数据做服务转型;
3、面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。
4、各大领域的科研需要大数据,加快技术变革和换代如医疗,环保,公共政府服务
5、航空航天,军事领域因为大数据也会得到突飞猛进的提升。
2020-05-12 09:32:07 -
简单点说就是生活中或者工作中,产生一大堆数据,存到电脑中了,电脑中有个程序,把你有用的都给你分拣出来,然后再重新组合,形成你想要的产品,再给你推送回来。
2020-08-13 11:28:40 -
通俗点说,就是很多数据。但是,这个多,不是杂七杂八的多,而是有一定关联性的,可以从中分析总结出一些事物的特征来。
2020-05-12 07:50:10 -
大数据,简单来讲就是数据量大!
不过大有大的难处,由于数据量的暴增,导致之前的数据处理工具无法处理如此海量的数据,衍生出大数据技术,就是现在的hadoop和他的一系列周边技术。。
技术进步之后,随着数据处理能力的增强,人工智能也随之突飞猛进,人工智能的特点就是需要大量的数据去喂养,这也是现在为什么人们,更多的是提人工智能,越来越少的谈及大数据,因为大数据已经成为了基础,就像空气和水,非常重要,重要到没有必要去讨论。(当然现在空气污染导致大家对空气的讨论也多了起来,这是后话了)
人工智能需要海量的数据喂养,导致人们又开始拼命的想要获取数据,这个其实是商家层面,消费者来讲只能说是数据的贡献者!
所以,大数据只是商家的大数据,消费者需要商家提供更个性化的服务,就需要给商家提供更多的个人隐私,想要保护隐私,就没有琳琅满目的个性化,,对于消费者来讲,这是一个无法回避的循环!
2020-05-12 10:02:33 -
大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
2020-05-11 22:59:07 -
从字面意义理解,就是大量,海量数据,这些数据,这些数据有数字,文本,图像等,为什么以前没有这个概念呢,因为以前计算机的计算能力不行,网络带宽不够,存储设备不够大,所以无法采集和处理海量数据,现在条件具备了,可以处理海量数据了,并且从海量数据里提取的信息越来越多。所以现在开始有大数据的概念了。
2020-05-13 08:39:06 -
就是很多很多的数据,量大了就能统计出很强的规模性,可以对某些事情做大概率发生情况的估计
2020-05-12 15:13:59 -
你每天拿着的手机,手机上下载的软件,都会记录你的每个行为,一个淘宝的链接,一个头条的点击,甚至于你每天的所过之处都会被你的手机一点点的记录。不同的软件间相互合作分享信息,构架出你的生活网。这就叫大数据
2020-05-12 00:16:44 -
当今社会中,各种设备和系统产生了海量的数据,这些数据包含了丰富的信息和价值,但是由于数据量太大,传统的数据处理和分析方法已经无法胜任。而“大数据”就是指那些规模非常庞大、处理和分析难度非常高的数据。
具体来说,大数据的特点主要包括以下几个方面:
数据量大:大数据的数量级通常以亿、万亿为单位,甚至更大。
处理速度快:大数据需要在短时间内进行分析和处理,并及时提供决策支持和反馈。
数据类型多样:大数据不仅包括结构化数据(如数据库中的表格数据),还包括非结构化数据(如图像、音频、视频等)和半结构化数据(如XML文件、HTML文件等)。
数据来源广泛:大数据涉及到各种领域和行业,比如互联网、金融、医疗、交通等等。
因此,大数据需要采用新的技术和方法来存储、处理和分析,例如分布式计算、云计算、机器学习、人工智能等等。通过对大数据的深入挖掘和分析,可以获得有价值的信息和洞见,帮助企业和个人做出更准确的决策。
2023-03-24 18:48:01 -
简单通俗的解释?就是指无法在一定是范围内用常规软件工具进行捕捉、收集、管理的数据集合。1、大量的数据 2、高速、 3、多样 4、真实 5、价值密度低。
举个例子:你在微信等其他软件搜索或提及到某个词,然后你打开淘宝、抖音或微博,可能就会出现相关的推荐,就是大数据采集、再分析、再推送给你。
2021-02-23 15:35:43 -
当今互联网时代,人们使用数字设备和应用程序产生了海量的数据,包括文本、图片、音频、视频等各种类型,大数据(Big Data)指的是一种涉及到海量数据的概念,这些数据量极大,规模之大甚至难以想象。大数据的产生和积累与人们使用互联网、移动设备应用有关。这些数据的需要进行管理、存储、处理和分析,以便在其中发现有价值的信息。
目前,云计算、物联网、机器学习、人工智能等技术的发展,为大数据的采集、处理、分析提供了更加便捷和高效的方式。随着技术的不断进步,业界也相继开发出了一些大数据处理和分析的框架和工具,比如Hadoop、Spark和Flink等。
大数据已经成为了现代数字化经济的重要组成部分,它不仅为企业和个人提供了更加丰富的数据资源,也引领了新的技术革新和商业模式创新。比如说根据你日常在浏览器的搜索内容,给你进行优质内容的推荐,更快更方便你的生活。
2023-04-11 22:01:52 -
一句话说清楚:大数据就是可以用来分析所需要了解事件的一切相关信息。
2020-05-13 01:17:19 -
通过很多很多有效的活动买卖轨迹行成了大量有效的数据,简称大数据!
2020-05-12 09:36:07 -
非常高兴回答您的这个问题,以下是我自己的一些理解和看法: 我认为大数据是一个行业或领域的数据集合,是一个庞大而复杂的系统。有各种各样的技术可以处理或应用这些数据,所以让我来说说我正在研究大数据解决方案的行业。
目前,提供大数据解决方案的方法是集成各种现有的信息技术系统,连接它们,打破信息孤岛,并使信息能够自由流动和使用,包括云计算、物联网和超大脑计算。
但就目前而言,在整合信息方面遇到了很多困难,大数据远没有出现的那么光明的样子,在提供行业解决方案方面可谓是摸着石头过河,从专业角度来分析,并不是真正的大数据价值,只能算是半大数据,行业发展任重道远。
根据数据,大数据(bigdata)是指在一定时间范围内无法用常规软件工具捕获、管理和处理的数据集合,是一种庞大、高速增长和多样化的信息资产,需要新的处理模型具有更大的决策、洞察发现和流程优化能力。
谢谢大家阅览,如果对小编的回答感兴趣可以关注我!
2019-06-24 23:14:49 -
博士时候就是做大数据。
最通俗一点就是很多条数据。
我们做大数据研究呢,就是高效的处理数据,对未来做一些预测,建议等。
例如,全中国人大多数都是10点睡觉。睡觉前看一看手机。那我们做推广时候,就可以选择9点半的时间。
大数据没有什么特别神秘的地方,就是数据多一点。
2020-05-11 23:50:25 -
天天说的大数据你知道是什么么
2017-11-03 09:53:19 -
Google作为世界最顶尖的科技公司,为了支撑其其搜索引擎功能,每天都要处理大量数据,后来互联网大爆发,数据越来越多,后来Google的科学家发表了三篇论文,系统介绍了分布式文件系统、分布式列式存储系统和分布式计算系统,这三篇论文奠定了大数据处理技术的基础。
后来,这三个系统被谷歌开源出来,出现了大名鼎鼎的Hadoop(包括HDFS、MapReduce和Hbase)。
所谓大数据,就是指传统工具无法处理的大量数据。那么到底如何界定“传统”和“非传统”工具呢?Hadoop是就是区分它们的标志,隐藏在Hadoop背后的词叫分布式。相对于集中式的传统数据处理方式,当数据集的体积大到你不得不使用以Hadoop为代表的分布式处理工具来处理这些数据时,这些数据就可以称之为大数据。
2017-08-28 16:09:18 -
大数据的定义其实很简单,企业进行日常业务活动产生的是数据、人类每天喝水吃饭是数据、阅读看视频是数据、点餐购物是数据,把这些数据不做区分统一收集、汇总起来就是我们常说的字面意义上的大数据,或者换个说法也就是海量的数据即是大数据。
一般来说,大数据往往会从各个不同的方向获取,比如硬件、软件、文本、数据库等,同时这些不同方向来源的数据其格式也不尽相同,但有一点那就是利用大数据前需要对其进行基本的处理。
拿派可数据BI中流行的数据仓库举个例子,各种不同来源、不同格式的数据统一汇总到数据仓库,并经过ETL过程处理过后以规范的数据形式储存在数据仓库中,同时这些数据在数据仓库中还会被数据模型分成不同的指标管理,这样等到需要利用数据,比如数据分析人员抽取数据,就可以直接从数据仓库中调取,然后直接在可视化报表中进行图形化处理。
最后,大数据可以对不同消费者提供精准化的营销推广,也可以辅助企业管理人员进行决策。
2022-04-19 11:32:57 -
非常多的数据,样式杂乱,又产生得很快。一般的工具分析不了,要用特定的技术来分析和使用。
2021-03-28 17:54:17 -
在当前的大数据时代,不仅IT(互联网)行业的人需要了解大数据相关知识,传统行业的从业者和普通大学生也都应该了解一定的大数据知识,在产业互联网和新基建计划的推动下,未来大数据技术将全面开始落地应用,大数据也将重塑整个产业结构。
2022-07-06 08:23:34 -
别人收集了所有的人消费及流动信息
2020-05-11 23:08:51