大数据与数据挖掘.pptx

上传人:夺命阿水 文档编号:354520 上传时间:2023-04-26 格式:PPTX 页数:18 大小:1.45MB
返回 下载 相关 举报
大数据与数据挖掘.pptx_第1页
第1页 / 共18页
大数据与数据挖掘.pptx_第2页
第2页 / 共18页
大数据与数据挖掘.pptx_第3页
第3页 / 共18页
大数据与数据挖掘.pptx_第4页
第4页 / 共18页
大数据与数据挖掘.pptx_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《大数据与数据挖掘.pptx》由会员分享,可在线阅读,更多相关《大数据与数据挖掘.pptx(18页珍藏版)》请在课桌文档上搜索。

1、大数据与数据挖掘,阿里(菜鸟)与顺丰之争,2017.3-4月 菜鸟要求顺丰返回所有快递柜(丰巢)包裹信息,即所有的快递柜信息的触发必须通过菜鸟裹裹,取件码信息要无条件给菜鸟,丰巢要返回所有包裹信息给菜鸟,无论此件是否来自淘宝系平台,顺丰不同意2017.5.27 菜鸟邮件通知顺丰自 5.31 日停用数据接口,下线顺丰接口。(5月31日晚上6点,接到顺丰发来的数据接口暂停告知。6月1日凌晨,顺丰就关闭了自提柜的数据信息回传)2017.6.1 菜鸟称收到顺丰发来数据接口暂停通知(顺丰突然关闭了物流数据接口)2017.6.1 顺丰称丰巢接口信息是菜鸟方面于 6 月 1 日 0 点下线的。(菜鸟之所以封

2、杀顺丰,背后原因是阿里方面希望顺丰放弃使用腾讯云改用阿里云。)2017.6.2 顺丰连发两条告示,指责菜鸟未披露实情2017.6.3 菜鸟和顺丰在中国邮政局主持下和解。,背后数据之争,顺丰:我的快递业务以商务件为主,不完全依赖淘宝件,且我从未放弃过电商,顺丰优选仍然是生鲜电商中的领导者,我不愿意将数据拱手让人。阿里(菜鸟):我已经拥有巨大的电商数据积累,要物流数据是为了客户服务体验和数据商业化,没有数据我这种轻资产公司就什么都不是了。,大数据是什么?,大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力

3、和流程优化能力的海量、高增长率和多样化的信息资产。简单一点的说,就是用现有一般技术难以管理的数据。,大数据的典型特征,Volume(容量)数据量大,包括采集、存储和计算的量都非常大。Variety(多样性)种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日 志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求 Velocity(速度)数据增长速度快,处理速度也快,时效性要求高。数据产生和更新的频率Value(价值)数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵Veracity(真实性)数据的质量,大数据的纬度,数据,技术,创意,个人数据,

4、比如A用户通过菜鸟从北京给远在上海的朋友B寄了一箱樱桃,首先最直观的就是发件/收件人的姓名、电话、住址,这个就锁定了两个人的基本数据。然后通过用户淘宝消费明细,我们发现A经常在某女装店买衣服,那么就出现第二个信息,A可能是女性。通过大量淘宝订单,阿里会发现,这个姑娘A经常购物的店是针对25-35女性的,可以得出结论A年龄为25-35岁。再通过电话反向检索淘宝/天猫数据库,发现姑娘A每月淘宝消费2000以上,可以基本判断出这是个中等收入小资。然后,再搜索余额宝,发现姑娘A还有18万块放在余额宝里面,哦哦,阿里现在知道这姑娘有闲钱。继续检索,发现姑娘A最近浏览了很多婴幼儿产品页面,都是针对新生儿童

5、的,得出结论姑娘要生宝宝了其他。,数据做什么?,能干的太多了,用户画像、精准营销、用户体验提升、决策辅助等等,我们就说说个简单的:用户画像上面整个过程中,系统已经给用户做了画像。姑娘A,家住北京,电话,地址,25-35岁,女性,消费能力中等,资产情况好,准备生小孩。,精准营销、体验提升,当这个姑娘下次打开淘宝的时候(手机/PC),系统页面自动会将下面产品放在首页:母婴用品,中高端(孕妇装、儿童装、纸尿裤、奶粉统统来一套)服装,中高化妆品,国内知名品牌。剩下的事情你懂得,淘宝页面可是很有限的,为了提高广告效率,你看把我家淘宝累成啥样了?所以卖货的筒子,赶紧掏钱啊,引流效果很好的。还可以这样:当姑

6、娘A登陆虾米音乐的时候,阿里就直接给他推送25-35岁女性的歌曲,顺便把A常听的歌曲也加入数据库。打开支付宝的时候,顺手推荐下理财产品,反正A也有闲钱,放着多浪费啊,来看看这些。顺手还能推荐一下儿童的0岁保险_.,对用户:不用打电话不用发问卷,不用骚扰用户,通过大数据抓取的信息我都清楚,用户想到想不到的,通通替用户想到,只说一句:您就掏钱吧,搁哪儿都要买,不是么。对商家:我知道谁需要你的产品,谁出的钱多,我就把谁的产品展示给用户,赶紧麻利掏钱,别跟我BB。那边的穷鬼死一边去。,数据挖掘是什么,数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(KDD)中的一

7、个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。,各种来源数据,数据库或者数据仓库,数据挖掘引擎,模式评估,用户界面,知识库,数据挖掘做什么,数据库技术,统计学,信息科学,可视化,机器学习,数据挖掘,概念性描述:用户画像;高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。,大数据不是最终答案,而是参考答案,千万不要神化了大数据。往往从神化到妖魔化只有一线之隔。记住,更大的数据是人类本身,在使用这一科技资源时要怀有谦恭之心,时刻铭记人性之本。,芝麻信用的数据来源,芝麻信用的数据来源,芝麻分,芝麻分,未来信用商业生态,华艺大数据,1.收集数据,收那些数据?2.数据收集完,怎么用?3.能否用这些数据解决问题?,谢谢,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号