以数据为导向
  以内容为核心

至力于人工智能大数据平台!

数据挖掘与预测分析术语总结

数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。分析型客户关系管理(Analytical CRM/aCRM): 用于支持决策,改善公司跟顾客的互动 

2016-08-30

数据挖掘 可思数据

大数据应用:信用评分及模型原理解析

虽然人人都可以通过对借款方在Lending Club和Prosper上的历史借贷数据进行分析,但我相信,了解消费信贷行为、评分机制和贷款决策背后的工作原理可以帮助投资人更好的在市场中 

2016-08-30

数据挖掘 可思数据

数据挖掘之七种常用的方法

分类1、定义分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。2、应用它可以应 

2016-08-30

数据挖掘 可思数据

我的数据挖掘之路——从菜鸟到实战

由于本科专业是生物信息(可以理解为生物统计学或者与基因数据相关的数据挖掘学科),所以那时已经开始接触数据挖掘,对统计也算有一定的基础。记得大二的时候,我便开始学用matla 

2016-08-30

数据挖掘 可思数据

统治世界的十大算法

软件正在统治世界。而软件的核心则是算法。算法千千万万,又有哪些算法属于 “皇冠上的珍珠” 呢?Marcos Otero 给出了他的看法。 什么是算法?通俗而言,算法是一个定 

2016-08-30

数据挖掘 可思数据

如何系统地学习数据挖掘?

问题:如何系统地学习数据挖掘?虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法..,感觉知识跳跃比较大, 

2016-08-30

数据挖掘 可思数据

数据挖掘十大经典算法及各自优势

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank 

2016-08-30

数据挖掘 可思数据

数据挖掘算法与生活中的应用案例

如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、&ldquo 

2016-08-30

数据挖掘 可思数据

数据挖掘的聚类算法有哪些,各有什么优势?

比较分类算法的话,大概考虑这几个维度:时间空间复杂度,鲁棒性,参数敏感性,处理不规则形状,适合的类数量,类间差异(范围大小,样本个数,形状差异)可以参照一下sklearn网站给出的列表:2.3. 

2016-08-30

数据挖掘 可思数据

数据挖掘从入门到进阶,要看什么书?

做数据挖掘也有些年头了,写这篇文一方面是让我写篇文,朋友作为数据挖掘方面的参考,另一方面也是有抛砖引玉之意,希望能够和一些大牛交流,相互促进,让大家见笑了。Q&A:Q:学习,最近在 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南8:聚类分析

前几章我们学习了如何构建分类系统,使用的是已经标记好类别的数据集进行训练: 训练完成后我们就可以用来预测了:这个人看起来像是篮球运动员,那个人可能是练体操的;这个人三年 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南7:朴素贝叶斯和文本数

非结构化文本的分类算法在前几个章节中,我们学习了如何使用人们对物品的评价(五星、顶和踩)来进行推荐;还使用了他们的隐式评价——买过什么,点击过什么;我们利用 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南6:朴素贝叶斯和概率

还是让我们回到运动员的例子。如果我问你Brittney Griner的运动项目是什么,她有6尺8寸高,207磅重,你会说“篮球”;我再问你对此分类的准确度有多少信心,你会回答&ldq 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南5:进一步探索分类

效果评估算法和kNN让我们回到上一章中运动项目的例子。在那个例子中,我们编写了一个分类器程序,通过运动员的身高和体重来判断她参与的运动项目——体操、田径、篮 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南4:分类算法

第四章:分类在上几章中我们使用用户对物品的评价来进行推荐,这一章我们将使用物品本身的特征来进行推荐。这也是潘多拉音乐站所使用的方法。内容: 潘多拉推荐系统简介 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南3:隐式评价和基于物品

内容: 显式评价 隐式评价 哪种评价方式更准确? 基于用户的协同过滤 基于物品的协同过滤 修正的余弦相似度 Slope One算法 Slope One的Python实现 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南2:推荐系统入门?

你喜欢的东西我也喜欢我们将从推荐系统开始,开启数据挖掘之旅。推荐系统无处不在,如亚马逊网站的“看过这件商品的顾客还购买过”板块:last.fm上对音乐和演唱会的推 

2016-08-30

数据挖掘 可思数据

面向程序员的数据挖掘指南1:数据挖掘是什么?

在阅读本书之前,你可能会认为像潘多拉、亚马逊那样的推荐系统、或是恐怖分子用的数据挖掘系统,一定会非常复杂,只有拥有博士学位的人才能够了解其中的算法。你也许会认为设计 

2016-08-30

数据挖掘 可思数据

说说数据挖掘算法工程师的三重境界

文/不周山王国维的人生三重境界快被人们念叨烂了,资深文艺青年都已经不爱提这个,但把这种分法做个跨学科应用,倒是能看到一些新奇的东西。十一前帮新东家在北京做了一轮校园招 

2016-08-30

数据挖掘 可思数据

150道数据挖掘试题,你会多少?

单选题1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)
A. 关联规则发现
B. 聚类
C. 分类
D. 自然语言处理2. 以下两种描述 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(23)——C4.5

C4.5简介C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(22)——spark入门

Spark简介Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(21)——redis

什么是RedisRedis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。从2010年3月15日起,Redis的开发工作由V 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(20)——网站日志挖掘

收集web日志的目的Web日志挖掘是指采用数据挖掘技术,对站点用户访问Web服务器过程中产生的日志数据进行分析处理,从而发现Web用户的访问模式和兴趣爱好等,这些信息对站点建设 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(19)——什么是数据挖掘(下)

什么是数据仓库?数据仓库是一个面向主题的( Subject Oriented) 、集成的( Integrate) 、相对稳定的(NonVolatile) 、反映历史变化( Time Variant)的数据集合,用于支持管理 

2016-08-30

数据挖掘 可思数据

页次:9/10 每页25 总数248    首页  上一页  下一页  尾页    转到:
热点图文 更多