早在几个月前就有朋友希望我讲讲R中caret包,其实该包蕴含了太多的数据分析和挖掘的功能,集成了上百种分类和回归算法。那会一直在安排和规划写这部分的内容...
前言这是2017年EasyCharts团队第一篇文章。我们是一支热爱数据分析与可视化的青年团队,更多精彩内容敬请关注我们的微信公众号!也祝大家新的一年里学习进步...
算法指的是进行计算、解决问题、做出决策的一套有条理的步骤。算法并不是单指某一次运算,而是运算时反复采用的方法。生物行为也是算法...
Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后...
其实这个方法比较新颖,自己本人也没怎么用过,看了不少文献,但是大多数都是枯燥公式推导;这里就写少量的简单公式求解,因为不写稍微长点话都不好意思发表...
在developer中运行图形时,报错:MicroStrategy Developer:Application-defined or object-defined error原因:安装developer时,ChartActiveX.ocx 没有被正...
Twitter是一个流行的社交网络,这里有大量的数据等着我们分析。Twitter R包是对twitter数据进行文本挖掘的好工具。 本文是关于如何使用Twitter R包获取twitte...
有关pandas模块的学习与应用主要介绍以下8个部分:1、数据结构简介:DataFrame和Series2、数据索引index3、利用pandas查询数据4、利用pandas的DataFrames进行...
Python是一门不错的动态语言,其应用的领域非常广泛,如web开发、Linux运维、数据挖掘、机器学习、爬虫、推荐系统等。在学完《廖雪峰Python2.7教程》感觉受益...
最近一直在看Python方面的知识,包括数据分析中常用的numpy、pandas、scipy等模块;数据库API接口,如常见的pymysql、pymssql等模块;爬虫方面所需要的urllib...
不论是数据分析,数据可视化,还是数据挖掘,一切的一切全都是以数据作为最基础的元素。利用Python进行数据分析,同样最重要的一步就是如何将数据导入到Pytho...
R语言是非常灵活的统计、制图、挖掘工具,基于已开发好的扩展包,可以使统计分析工作变得更加简单和快捷。然而,那么多的扩展包、那么多的函数该如何记忆和使...
文本分析的应用越来越广泛,这不,我的工作也开始涉及了文本分析,今天就讲讲关于评论数据的那点事。首先评论数据如何获取?一般通过网络爬虫的方式抓取各大...
一、文本挖掘定义文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前...
最近这两天刷微信,突然看到有说美国总统奥巴马在离任的今年却发了3篇文章,一篇在国际顶级期刊《Science》,一篇在国际顶级医学杂志《JAMA》,还有一篇在《...
人脸提供关于情绪的各种信息。 微软于2015年12月推出免费服务,分析人脸,进行情绪检测。 检测到的情绪是愤怒,蔑视,厌恶,恐惧,幸福,中立,悲伤和惊...
我们在windows系统上面使用R使用的好好的,那为什么要在Linux系统上面用呢?主要是一些东西不支持在Windows上面运行,比如说什么Hadoop,什么tensorflow的,...
在《 数据科学家成长指南(上) 》中已经介绍了基础原理、统计学、编程能力和机器学习的要点大纲,今天更新后续的第五、六、七条线路:自然语言处理、数据可视...
看下面三幅图,x 轴是房间面积,y 轴是房价。左图是 y = θ0 + θ1x 拟合数据集的结果。可以看到数据并不贴靠在直线上,所以拟合并不好。中图是 y =&...
今年大年初一同时有五部国产片同时上映,竞争异常惨烈,他们是西游伏妖篇 | 功夫瑜伽 | 大闹天竺 | 乘风破浪 | 熊出没之奇幻空间。《西游伏妖记》也以3.5亿创...