前言第一章主要讲的是hadoop基础知识。老师讲的还是比较全面简单的,起码作为一个非专业码农以及数据库管理人员,也能狗大致了解其特点首先是概括图(以hadoo...
这两个月没有写什么代码。也没做什么大项目,基本就是对以前写的那个用ggplot2可视化数据的项目做一些增增补补,大部分技术难关都在ggplot2和R语言EXCEL处理...
本文旨在介绍R语言中ggplot2包的一些精细化操作,主要适用于对R画图有一定了解,需要更精细化作图的人,尤其是那些刚从excel转ggplot2的各位,有比较频繁的作...
前言: 应用背景兼吐槽继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯。 这次的主题是论R与excel的结合,又称 论如何正确把EXCEL文件...
在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了《机器学习-实用案例解析》这本书。这本书是目前市面少有的,纯...
之前用rvest帮人写了一个定期抓取amazon价格库存,并与之前价格比较的小程序,算是近期写过的第一个完整的程序了。里面涉及了一些报错的处理。这里主要参考了...
在学完coursera的getting and Cleaning data后,继续学习用R弄爬虫网络爬虫。主要用的还是Hadley Wickham开发的rvest包。再次给这位矜矜业业开发各种好用的R...
补上第四周笔记,以及本次课程总结。第四周课程主要针对text进行处理。里面包括1.变量名的处理 2.正则表达式 3.日期处理(参见swirl lubridate包练习)首先,...
好久不写笔记了,年底略忙。。Getting and Cleaning Data第三周其实没什么好说的,一个quiz,一个project,加一个swirl。基本上swirl已经把第三周的内容都概括...
课程概述week2主要是介绍从各个来源读取数据。包括MySql,HDF5,webpage,API等,范围还蛮广。因为工作和日常中没有直接到数据库拿数据的权限,所以暂时只是走马...
课程概述Getting and Cleaning Data是Coursera数据科学专项的第三门课,有中文翻译。但是由于中文区讨论没有英文区热闹,以及资料积累,强烈建议各位同时选报...
经过周末一个半天的努力,终于把这次的Assignment3做出来,然后做完Quiz4,顺利结束R Programming这门课程。对这门课的综合吐槽就是,Roger老师的github头像...
完成R Programming第三周这周作业有点绕,更多地是通过一个缓存逆矩阵的案例,向我们示范【词法作用域 Lexical Scopping】的功效。但是作业里给出的函数有点...
---好久没发博客且容我大吼一句终于做完这周R Programming的作业了!之前一直有报coursera的课程,但是总是没有坚持下去,这次收到他们的邮件推广,说data sc...
综上第一次写access学习笔记是8月19号的事情,现在已经10月31号以下是之前的笔记目录: http://www.flybi.net/blog/weibaar/2948 http://www.flybi...
距离之前的三篇日志已经很久啦,今天终于完成了一个比较完整的自动化报表搭建过程基于公司数据保密原则,样板就不放到网上来了,简单说一下背景:这次access...
入门书籍:R语言实战进度:1-4章摘要:1)实用的包forecast:用于做时间序列预测的,有auto.arima函数RODBC:可以用来读取excel文件。但据说R对csv格式适应更加...
老家在广东,工作在上海的后果就是,每年大概回两次家,国庆和春节。县城电商观察结果是:1,物流速度加快,电商巨头布局珠三角地区速度加快,但县城广告仍需...
纪念一下,在心心念念想从会计本科转为数据分析师快两年后,近期终于迈出了使用R的第一步,在参考他人的例子前提下,成功写了几行代码。用成本的角度来说,省...
在搭了一个数据库后,买了一本《让excel飞》,里面有提及access经过研究之后,发现access+excel的结合确实能解决我的大部分难题,并且可以做得更好。比较好的...