近期,和小伙伴们一起组织了疯狂数据分析小组,通过有计划的输入,每周总结一篇数据类文章,分别投稿到疯狂数据分析专题,并坚持一年时间,具体计划请看零基...
已经开始数据分析工作的同学,大都知道从数据库中取数、查数是常见的工作内容,而理解查询的顺序之后,能够帮助我们更好排查出现的错误,还能优化SQL的执行速...
这是总结SQL知识点的第二篇文章,一次只总结一个知识点,尽量说明白。上次我们谈到行转列,用的是Pivot函数,这次我们来谈谈Unpivot函数。(这里是用的数据库...
记录下近来的想法,当有些想法的时候,人一下子可能会规划的很多,说要做个还有那个,然后还可以做那个,睡了一觉之后,发现好难啊,干脆直接放弃了。所以近...
2017年12月8日,做了第一份数据工作-----数据挖掘,后来和转行数据分析的同学组建讨论群,不知不觉中都有242人了(2019年1月5日316人)群内成员虽来自各行各...
未来的一个月时间中,会总结一系列SQL知识点,一次只总结一个知识点,尽量说明白,下面来说说SQL 中常用Pivot 函数(这里是用的数据库是SQLSERVER,与其他数...
Content List:Case When CROSS JOIN (U-SQL)Cross Apply And Outer ApplyQuerying XML fields using t-sql一:Case Whencase expression has two formats:sim...
装饰器阅读顺序:函数引用函数闭包装饰器(最好先阅读上面的两个)1.函数引用2.函数闭包闭包3.装饰器背景:一般公司中,一项开发任务都是好多程序员协作完成...
我们原来一直看的文章,大都是在讲机器学习原理、如何构造特征、如何调参之类的,但是实际中模型是如何进行部署的呢?下面的这篇文章就是在讲用Flask框架进行...
为了用python实现mapreduce,我们先引入下面两个个知识sys.stdin()itertools之groupbysys模块的简单学习sys.stdin 是一个文件描述符,代表标准输入,不需使用...
看了看上次更新文章的日期,已经是近两个月前了,这期间的两个月自己做了什么呢?自己接触了下面的几件事情:又加入了一个社群,一个探讨互联网如何进行营销...
——背景——近来,想把学习过的机器学习算法做一个总结,于是打算结合网上的面试经验和工作的需求写下一个机器学习系列文章。这里是更多是参考网上以及书本中的...
马上快过年了,公司(乙方)把很多新的项目也都放到了年后,领导说趁着时间有些空闲让我们赶快充电,也对我们加强了培训(业务方面和技术方面)。于是就想着...
阅读路线:Hadoop与Spark比较Spark的安装Spark知识点一、Hadoop与Spark比较1.简单的比较刚开始学习Spark的时候,自己总是会想当然的理解两者之间的关系。Hadoo...
由于这两天所做的项目涉及到了文本分析的内容,并在处理脏乱文本(就是做一个词云图,要把英文、一些标点符号之类的给清除掉)时使用了正则表达式,所以特别来...
这篇文章主要是自己的学习总结,阅读路线如下:理解API理解Restful API 理解装饰器理解Flask框架使用Python Flask 实现Restful API API的理解API(application...
还记得上个月的时候,准备学习机器学习的知识,想着线性回归模型较简单一些,那就从它开始吧。可是仔细一看里面的知识包括矩阵、极大似然函数、求导等方面的...
看到好多人都分享了如何成功转行数据分析工作的文章,确实能让我们有了别人能够做到,我们也能做到的信心。在大家对转行数据分析工作有信心并努力的同时,也...
这篇文章讲述的是Kaggle上一个赛题的解决方案——Titanic幸存预测.问题背景是我们大家都熟悉的【Jack and Rose】的故事,豪华游艇与冰山相撞,大家惊慌而逃,可...
首先说明这篇文章的数据来源,是爬虫拉勾网"数据分析师"这一职位信息所得来的。并且主要分析了数据分析师总体薪酬情况、不同城市薪酬分布、不同学历薪酬分布...