本教材由知了传课辛苦制作而成,仅供学习使用,请勿用于商业用途!如进行转载请务必注明出处!谢谢!

数据分析介绍

什么是数据分析:

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的目的有多种,概括起来有三种:现状分析、原因分析、预测分析。现状分析简单来说就是告诉你过去发生了什么。原因分析简单来说就是告诉你某一现状为什么发生。预测分析简单来说就是预测未来会发生什么。

数据分析步骤:

数据分析主要有六个过程:

  1. 需求明确:明确做数据分析的目标。为后面的分析过程做好铺垫。
  2. 数据收集:通过爬虫、商务合作的方式,获取想要的数据。
  3. 数据处理:对获取来的数据进行处理和清洗,把不需要的剔除掉,把需要的加工成我们想要的。方便后面的分析。
  4. 数据分析:根据自己的目的,以及现有的数据确定好分析的方法。
  5. 数据展现:将数据按照确定好的分析方法进行展示出来。
  6. 撰写报告:将分析的结果通过图表和文字的方式形成报告文档。

数据分析的误区:

  1. 分析目的不明确,为分析而分析:一定要找准自己分析数据的目标而去分析,比如是要了解现状,还是找出原因,还是预测未来发展等,千万不要为了分析而分析,这样就偏离主题了。
  2. 缺乏业务知识,分析结果偏离实际:分析数据的时候,一定要和公司的业务结合起来。如果脱离业务,即使数据分析方法再牛逼,图标再优美,也无济于事。
  3. 追求高级分析方法:一些人喜欢用一些高级的分析方法,认为只有这样才能体现专业性。其实高级的数据分析方法不一定是最好的,能够简单有效的解决问题的方法才是最好的。

数据分析的方法和工具:

数据分析可以通过工具,也可以通过代码来实现。以下分别列出这些常用的:

  1. 工具:Excel、Tableau、SPSS、百度图说等。
  2. 编程:Python语言、R语言、数据库的SQL语言、Excel的VBA语言等。

工具和代码该怎么选:

两者没有好坏之分,只有合适之分。数据分析总体来讲有两个模块,一个是数据处理,一个是可视化。如果数据已经经过处理了,并且手头上的软件可以直接非常方便的做可视化处理,那么我们用软件实现就可以。如果数据没有经过处理,那么最好通过Python或者R对数据进行有一些处理,然后再通过软件可视化。或者软件的可视化无法满足我们的要求,那么可以通过代码来实现。总而言之,工具功能无法100%的满足你的要求,但是效率高。代码做数据处理比较好,最数据可视化比较繁琐,但是DIY属性强!

6017人已阅读,今天你学习了吗?

2条回复
  • gutongjie2022-02-21 03:13:04

    知了课堂变成了知了传课!!!黄老师还是黄老师!

  • gutongjie2022-02-21 03:12:24

    重新开始看Pandas啦!!

添加新回复
目录