资料分析的时代已经到来。从国家,-,企业到个人,大资料和资料分析已成为每个人都熟悉的趋势。但是您可能没有资料分析和程式设计的专业知识,或者您已经学习了很多关于资料分析的理论,但您仍然无法实践它。在这里,我将比较最受资料分析师欢迎的四种工具,Excel,R,Python和BI,作为开始资料分析的基础。

1. Excel
1.1使用场景
一般办公室要求下的资料处理工作。中小型企业的资料管理和储存。对学生或教师进行简单的统计分析(如方差分析,回归分析等)。结合Word和PowerPoint来建立资料分析报告。资料分析师的助手工具。为一些商业杂志和报纸制作图表(资料视觉化)。1.2优点
使用Excel很容易。学习资源非常丰富。您可以使用Excel做很多事情:建模,视觉化,报告,动态图表等。在进一步学习其他工具(如Python和R)之前,它可以帮助您理解许多操作的含义。1.3缺点
要完全掌握Excel,你需要学习VBA,所以难度仍然很高。当资料量很大时,就会出现口吃的情况。Excel资料档案本身在没有其他工具的帮助下只能容纳108万行,并且它不适合处理大规模资料集。内建的统计分析过于简单,几乎没有实用价值。与Python,R和其他开源软件不同,真正的Excel需要付费。2. R
2.1使用场景
R的功能几乎覆盖了需要资料的任何区域。就我们的一般资料分析或学术资料分析工作而言,R可以做的事情主要包括以下几个方面。
资料清理和资料缩减。网页抓取。资料视觉化。统计假设检验(t检验,方差分析,卡方检验等)。统计建模(线性回归,逻辑回归,树模型,神经网络等)。资料分析报告输出(R降价)。2.2 R易于学习吗?
从我的角度来看,开始使用R非常简单。10天的集中学习足以掌握基本用途,基本资料结构,资料汇入和汇出以及简单的资料视觉化。有了这些基础,当您遇到实际问题时,您可以找到您需要使用的R包。通过阅读R的帮助档案和网络上的资讯,您可以相对快速地解决特定问题。
3. Python
3.1使用场景
资料抓取。资料清理。资料建模。根据业务场景和实际问题构建资料分析算法。资料视觉化。资料探勘和分析的高阶领域,例如机器学习和文字挖掘。3.2 R与Python
R和Python都是需要程式设计的资料分析工具。不同之处在于R仅用于资料分析领域,而科学计算和资料分析只是Python的应用程序分支。Python还可用于开发网页,开发游戏,开发系统后端以及执行一些操作和维护工作。
目前的趋势是Python正在赶上资料分析领域的R. 在某些方面,它已超过R,例如机器学习和文字挖掘。但R仍然在统计领域保持优势。Python在资料分析中的开发已经在很多地方模拟了R的一些特性。所以,如果你还是新手,还没有开始学习,我建议你从Python开始。
Python和R都很容易学习。但是如果你同时学习两者,那将会非常混乱,因为它们在许多地方非常相似。所以建议不要同时学习它们。等到你掌握了其中一个,然后开始学习另一个。
3.3选择R还是Python?
如果由于时间有限而只能选择其中一个来学习,我建议使用Python。但我仍然建议你看看两者。在某些地方你可能会听到Python在工作中更常用,但解决问题是最重要的。如果你可以使用R有效地解决问题,那么使用R.实际上,Python模仿了R的许多功能,例如Pandas库中的DataFrames。正在开发的视觉化软件包ggplot模仿了R中非常著名的ggplot2。
BI
资料分析中有一种说法:文字不如表格好,表格不如图表好。资料视觉化是资料分析的主要方向之一。Excel的图表可以满足基本的图形要求,但这只是基础。高阶视觉化需要程式设计。除了学习R和Python等程式语言之外,您还可以选择简单易用的BI工具。有关BI的介绍,您可以阅读我的另一篇文章, 我应该学习哪些资料分析工具作为资料分析师开始职业生涯?
商业智慧诞生于资料分析,它诞生于一个非常高的起点。目标是缩短从业务资料到业务决策的时间。它是关于如何使用资料来影响决策。
BI的优势在于它在互动和报告方面更胜一筹。它擅长解释历史资料和实时资料。它可以极大地解放资料分析师的工作,提升整个公司的资料意识,并提高汇入资料的效率。市场上有很多BI产品。他们的原则是通过连线和钻孔尺寸来构建仪表板,以获得视觉化分析。





























