统计数据分析 统计数据分析工具
统计数据分析(统计数据分析工具)
Hello,亲们好,今天跟亲们分享下我们如何对excel进行数据清洗,将表格中的数据转变为便于我们统计分析的数据,让数据统计更加的快捷,准确
数据清洗说白了就是清洗掉无用的数据如表格中残缺的数据,合并的单元格,无用的字符,分离文本与数值,统一单元格格式等,而excel中的数据清洗经常是对表格进行的第一步操作,因为我们不能保证我们拿到的每一张表格都是规范的
很多时候会遇到这样的情况我们要花费大量的时间来清洗数据,而对数据的统计与分析的时间很少,这也就是我们常说的整理2小时,统计1分钟,下面跟亲们列举了几个我们工作中经常遇到数据清洗与整理的问题,可以快速提高的我们数据统计与分析的效率
一、清除表格中的空格空格是我数据表中的一个毒瘤,在我们拿到原始表后一定要先将表格中的空格清洗掉,因为如果单元格中有空格的存在,就会造成这两个数据我们看起来是一样的,但是excel会认为这是两个完全不一样的数据,比如在这里我们输入一个1然后在后面输入一个空格,然后在另一个单元格中输入1,让两者相等可以看到,他的结果是false,就证明excel认为这两个单元格的内容是不一样的,如下图
最常见的就是我们使用vlookup、sumif等函数的时候经常会遇到数据看起来一样,但是就是查找不到结果,遇到这样的情况我们可以使用替换来将表格中的空格批量的替换为空值,首先我们按Ctrl+H调出替换窗口,然后在查找值中输入一个空格,在替换为什么都不要输入,然后直接点击全部替换即可,这样的话就能将表格中的所有空格都替换为空值
二、删除数据中不可见字符不可见字符就是我们看不到的字符,在excel中常见的就是换行符,以及空格,当然了,不可见字符不仅仅包含这两种,不可见字符都包括:空格字符(Unicode字符集值32和160)与非打印字符(Unicode字符集值0到31、127、129、141、143、144和157),这些不可见字符常见于我们从erp中导出的数据报表,如果你确定表格中有想要查找的数据,并且没有空格的存在,但是还是查找不到数据的话,就可以考虑下是不是有不可见字符的存在,清除不可见字符,我们需要使用clean函数,
Clean函数:清除单元格中的不可见字符参数text:想要清洗的单元格
在这里需要注意的是,clean函数的参数只能选择一个单元格,如果说我们选择一个区域的话,就要先选择一个与原数据相等的区域,然后按住Ctrl+shift+回车三键填充数据才能得到想要的结果
如果你觉得这种方法比较麻烦,我们还可以使用分列来删除不可见字符,只不过使用这种方法,只能一列一列的进行数据的清洗,效率比较低下,好处的就是简单容易操作,不用添加新的数据区域,首选我们选择想要清洗的列,然后点击数据,选择分列,直接点击完成
三、一个单元格中仅输入一个类型的数据日常工作中,我们我们经常会遇到,或者说自己曾经制作过这样的的表格,就是将不同类型的数据输入到一个单元格中,如下图,文本与数值都输入在一个单元格中,这样的数据不利于我们对数据进行统计分析,我们还要提取数据,然后进行数据的统计分析,但是如果我们在一开始就能将表格设计为右边的表格,在最后分析数据的时候就会变得非常的简单
如果你在工作中真的拿到这样的表格,也不要怕,解决的办法很多,但是最简单的就是使用快速填充来提取数据,他的使用方法也很简单首先我们在数据旁边输入一个模板,然后按快捷键Ctrl+E即可完成数据的提取,比如在这里我们在旁边输入200,然后按Ctrl+E就能快速的提取到水果的销售重量,单价的提取也是这样的
工作中的数据提取类问题,快速填充一般都能提取到正确的数据,如果说你真的遇到这样的问题,第一个一定要想到他呀
四、删除无效的数据无效的数据种类很多,需要根据自己的实际数据进行数据的清洗,比如我们想以部门为类别统计部门人数,但是某个人的部门数据是空的,而这个就是一个无效的数据,我们就需要把它删除,或者他的部门这个数据比较模糊不能准确的表达出是哪一个部门的,我们也需要将其删除
有的时候我们不希望数据中存在重复值,这个时候就可以使用删除重复值来快速的将重复的数据删掉,首先选择要删除的数据区域,然后点击数据功能组,然后找到删除重复值,在列中选择以那一列为准判断重复,在这里我们选择的是项目,然后点击确定即可删除重复值
五、杜绝合并单元格原始表杜绝使用任何合并单元格,虽然合并单元格能让表格整体布局看起来更加的整洁,但是当我们对数据进行统计分析的时候,往往会因为合并单元格的使用造成错误的统计结果
使用合并单元格我们通常是将相同的数据放在一个单元格中,如果说你工作中真的遇到这样的情况我们可以使用 *** 条件,来取消合并的单元格并批量的填充数据,首先取消合并单元格,然后按Ctrl+G调出 *** 窗口,点击 *** 条件选择空值点击确定,然后在编辑栏中输入等于合并单元格区域的第一个单元格,按Ctrl+回车批量填充数据
以上五种类型就是我们工作中经常遇到的数据清洗的类型,当我们自己在制作标的时候一定要尽量的避免出现这几种情况,因为规范的数据我们拿来就可以直接进行数据统计,省去了数据清洗这一步骤,当然了如果我们拿到的是别人制作的表格,就只能一步一步的进行数据的清洗了