数据分析工具提供直观的方法来清理、转换和理解查询数据,例如关键统计信息和分布。 此外,通过使用 “计数行” 命令,还可以获取所有查询数据的行计数。
默认情况下,Power Query对前 1,000 行的数据进行分析。 若要更改配置文件以对整个数据集进行操作,请在编辑器的左下角选择 “基于 1000 行的列分析 ”或 “基于整个数据集的列分析”。
-
若要打开查询,请找到以前从Power Query 编辑器加载的查询,在数据中选择一个单元格,然后选择“查询 > 编辑”。 有关详细信息,请参阅在 Excel 中Create、加载或编辑查询。
-
选择“视图”。
-
在 “数据预览 ”组中,选择要显示的一个或多个元素:
下面是有关可用统计信息的更多详细信息以及可以执行的其他步骤。
快速命令
若要在查看配置文件时进一步清理数据,单击“ 更多 (...”时,可以使用以下命令 ) 各个对话框的右下角:“保留重复项”、“保留错误”、“删除重复项”、“删除空”、“删除错误”和“替换错误”。 有关详细信息,请参阅 保留或删除重复行、 删除或保留包含错误的行和 替换值。
列质量
在三个类别的条形图中显示指示关键百分比的数据配置文件:有效 (绿色) 、错误 (红色) 、每个列的空 (深灰色) 。
将鼠标悬停在显示器上可查看摘要放大。 选择“ 更多 (...”) 以执行其他命令。
提示 如果尚未在功能区的 “数据预览 ”组中设置选项,则可通过右键单击深灰色细条,然后选择“ 显示质量列峰值”,快速查看列质量配置文件数据。 还可以快速复制数据值。
列分布
显示每列下的频率和分布的可视化效果,并按频率最高的值降序排序。
将鼠标悬停在项目符号项上可查看摘要放大。 选择“ 更多 (...”) 以执行其他命令。
列配置文件: 列统计信息和值分布
显示每个列及其关联的统计信息的更全面视图。
提示 在最右侧选择“更多 (...”) 复制数据。
此外,还可以执行以下操作:
-
将鼠标悬停在图中的每个条形图上可查看更多详细信息。 若要筛选该条形图,请选择“ 等于 ”或“ 不等于”。 有关其他命令,请选择“ 更多 (...”) 或右键单击栏。
-
在最右侧,选择“ 更多 (...”) ,选择“ 分组依据”,然后选择其他命令,这些命令因数据类型而异。
可以继续与图表中的单个值交互。
通常,你希望查看获取数据后返回的行数。 “计数行”命令返回数据的实际行计数,不受“列配置文件”设置的影响。
-
若要打开查询,请找到以前从Power Query 编辑器加载的查询,在数据中选择一个单元格,然后选择“查询 > 编辑”。 有关详细信息,请参阅在 Excel (Power Query) 中Create、编辑和加载查询。
-
选择“ 转换> 对行进行计数”。
-
(可选)选择“数字工具”下的“转换”选项卡,然后选择“转换为表格”或“转换为列表”,以便将结果加载到工作表。
-
(可选)使用 转换 组中的各种数字命令。 有关详细信息,请参阅 基于数据类型添加列。