00:00 / 01:40
连播
清屏
智能
倍速
点赞62
00:00 / 06:55
连播
清屏
智能
倍速
点赞3
数据不准,分析全白搭!今天来聊聊怎么用数据清洗搞定数据问题。 拿到少一半或乱码数据是没做好数据清洗的问题 数据清洗删重复补缺失纠错误核心解决数据缺失值数据值不匹配数据重复数据不合理数据字段格式不统一数据无用六个问题的要点 数据缺失值遇到空值算缺失比例结合重要性处理不重要且缺失率高删字段重要且缺失率还行补全简单用经验推测或算均值中位数复杂用相关指标推缺失率高又重要找业务同事重新取数的要点 数据值不匹配字符不对劲用半自动校验加人工筛查内容不对搞清解析错还是记录出错分类处理人工检查要细的要点 数据重复完全一样记录去重留一主体相同属性值不同三种情况别去重分析数据演变规律样本不均衡补数据检测业务规则漏洞的要点 数据不合理离群值用分箱聚类回归方法找出人工判断后处理的要点 数据字段格式不统一多来源数据整合时统一格式的要点 数据无用除非明确不需要否则别瞎删的要点 数据清洗能提升数据质量让分析结果靠谱看清业务情况降低存储成本保证数据时效性但手动清洗费人力数据量大麻烦的要点 FineDataLink 低代码操作搞定数据抽取清洗到目标库全流程连接各种数据源有高级功能团队协作效率高的要点 #数据清洗 #数据质量 #FineDataLink #数据整合 #低代码平台 @DOU+小助手
00:00 / 02:04
连播
清屏
智能
倍速
点赞2
00:00 / 02:27
连播
清屏
智能
倍速
点赞412
00:00 / 01:50
连播
清屏
智能
倍速
点赞12
00:00 / 15:00
连播
清屏
智能
倍速
点赞53