没有规律的不同行内容,如何根据条件合并行内容

Power Query 天天吃鸡 ⋅ 于 2021-03-26 10:57:43 ⋅ 最后回复由 天天吃鸡 2021-03-28 17:05:07 ⋅ 2100 阅读

file
有几十万条数据,一条内容可能在一行上,也可能拆分到几行上,除日期列有规律外,其余列的行内容拆分基本没有规律(每列内容均可能被拆分为多行)。
日期列规律:1、如果日期+时间,表明内容均在一行上。2、如果第一行日期、第二行时间,第三行新的日期,表明内容拆分为2行。3、如果如果第一行日期、第二行时间,第三行或后续为空,表明内容拆分为多行。
目前采用添加索引列,添加列引用下一列的内容,然后合并列的方式,但该方式对于拆分为多行的处理起来很麻烦,且列数多了,处理起来非常慢。刷新一次要几个小时。
请问有什么好的办法,根据日期列进行条件判定,合并行内容么。

案例已上传至共享网盘:https://pan.pbihub.cn/index.php/f/1256

最佳答案
  • deadzlq 无我,亦无期
    2021-03-27 22:27:53

    PowerQuery参考解法

    file

回复数量: 8
  • 静静
    2021-03-26 15:08:55

    初步考虑 局部分组
    至于最终结果,你没有模拟,没揣测明白你的意图.

  • 静静
    2021-03-26 15:21:14

    file
    是这种结果吗?

  • 乘风
    2021-03-26 15:22:22

    最后四行要分成两组还是一组?

  • 天天吃鸡
    2021-03-26 19:56:12

    @静静 是的,将原本与日期在一行的(被拆分了)合并在一行内.

  • 天天吃鸡
    2021-03-26 19:56:47

    @乘风 不论几行,都合并成一行

  • deadzlq 无我,亦无期
    2021-03-27 22:27:53

    PowerQuery参考解法

    file

  • 天天吃鸡
    2021-03-28 11:30:18

    @deadzlq 谢谢大神,光想着时间这一列了,没注意到乙列其实有规律,拆解学习后收获满满。

  • 天天吃鸡
    2021-03-28 17:05:07

    原数据17万条,刷新了2个小时都没刷新出来(内存、固态硬盘一直满载)。我试着把没有拆分的(时间日期文本长度=18)筛选出来,只剩6万多条,再次刷新还是1个多小时都没加载成功。
    再次尝试优化:不全部一起刷新,而是将一个查询分成十个查询分别刷新,同时只将日期时间列文本长度不等于18的参与分组,处理完毕后再连接&筛选时间文本长度等于18的。

暂无评论~~
  • 请务必阅读并严格遵守《社区管理规范与使用说明》
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
  • 支持表情,使用方法请见 发送表情,可用的 Emoji 见 :metal: :point_right: Emoji 列表 :star: :sparkles:
  • 上传图片, 支持拖拽和剪切板粘贴上传, 格式限制 - jpg, png, gif
  • 不支持上传附件,请尽可能用文字和图片将问题描述清楚,如实在需要上传附件,可上传到 共享网盘 后分享链接
  • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空
  请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!
Ctrl+Enter