当前位置:网站首页>SQL教程之6种鲜为人知的 SQL 技术,可帮助您每月节省 100 小时
SQL教程之6种鲜为人知的 SQL 技术,可帮助您每月节省 100 小时
2022-06-21 18:45:00 【知识大胖】
在八年的数据职业生涯中,我依靠一些简单但鲜为人知的 SQL 技术为自己节省了无数时间来执行分析和构建 ETL 管道。
在本文中,我将反复分享六个:
- 从表中查找和删除重复记录
- 从表中查询最近的一组记录
- 在每月或每周开始/结束的级别汇总每日数据
- 聚合自定义(CASE WHEN)类别的数据
- 在同一张表中找出今天和昨天(或任何两个日期)之间的差异
- 将一个表中的数据合并到另一个表中(简单的方法)
- 监控每天向表中添加多少新记录。
- 识别在“快照”表中的两个日期之间添加的新记录
从表中查找和删除重复记录
with x as (select *, row_number() over(partition by [key],[key],[key] order by [key]) as rowRank from {schema}.{table})
select * from x where rowRank > 1;
没有什么比重复更糟糕的了。可怕的重复记录给我的数据生命周期带来了巨大的痛苦。重复几乎会弄乱任何分析或仪表板——尤其是那些不会因为简单的 DISTINCT 子句而消失的分析或仪表板。有多种方法可以识别重复项——但我发现上面的例子是最简单的。
只需将主查询包装在 CTE 中,然后在您希望检查的所有变量之后,添加一个row_number函数,该函数在所有表键上进行分区。分区必须包含所有表键才能正常工作,否则您可能会将非重复项分类错误。row_number函数在这里所做的是对您提供的键的所有实例进行排名。在您的 CTE 之后,运行一个简单的选择和过滤 WHERE 您的新row_number函数 字段大于 1。输出将返回所有重复记录 - 因为任何rowRank > 1的记录在表中都
边栏推荐
- Custom code template
- JMeter thread duration
- Harbor高可用集群设计及部署(实操+视频),基于离线安装方式
- Point cloud to depth map: conversion, saving, visualization
- 第十七届全国大学 RT-Thread创新专项奖
- 简单使用JS
- Implementation of assembly language greedy snake and Tetris dual task design (II) -- detailed design of greedy snake
- 国标设备注册EasyCVR平台,如何修改设备在离线状态判断的时间?
- pfSense配置TINC站点至站点隧道教程
- 《跟老卫学 HarmonyOS 开发》:以父之名·码力全开!写段HarmonyOS祝父亲节
猜你喜欢

最高月薪17K,只要心中有一片希望的田野,勤奋耕耘将迎来一片翠绿~

pfSense配置TINC站點至站點隧道教程

高等代数_第9章:线性映射

贪吃蛇游戏项目完整版

某大厂第二轮裁员来袭,套路满满

SQL语句知识点有哪些

jmeter线程持续时间

RPA financial process automation | Shanghai Pudong Development Group and cloud expansion technology accelerate financial digital operation
![[dry goods knowledge] redis: from the application to the bottom, one article will help you](/img/d3/084f6e69f7196d9e10c98bdfe71e1c.png)
[dry goods knowledge] redis: from the application to the bottom, one article will help you

Rough reading of targeted supervised contractual learning for long tailed recognition
随机推荐
Flink CDC MongoDB Connector 的实现原理和使用实践
Excuse me, the exclusive resources in data integration can not connect to some databases normally. The following reasons do not seem to be true. Public funds
Software testing office tools recommendation - Desktop Calendar
BTC投资者损失预计达73亿美元!“割肉式”抛售来袭?加密寒冬比预期更冷、更长!
Summary of methods for NSIS to run bat
mysql如何实现分组求和
Linear model and decision tree of machine learning
Delete the penultimate node - linked list topic
1157 Anniversary
點雲轉深度圖:轉化,保存,可視化
Rough reading of targeted supervised contractual learning for long tailed recognition
Big Fish eating Little Fish Games version complète
How MySQL implements grouping sum
京东39岁“毕业生”被裁一周就找到新工作,涨薪20%!
【CVPR2022】CMU《多模态机器学习》教程,200+页阐述表示、对齐、推理、迁移、生成与量化六大挑战的多模态学习系统知识
Implementation of assembly language greedy snake and Tetris dual task design (II) -- detailed design of greedy snake
第十七届全国大学 RT-Thread创新专项奖
I remember that procedure cannot be written in maxcomputer. If you want to use Oracle procedure
函子(Functor)
JVM memory structure