去除重复数据 - IT_KING - ITeye博客

`

king_tt

浏览: 2125760 次
性别:
来自: 深圳

最近访客更多访客>>

u012363178

liangjijiang

jacky_dai

ljmomo

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

2017-01 ( 5)
2016-12 ( 132)
2016-11 ( 17)
更多存档...

最新评论

wahahachuang5： web实时推送技术使用越来越广泛，但是自己开发又太麻烦了，我觉 ...
细说websocket - php篇
wahahachuang8：挺好的，学习了
细说websocket - php篇
jacking124：学习了！支持你，继续
初窥Linux 之我最常用的20条命令
aliahhqcheng：应该是可以实现的，没有看过源码。你可以参考下：http://w ...
Jackson 框架，轻易转换JSON

去除重复数据

阅读更多

有两个意义上的重复记录，一是完全重复的记录，也即所有字段均都重复，二是部分字段重复的记录。对于第一种重复，比较容易解决，只需在查询语句中使用distinct关键字去重，几乎所有数据库系统都支持distinct操作。发生这种重复的原因主要是表设计不周，通过给表增加主键或唯一索引列即可避免。

select distinct * from t;

对于第二类重复问题，通常要求查询出重复记录中的任一条记录。假设表t有id,name,address三个字段，id是主键，有重复的字段为name,address，要求得到这两个字段唯一的结果集。

-- Oracle、MySQL，使用相关子查询

select * from t t1

where t1.id =

(select min(t2.id)

from t t2

where t1.name = t2.name and t1.address = t2.address);

-- Hive只支持在FROM子句中使用子查询，子查询必须有名字，并且列必须唯一

select t1.*

from t t1,

(select name, address, min(id) id from t group by name, address) t2

where t1.id = t2.id;

-- 还可以使用Hive的row_number()分析函数

select t.id, t.name, t.address

from (select id, name, address,

row_number() over (distribute by name, address sort by id) as rn

from t) t

where t.rn=1;

分享到：

建立标准数据对照表 | 商业智能的基本概念

2016-12-29 13:02
浏览 245
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

去除重复数据,去除重复数据算法: 该算法是基于重复数据的一个简单的算法，适合各种语言，比网上的其他的算法简洁，更容易理解，算法，适合各种编程语言，如，数组，集合

ORACLE删除重复数据: ORACLE删除重复数据

易语言学习进阶去除重复数据源码: 易语言学习进阶去除重复数据源码。@资源源码站。

oracle中如何删除重复数据: oracle中如何删除重复数据,方便大家下载

OracleSQL实例-删除重复数据行留最新日期实例.pdf: OracleSQL实例-删除重复数据行留最新日期实例.pdf 学习资料复习资料教学资源

ORACLE去除重复数据方法: 使用ORACLE去除重复数据，这在日常数据处理中非常有用。

oracle数据库各种删除重复数据方法: oracle数据库各种删除重复数据方法

SQL Server删除重复数据的几个方法: SQL Server删除重复数据的几个方法SQL Server删除重复数据的几个方法

如何删除表中重复数据: 删除表中重复数据删除表中重复数据删除表中重复数据

数据库查询删除重复数据: 1、查找表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断 2、删除表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断，只留有rowid最小的记录

plsql删除重复记录: plsql删除重复记录

易语言学习进阶去除重复数据: 易语言学习进阶去除重复数据源码,学习进阶去除重复数据

删除表中重复数据sql语句: 删除表中重复数据sql语句绝对经典和详细太好了

基于MD5算法的重复数据删除技术的研究与改进: 重复数据删除技术中的关键技术MD5算法及改进

数据结构合并链表并去除重复数据.: 数据结构合并链表并去除重复数据. 将LLa,LLb链表合并后存入LLc升序，输出显示，最后再去除链表中重复数据去除重复数据

stata的清洗数据——去除重复数据: 文章目录stata清洗数据——去除重复数据方法stata中的_N和_n（是去重操作的基础）去重操作对单一列：id对两列（及以上）：date 和证券代码 stata清洗数据——去除重复数据方法 stata中的_N和_n（是去重操作的基础）...

删除重复数据的一种高效的方法(oracle): ORACLE删除重复数据的一种高效的方法.

批量删除重复数据,两个文档删除重复的部分: 用于两个excel文档中，删除重复的部分

oracle下如何删除重复数据的几种方法: oracle 数据库中重复的记录行的清理删除方法，总结了几种比较可行的方法路径并分析了方法的优劣

oracle中如何删除重复的数据: 我们可能会出现这种情况，某个表原来设计不周全，导致表...一、对于部分字段重复数据的删除先来谈谈如何查询重复的数据吧。下面语句能够查询出那些数据是重复的： select 字段1,字段2,count(*) from 表名 group

Global site tag (gtag.js) - Google Analytics