当前位置:网站首页>海量数据TopN问题
海量数据TopN问题
2022-07-28 09:54:00 【Schuyler_yuan】
1. 在十万的数字中找出前100?
答:快排patition+二分,堆
2. 10亿的数字找前10万,空间给1亿?
答:(分治法加堆),时间复杂度klogk
3. 100亿数字找前10亿,空间1亿?
答:这个问题不是算法问题了,应该是在问工程上的实现,基本得靠切分到多台机器并行运算来解决,具体怎么做,看下那个64马找前四的问题。
总之,对于海量数据问题,都是用的“map-reduce”的思想来分而治之,分开局部处理,之后再汇总起来计算。
参考:
海量数据中的TOPK问题小结 - Excaliburer - 博客园
边栏推荐
- [esp32][esp idf] esp32s3 quickly build lvglv7.9
- In retaliation for the dismissal of the company, I changed all code comments of the project!
- PHP Basics
- OSPF的LSA及优化
- In php7?? And?: Differences between
- MySQL 为什么有时候会选错索引?
- Several innovative economic models of platofarm have inspired the current metacosmic market
- Redis面试题必知必会
- 2022-uni-app解析token标准的方式-使用jsrsasign-爬坑过了
- Xiao Hei stands up again and looks at leetcode:653. Sum of two IV - enter BST
猜你喜欢

Pycharm uses CONDA to call the remote server

19. 删除链表的倒数第 N 个结点

Flink - checkpoint Failure reason: Not all required tasks are currently running

Xiao Hei stands up again and looks at leetcode:653. Sum of two IV - enter BST

B2B2C系统亮点是什么?如何助力珠宝首饰企业打造全渠道多商户商城管理体系

每天在岗不足8小时被辞?腾讯前员工追讨1300万加班费等,法院终审获赔9万

二分、三分、01分数规划 【第I弹】

ES(8.1)认证题目

Arthas tutorial

深度学习必懂的 13 种概率分布
随机推荐
这种动态规划你见过吗——状态机动态规划之股票问题(中)
Deepin 下安装 LAMP
[esp32][esp idf] esp32s3 quickly build lvglv7.9
2022-uni-app解析token标准的方式-使用jsrsasign-爬坑过了
每天在岗不足8小时被辞?腾讯前员工追讨1300万加班费等,法院终审获赔9万
Sizebasedtriggingpolicy introduction
OSPF expansion configuration, routing principles, anti ring and re release
Seektiger eco pass STI new progress, log in to ZB on April 14
Arthas tutorial
广州地铁14号线新市墟站开建,白云区居民即将开启双线换乘模式!
Espresso systems, which has just obtained financing, has both intellectual property rights and team ethics in trouble
Experiment 4 uses fdisk to manage hard disk
pkg打包node工程
[esp32][esp idf] ap+sta realizes wireless bridging and transferring WiFi signals
Introduction to thresholdfilter
Today, I want to talk about the data types of MySQL database
二分、三分、01分数规划 【第I弹】
Winform 生成随机验证码
Install lamp under deepin
头文件库文件