1
someonedeng 2022-08-15 11:06:51 +08:00
按批次 select 出来塞线程池跑就好了
|
2
lmshl 2022-08-15 11:26:56 +08:00
1. 选一个 reactive stream 库(比如 akka-stream )
2. 数据源(例如 jdbc )包装为 stream source (一般 reactive stream 已经有包装好的) 3. 在 mapAsync(parallelism = <根据你的网络与综合性能设定的并行度>) 中实现你的 http download (推荐 akka-http ) 逻辑 4. 把它润起来 优点是不需要管理线程池,全程异步,如果网速不快的话,那 CPU 会很低。如果网速足够快,CPU 也不会浪费在无意义的上下文切换 |
3
java253738191 2022-08-15 11:41:20 +08:00
datax+udf
|
4
qwer666df OP |
5
someonedeng 2022-08-15 22:23:56 +08:00
@qwer666df 50 万行又不多,随便搞搞就好了
|
6
letitbesqzr 2022-08-15 22:32:09 +08:00
50 多万 就别折腾了... 那些复杂的流程写完以后.. 开多线程都已经下完了
|
7
yuuyoo 2022-08-18 11:24:23 +08:00
导入迅雷批量下载
|