目前遇到一个需求,应该是大数据处理范畴,不过我没有做过类似需求,看看各位有没有什么好的解决方案推荐
就是要实现图中的 taskA 、taskB 、taskC
技术栈是 JAVA
1
9113946 2023-05-29 09:14:39 +08:00
spark sql 轻松解决
|
2
xiangagou 2023-05-29 09:53:08 +08:00
看你的数据量和具体需求喽,大数据那套可以做,Java 自己处理数据也可以做.大数据主要搭起来麻烦,写写脚本都是比较简单的.
|
3
bk201 2023-05-29 09:55:08 +08:00
看你的图和大数据好像没啥关系。
|
4
bugmakerxs OP @xiangagou 每天 100w 左右数据要处理,要考虑并行和水平扩容提高处理效率的话,感觉直接写代码会比较麻烦,,,process1~processN 之间也可能有相互依赖。flink 那套不知道能不能一把梭
|
5
xiangagou 2023-05-29 10:34:24 +08:00
@bugmakerxs flink 能搞得.我看了下 es 的 sink 端官方有的,source 端没有需要自己处理.
|