想着做一个特定方向的搜索引擎,比如只是搜索几个站点的搜索引擎,这样需要怎么样建设呢?
1
israinbow 2021-08-19 21:16:21 +08:00
谷歌搜索网站域名带个 site: 前缀.
或着自己爬网站做关键词查询. |
2
funet 2021-08-19 21:20:50 +08:00
https://www.kjsearch.com/
像跨境搜索这样吗? 跨境电商垂直搜索 |
3
sjmcefc2 OP @funet 嗯,是这样类似的。研究了一下这个,帮助打不开,关于打不开,搜索出来的都是知乎,不过确实想做的和这个很类似。
|
6
huabalance 2021-08-20 15:33:19 +08:00 via Android
谷歌搜索 yacy
|
7
Tianyan 2021-08-20 17:30:16 +08:00
自定义搜索啊
|
8
sjmcefc2 OP @huabalance 这个很好啊
|
9
sjmcefc2 OP 自定义搜索,这个怎么具体做呢
|
10
sjmcefc2 OP @huabalance 这个 可以搜中文吗
|
11
huabalance 2021-08-21 16:23:51 +08:00
@sjmcefc2 你为什么不试一下呢。。 可以搜。
|
12
sjmcefc2 OP @huabalance 安装使用了,能够中文。
但是好像一次只能执行一批爬虫任务,想着有了一个任务之后,在开始,就断掉了。 而且 HTTP ERROR 500 java.lang.OutOfMemoryError: Java heap space URI: /yacysearch.html STATUS: 500 MESSAGE: java.lang.OutOfMemoryError: Java heap space SERVLET: net.yacy.http.servlets.YaCyDefaultServlet-5dcb4f5f CAUSED BY: java.lang.OutOfMemoryError: Java heap space Caused by: java.lang.OutOfMemoryError: Java heap space |