V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ddup  ›  全部回复第 35 页 / 共 38 页
回复总数  745
1 ... 27  28  29  30  31  32  33  34  35  36 ... 38  
@kwklover 你想迁移我可以帮你提供一些迁移问题支持,我参考了这篇文章给我节省了不少时间,http://www.cnblogs.com/vveiliang/p/7409825.html

其它的在笔记里面有点乱,没整理。
@kwklover 应该不会太多时间,我的 项目用了 lucene .NET 从以前的 .NET Framework 移植到了 .NET Core,性能有不少提升。
挺顺利的,唯一比较花时间的是 Mvc 框架微软重写了,而我的框架对 Mvc 做了深度调用,花了 2 天时间,其它都没啥。
总共 3 天迁移完毕,你的搜索我看了,我的那个框架+项目比你这个搜索项目大多了。
2018-10-02 09:33:45 +08:00
回复了 kwklover 创建的主题 程序员 有没有哪位 V 友用 lucene 做上亿数据量的搜索的?
嘛,有个思路,数据库表水平切分了解吧? lucene .NET 也给他索引水平切分,1 一条数据,给他分 100 个索引库索引,搜索的时候并发搜索,然后合并结果,根据 score 得分排序一下。
东西不错,通过绿色化的配置,使得现有的网站具备搜索引擎搜索功能!
可以考虑升级到 .Net Core,这样跨平台用户量多些。
还可以把使用 Lucene .NET 的项目,都作为你的目标客户,你的这个搜索做的通用一点,方便的接入到别人项目里面。
2018-10-02 02:12:14 +08:00
回复了 kwklover 创建的主题 程序员 有没有哪位 V 友用 lucene 做上亿数据量的搜索的?
牛逼,是用的 lucene.NET 版本?
@hyf278 等试用的人多了就搞个内测群! V2EX 是首发,我之前 QQ 设置有问题导致很多人没加上,看到的再加下!
@ruri Everything 貌似没有开源,作者仍在考虑中,但是还没有开源 https://www.voidtools.com/forum/viewtopic.php?f=4&t=6169
还是信任度的问题~
@idcspy 加你了~
@sunwei0325 这个我用过,调用的也是 macOS 自带的全文搜索,macOS 自带的搜索已经不错了,不过就是有时候搜到了但是不确定是不是,因为它没有像搜索引擎一样对文章里面的内容提取高亮,所以会不知为何出来这个结果,另外就是容错性不高,打错字搜不出。
可以说 macOS 用户不是很需要这个,有则更好,Windows 用户更迫切一些。由于我用的是 macOS,顺便兼容了 macOS,就这样。
@galaxyyao 非常谢谢提供,Windows 的 API 用好了确实事半功倍,项目里就有用一些 Windows API 效率很好,这个 Search SDK 我们会评估一下效果好会整合的,非 Windows 平台则降级处理之~
不过应该会稍后一些,目前还要打磨产品功能。再次感谢!
2018-09-29 23:50:04 +08:00
回复了 fy 创建的主题 分享创造 Python3 实现的社区系统 Icarus v1.1,也请大家找找 BUG
界面不错啊!
@winglight2016 我电脑上有 Java,来,我们混搭一下
@winglight2016 嘛,看来你基本上整个帖子都浏览了一遍了~虽是 .NET Core,但是 self contained 编译过后,在客户机上运行是不需要装运行时的,直接就能 run,内存占用也很小,索引生成过程中稍大些,完毕后 70MB 不到,其中大约还有 15MB 是加载到内存中的词库。
@godgrp 嗯,开源确实能打消部分人的疑虑,不过剪切板功能也是可选的,时间会积累信任度的吧~国外开源商业产品笔记多,国内,还真没看见几个,可能是国内开源被抄袭了,打官司也打不赢吧,不像国外,官司一打一个准,开源了仍然可以保护自己,所以他们可以放心开源。。。我是这么猜的,有懂的人不对之出请扶正。
@hiyouli 那这样的话用的是什么开源协议呢?
@yu1u 不在贵州,只是在贵阳那边出差过很长一段时间~贵州风景好啊!生活节奏也慢!
@csx163 了解了,你 QQ 多少,等我们图像识别功能出来我告知你,或者你加我上面 QQ。
我只是一枚干得久一点的程序员,在贵州出差过很长一段时间~
@csx163 支持图片 pdf 考虑过,目前还没有,想了解下你的应用场景,是不是图片 PDF 是合同之类的扫描件?
@hiyouli 嗯,开不开源还没定,也有一些开源的软件商业化运作的很好,只是我还是很不清楚开源商业化的运作模式,更主要是怕开源了被同行秒抄袭,还没发展起来就出了很多山寨版。
1 ... 27  28  29  30  31  32  33  34  35  36 ... 38  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2226 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 07:42 · PVG 15:42 · LAX 00:42 · JFK 03:42
Developed with CodeLauncher
♥ Do have faith in what you're doing.