V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  weofuh  ›  全部回复第 1 页 / 共 2 页
回复总数  31
1  2  
63 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
是不是可以先从这 192G 文件里提取 1 ~ 100M 出来,分析下热点词什么的,再看有什么规律、共性
C V 工程师 => tab 回车 工程师
67 天前
回复了 guiyumin 创建的主题 程序员 写代码真不能有洁癖
时间充裕的情况下,感觉也没什么不好吧。按照你的描述,至少深度思考也实践过了。可以先提交一版再修改
如果全小写、中文都能匹配,我能想到的实现方案也就是只有 4 楼的了,用 edge_ngram 分词 和 match_phrase_prefix 前缀匹配查询,只是性能可能不太好,哈哈哈
看新版 8.x 文档有支持类似驼峰分词
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-word-delimiter-graph-tokenfilter.html

默认是的标准分词器是按空格、点这些进行分词

另外,好像搜索和构建索引可以使用不同的分词器和过滤器
161 天前
回复了 omz 创建的主题 生活 V 友有去黑头成功案例吗?
最近有试用 凡仕林 去黑头撕拉面膜,有点效果
但感觉顽固黑头还是去不掉,只能不那么明显
自我感觉对鼻炎还是有用的

用过手动和几款电动的,还是电动的方便,目前在用的 德国碧乐士
每次用完里面不会剩下水,这个我觉得很棒

买个测温贴纸(或者温度计也行?), 控制好水温 38 度左右
第一次试用之前,先练习下张嘴用口呼吸,控制住鼻子不进气
代码注释写详细点,再搞个工具,把注释提取出来就是文档了,哈哈哈哈。

"写代码为低级工作,确定业务为高级工作" 个人觉得这个没啥毛病吧,前提是能真的确定好
252 天前
回复了 basncy 创建的主题 宽带症候群 求 sing-box 多出口按 IP 分流的配置
不是很懂,不知道这样写可不可以

{
"log": {},
"dns": {
"strategy": "prefer_ipv4",
"servers": [
{
"tag": "local-dns",
"address": "https://localhost:8443/dns-query",
"detour": "direct"
}
],
"rules": []
},
"inbounds": [
{
"type": "tun",
"tag": "tun-in"
}
],
"outbounds": [
{
"type": "vless",
"tag": "vless-jp"
},
{
"type": "ss",
"tag": "ss-go-home"
},
{
"type": "ss",
"tag": "ss-ru"
},
{
"type": "dns",
"tag": "dns-out"
},
{
"type": "direct",
"tag": "direct"
},
{
"type": "block",
"tag": "block"
}
],
"route": {
"final": "direct",
"rules": [
{
"type": "logical",
"mode": "or",
"rules": [
{
"port": 53
},
{
"protocol": "dns"
}
],
"outbound": "dns-out"
},
{
"source_ip_cidr": [
"192.168.0.0/16",
"fd00:1234::/64"
],
"outbound": "ss-go-home"
},
{
"ip_cidr": [
"5.189.200.0/24"
],
"outbound": "ss-ru"
},
{
"rule_set": "geoip-cn",
"invert": true,
"outbound": "vless-jp"
}
],
"rule_set": [
{
"tag": "geoip-cn",
"url": "https://xxxx/sing-geoip/rule-set/geoip-cn.srs"
}
]
}
}
千兆光纤收发器,稳定经济,网线好像是超过 100 米就有衰减了,而且网线贵啊
2023-09-05 13:31:55 +08:00
回复了 j1132888093 创建的主题 问与答 有人做过雅虎的 oauth2 登录吗?
x-www-form-urlencoded 模式,URL 上的 code 参数去掉试试?
2023-05-24 12:37:06 +08:00
回复了 dawei211 创建的主题 分享创造 TTQM 发码,可能是你最好的的 MQTT 调试工具
PNXWRW7FNP4Y 已用,感谢
2023-05-18 17:02:02 +08:00
回复了 Huhuu 创建的主题 生活 各位程序员的 MBTI 是什么~~
INTP-H (好像还没看到)
如果只是修改一个源码文件里的某个变量,如:string version = "1.0" maven 编译时设置一个新的版本号 version = “1.1” ,那可以用 replacer 插件来实现,比如 com.google.code.maven-replacer-plugin:replacer
2023-03-08 10:30:57 +08:00
回复了 jiobanma 创建的主题 程序员 mysql 数据同步 elasticsearch 方案
可不可以历史数据用 datax ,增量数据用 canal 呢?
2023-02-03 14:05:56 +08:00
回复了 nong99 创建的主题 问与答 农村自建房抽水井水,水压力不足问题请教
水塔出水口主管道加一个变频增压泵,注意水泵的口径
2022-11-21 15:48:50 +08:00
回复了 weofuh 创建的主题 问与答 Java 引用对象导致 jackson 反序列化结果不正确
@urnoob 哈哈哈,上午 debug 了下,没搞懂为啥要 merge 进 map 的 list 里去,是有什么规范或者约定啥的。提供类似 getCopyList 这样方法的同事可能是方便在其他地方使用的时候不需要关心 map 里的 key 是什么吧,因为我看到了好几个类似的 get 方法。
2022-11-10 08:44:59 +08:00
回复了 xoxo419 创建的主题 问与答 wsl --version 怎么不能打印出版本信息呢
好像是 win11 上午月推送更新后支持的吧
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1088 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 37ms · UTC 19:43 · PVG 03:43 · LAX 11:43 · JFK 14:43
Developed with CodeLauncher
♥ Do have faith in what you're doing.