V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  JCZ2MkKb5S8ZX9pq  ›  全部回复第 22 页 / 共 120 页
回复总数  2392
1 ... 18  19  20  21  22  23  24  25  26  27 ... 120  
2020-08-16 14:55:13 +08:00
回复了 yedaxia 创建的主题 分享创造 分享一个可以通过台词找影片素材的在线工具
#43 的视图不错,功能性合理很多。虽然按钮和 context 出来的框边距有点怪。
2020-08-16 14:52:59 +08:00
回复了 yedaxia 创建的主题 分享创造 分享一个可以通过台词找影片素材的在线工具
另外现在搜索结果的信息权重有点奇怪,影片标题在最重要的位置,时间感觉也只要开始的时间精确到秒就足够。

http://33.agilestudio.cn/?videoKeyword=%E9%A3%9E%E5%B1%8B&subtitleKeyword=how%20dare%20you&page=1&limit=20
这个一排飞屋里混了一个飞鹰计划,搜索结果的权重好像也有点小问题。
可以考虑插一个影片的搜索结果列表,方便用户精确到某部影片,进而只显示该影片内的台词。
2020-08-16 14:46:31 +08:00
回复了 yedaxia 创建的主题 分享创造 分享一个可以通过台词找影片素材的在线工具
求个码

考虑过类似的产品,但数据量感觉会很大,还有版权问题,所以没有实施。
还想过有几个问题点:
通过字幕找到的画面,前后会有一些误差,如何定位到截图需要的具体帧。
如果返回视频结果,版权问题怎么规避。
另外也考虑过直接绕过无效的影片源,直接让用户提供现成的截图或片段,再反向 OCR 去提取字幕。这样还解决了片段重要程度的权重问题。
2020-08-13 00:13:33 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 正则表达式 请教一个获取 ip 地址的正则问题
@Dvel 对对对
我一开始 (?!\.|\d) 这个没写对,老是排除错误。
2020-08-12 23:39:01 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 正则表达式 请教一个获取 ip 地址的正则问题
@JCZ2MkKb5S8ZX9pq 不过实际试下来,前缀种类有点多,最好还是能去后缀,或者去重。
2020-08-12 23:22:34 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 正则表达式 请教一个获取 ip 地址的正则问题
@calmzhu 先在前面加了[>\s]凑合一下
2020-08-12 23:07:00 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 正则表达式 请教一个获取 ip 地址的正则问题
@calmzhu 就是有一些含 html 的情况,也有不含的,想搞个通用的。
2020-08-12 23:05:53 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 正则表达式 请教一个获取 ip 地址的正则问题
@calmzhu
未必在 td 里,另外你前面的零宽是不是指 td 右侧的括号?(?<=>)
2020-08-10 16:44:52 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 MongoDB 关于 mongodb 索引的几个小问题
@limboMu
感觉例 2 里,在 max/min 这类排序的可能会有提高,但 push/addtoset 感觉索引可能就没啥用。不知道这么理解对不对。
2020-08-04 19:49:55 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 MongoDB mongodb 有 log 的情况下,能看到哪些操作消耗比较高吗?
@limboMu
有些 log 是时间开头,毫秒结尾的。能看到完整的记录内容。
有些是中断的,只有后半段,请问知道为什么嘛?

另外不知道有没有 log 分析工具,我找找看。
2020-08-04 13:24:01 +08:00
回复了 hongch 创建的主题 杭州 [杭州摆摊记] 周末和女朋友第一次摆摊,感觉比想象中容易😄
扫码加群做私域
2020-08-03 14:50:35 +08:00
回复了 xtx 创建的主题 程序员 何同学新一期的视频创意真的很好。
好像已经过了找到自己 id 就特别高兴的年纪……
微软的 powertoys 有新增一个搜索工具,类似 listary 和 everything,比较像 mac 的 spotlight,还在陆续完善中,有兴趣可以试试。
2020-08-02 11:16:55 +08:00
回复了 choice4 创建的主题 MongoDB Mongo 分组查询
说出来你可能不信,我没用过 sql……
不过 mongo 的话,有 aggregate + $group,具体你可以根据需求搜看看。
2020-07-30 14:58:19 +08:00
回复了 Alpacino 创建的主题 问与答 Python 中 string += 'a' 这种写法效率很低吗?
python cook book 好像有提过这个
但以我平时写的那些小破代码来说,可读性和直观程度更加重要一些。优不优化区别不大,真搞到需要优化了,我应该也能有预算找人帮我整个重构了。
2020-07-30 10:32:27 +08:00
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
@dtgxx 嗯,看了下的确没有先 compound 然后再转换的方法。那就等于全部数据要预处理,那是怎么都快不起来了。
去重的话感觉也是先建非 unique 的 index,然后排序去重能快一点。不过你这个量是满夸张的。
2020-07-30 10:14:04 +08:00
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
@dtgxx 是用

createIndex({name:1,gender:1,age:1})
如果是这种是可以重复的吧?

加了{unique: true}的话倒不清楚,没用过这个,查询会更快吗?
我去试试看这个。

也可以考虑初期先导入,用起来再说,日后慢慢去重做 unique 吧。
2020-07-30 09:57:14 +08:00
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
@dtgxx 20 楼说的看了眼,学到了。但感觉不管哪种去重,查找的花销总归是难免的,不如先全部丢进去再说了。可以以后慢慢处理。

> 但是联合唯一索引在导入数据之后有重复数据就无法创建了
这个没有看懂,如果是 mongo 自带的 index 不是可以重复的吗?
2020-07-30 09:26:43 +08:00
回复了 dtgxx 创建的主题 MongoDB mongodb 导入数据怎么破
需求没看很懂,唯一索引是建一个单独的字段,还是 createIndex ?
如果碰到重复,处理逻辑是什么样的?

另外有个比较基本的差别,insert_many 比逐条插入要快很多。可以考虑先 createIndex 然后批量导入,最后再说处理重复,不知道能不能行。
2020-06-25 17:53:05 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 iOS 基于 iOS14 的系统占用,被迫选择一些网页版替代客户端。
@2exhjx 本来我以为发表这种“何不食肉糜”式的评论的,都是真的不知人间疾苦。结果点进您信息一看,前些天还在讨论黑果…… 厉害厉害
1 ... 18  19  20  21  22  23  24  25  26  27 ... 120  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   989 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 19:46 · PVG 03:46 · LAX 12:46 · JFK 15:46
Developed with CodeLauncher
♥ Do have faith in what you're doing.