Xs0ul 最近的时间轴更新
Xs0ul

Xs0ul

V2EX 第 57957 号会员,加入于 2014-03-12 00:00:14 +08:00
今日活跃度排名 1737
根据 Xs0ul 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Xs0ul 最近回复了
32 天前
回复了 lumaster 创建的主题 问与答 外企/留学求起个合适英文名
有同事是法国人,他会更愿意别人用法语的发音方式来念他的名字。同样很多人第一次和我聊天的时候,也会很客气地问名字拼音怎么发音
1. 就像讨论班,读书会一样,听众的参与度肯定不如分享的那个人。你可以考虑两人轮流准备和挑选题目。
2. 另一方面,楼主可以考虑下会不会每天 3 题太多了,或者同事的进度不如楼主。可以试试两人每天共同刷 1 题,楼主自己额外开小灶做 2 题。因为 3 题做完也得花点时间,再加上讨论,空余时间不一定每天都有这么多。
45 天前
回复了 minsheng 创建的主题 Apple 关于 Apple 扫描儿童色情照片的技术讨论
@minsheng #49 我理解 LSH 是“匹配”,但这个匹配是基于 CNN 提取出来的 feature 的。要如何保证儿童和成人的照片 feature 不类似呢?

还是我理解错了,目标是只匹配 CSAM 数据集里的照片(以及它们的 augmented 版本),而不考虑泛化?
45 天前
回复了 minsheng 创建的主题 Apple 关于 Apple 扫描儿童色情照片的技术讨论
@minsheng #37 我想表达的是,因为 CNN 和之后的 LSH 都是无监督的,很难区分儿童色情和成年人的裸照,但前者是要打击的对象,后者却是用户不想让人工审核看的隐私
45 天前
回复了 minsheng 创建的主题 Apple 关于 Apple 扫描儿童色情照片的技术讨论
虽然说是图片匹配,但这里 CNN 起的作用看起来像 feature extracter 或者 embedding 。放在一般的机器学习论文里,提取出来的结果应该就是当成一般的 feature map 。苹果硬是存成了二进制然后给了个 hash 的名字,还是很难说服别人这是匹配而不是识别。

而且既然这个模型是无监督学习的,我理解是数据集没有特意去区别儿童色情和成年人的色情图片。那这样训练出来的网络,很难说可以区分儿童色情和成年人的裸照。

还没看原文,只看了楼主的介绍。有理解错的欢迎大佬们指出。
要搞清楚是要问实现还是算法。实现就像大家说的用 bt,怎么分发靠 bt 自己解决。

算法的话,就是考虑“最短时间”。楼主描述的“分成 10000 个 10M 的小文件”,为什么是 10000 和 10 ? 5000 和 20 会不会更快?然后“node 间互相分发”又是怎么个分法,怎么保证不缺少也不重复 /浪费?
查看 passwords.google.com 保存的密码可以用 pin 解锁的
楼主的例子,更像是给单词加前缀而不是所谓的词根词。像 anti 这样的前缀,随便什么词上都可以加,即使是自己生造的别人也能理解。

我和楼上很多人观点一样,建议直接背单词,并且在语境中复习他们
64 天前
回复了 wuwukai007 创建的主题 Python Python 碰到一题,大家有没有更好的解法
需求不明确,打回去重写(

但作为一个需求,看起来是根据上下文,找出缩写。缩写就定义成每个字都在另一个字符串中。然后统计所有缩写的数量
93 天前
回复了 AndyAO 创建的主题 问与答 Git 中的 ish 是什么意思?
ish 是"有那么点"或"大约",Google 给的解释是“to some extent”. 在口语里用起来很随意,比如 60-ish 就是 60 左右,而 tree-ish 就是类似树,或者能导向树的。

git 里和真正的 tree 的区别不太清楚,可以看看 https://stackoverflow.com/questions/4044368/what-does-tree-ish-mean-in-git
关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2117 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 8ms · UTC 02:33 · PVG 10:33 · LAX 19:33 · JFK 22:33
♥ Do have faith in what you're doing.