V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  hallDrawnel  ›  全部回复第 4 页 / 共 9 页
回复总数  179
1  2  3  4  5  6  7  8  9  
2021-12-25 19:09:46 +08:00
回复了 partystart 创建的主题 程序员 纯吐槽帖 关于 go 的 err 和重载
@partystart 奇了怪了出错不处理你糊弄谁呢?
2021-12-25 00:27:47 +08:00
回复了 partystart 创建的主题 程序员 纯吐槽帖 关于 go 的 err 和重载
每一步处理 error 我觉得很好,尤其是业务逻辑,这样强迫那个人每一步都去检查并作出合理的判断,虽然麻烦,但是后期维护和回溯都很爽。
两个服务的话,那直接用 k8s 的 service 就可以了。引入额外的东西复杂度一下子就变高了。如非必要,勿增实体。
2021-12-14 22:04:32 +08:00
回复了 veike 创建的主题 程序员 有大佬知道 960G 内存的服务器一般都干啥用?一般都怎么用?
k8s 母鸡咯。厂里内存基本都不要钱,随便用。
2021-12-12 18:14:44 +08:00
回复了 kisshere 创建的主题 程序员 elasticsearch 彻底关闭日志是不是就可以解决此次 log4j2 漏洞?
设置 log 文件夹为 /dev/null 不能,log4j 依然被调用。
2021-12-11 00:01:05 +08:00
回复了 Jooooooooo 创建的主题 程序员 log4j2 的漏洞大家今天晚上修复吗?
@ericFork 是的,但是那个有其他团队负责修,我们只需要观察稳定性就行了
2021-12-10 23:20:07 +08:00
回复了 Jooooooooo 创建的主题 程序员 log4j2 的漏洞大家今天晚上修复吗?
今天看隔壁修了一天,还好我们这边没 Java
2021-12-01 01:23:50 +08:00
回复了 onhao 创建的主题 MySQL ?应用 触发器,函数,存储过程 会 变色
无法实现灰度发布之类的吧。我记得存储过程要改就是一把梭改完。如果出问题了回滚也是一把梭回滚(当然数据层面的改动能不能回滚另说)。这样很可怕啊。以及存储过程无法打日志,出问题了只能靠输入输出人脑 debug ?
2021-11-21 23:26:59 +08:00
回复了 kikione 创建的主题 程序员 分布式没有全局时间
计算机自己的晶振时钟偏差其实可以很大,为了尽可能做到精确,IDC 可以部署原子钟同步时间,做到尽可能的一致。
2021-11-19 23:33:38 +08:00
回复了 wolf1981 创建的主题 NAS 开 DDNS 会被停宽带吗?
@my3157 你的轻量是国内还是国外的节点?我一开始想着用国外的,一想跨境可能被封啊
2021-11-05 21:20:37 +08:00
回复了 chengouzi 创建的主题 Redis Redis 到底应该怎么存储使用?
1000 个 Key 不算多,我们一个服务的 key 数量随便就几百万了。不懂你们上层业务逻辑,但是这样用也没啥问题。

比较好奇的是为什么要拆分固定的 1000 个 key ?意思是分为固定的 1000 个人群?
先 block 为敬
2021-09-28 00:20:31 +08:00
回复了 v2Cj 创建的主题 程序员 iPhone13 系列大家用什么钢化膜呢?
我现在贴膜其实是为了疏油层。iPhone 的疏油层感觉用一年后就不太行了,现在国产膜的疏油层手感都挺不错的,我感觉比原厂的还要舒服。
2021-09-26 01:19:23 +08:00
回复了 honhon 创建的主题 Windows win11 你们会升级么?
会,但要等正式版出来。主要拿来打游戏的,不希望打得正开心的时候出幺蛾子。
2021-09-04 20:53:18 +08:00
回复了 terrytw 创建的主题 程序员 诸位猜猜看,我的隐私是如何泄露的
连过同一个 WiFi 吗?
2021-09-04 14:24:00 +08:00
回复了 alexkkaa 创建的主题 程序员 广告与监听
@alexkkaa 你搜索一下 WiFi 探针 就知道了,技术很成熟。从无差别监听录音上来说,算法方面的确是一个难以解决的问题,那样得到的数据太脏了,基本无法用。如果你有做过一些算法的工作,或者打过一些比赛的话,你会发现目前有效的算法对数据的清洁程度要求是很高的。而无差别录音提特征,就有点像一个做车道线识别的 CV 算法,给他输入了大量的图片,但只有 1%是马路的图,那这个模型的召回率肯定很糟糕。

WiFi 探针只是一个被公开锤过,但还在持续用的技术,还有其他各种各样的姿势能做这些事情,有的我们能推测到,有的可能知道的人还不多。比如第三方支付码扫码直接精准定位,还能知道你的消费类型,消费价格,精准画像。各种 app 时不时地获取一下地理位置信息,
2021-09-04 14:03:43 +08:00
回复了 alexkkaa 创建的主题 程序员 广告与监听
siri 和小爱不一样的。你给 siri 和小爱说的话都是有限的简单的命令语句,并且有明确的触发条件,有明确的领域相关性。模型训练可以针对性训练提高精度。

假设要监听你的对话,首先要一直采集分析,这就是一个性价比很低的手段,本地分析耗电、精度不够,容易被发现,远程分析需要一直发送网络请求,得到的数据全是琐碎的音频数据,算法需要做到:

1. 过滤出人声,这点很成熟
2. 提取:因为采集的是完全随机的对话信息,没有任何特性,有无数的关键字,得有一个十分全的数据集来训练。
3. 拿到那一大坨噪音(数据噪音不是音频噪音)那么多的原始输入数据,我的天要怎么套模型(逃

这还是解决了不让用户、不让第三方技术分析厂商抓包 app 悄悄录音的情况下,后续才需要去解决的问题。技术能不能是一码事,法务和风控直接就过不了的。

所以说偷听性价比真的很低,就目前的算法水平,弄到了分析起来也是头皮发麻。现在用户画像很强的,大公司的用户画像除了自身平台,还有很多合作数据源,所有和你有关联的人或物都有很多结构化的数据,比录音性价比高多了。公司也没听说过有这种组。

我觉得更有可能的是,假设你的 WiFi 没有开启随机 MAC 地址(即使开启了,还得考验操作系统厂商的节操),那么你去过的大多数地方做了停留就能被探针记录,不需要你连接任何热点,这样的探针无处不在。这些探针厂商基本是拿着数据瞎卖的,你也锤不了他们,然后不知道过了多少手大厂肯定能拿到这些数据,他们的模型接着就能够把你和所有在你这台手机登陆过的账号匹配起来。于是就能做基于地理位置的行为分析,包括时间和空间上的。

接着基于地理位置的一些关联算法就会发现你和培训老师有过交集,然后那个老师也以同样的用户画像方法被分析过。并被打上了各种标签。同时,你有小孩,年龄多大,什么性别估计模型也猜了个八九不离十。

中途省略无数你,以及在空间、时间上和你有过关联的信息流分析。

接着,到了 CTR 预估环节。结合你的其他行为,包括地理位置啊什么的,来猜测给你什么样的广告点击率会高。这其中除了参考楼主的行为,还会参考和楼主相似的用户的行为的点击结果。(最简单的模式是:买了这个商品的用户还买了哪些商品,那就给准备买这个商品的用户推送那些商品的广告) CTR 预估是广告系统核心的核心,它能够综合到的数据源可能比用户自身要多得多,并且是学术和工业界发力的重点。然后,这些信息生成了一个向量,里面的某个值比其他值要高一点,让与之相关的某一条广告被选中了,接着你被命中了,多少成为了 CTR 的一个正样本。而要做到这些都不需要去冒风险录音。
2021-09-04 10:28:07 +08:00
回复了 Macklemore 创建的主题 程序员 [为什么要抱怨同事代码很差]
说明你们的团队没有规范。
2021-09-03 21:04:19 +08:00
回复了 wh469012917 创建的主题 程序员 同事代码写的太烂了怎么办?
如果需求需要改动到旧代码,就跟 leader 说明情况,适度重构一小片代码出来,脱离原有的路径,隔离出一个范围自己开发。
如果是新的功能,做非侵入式修改,然后把逻辑嵌入到旧代码里。

然后写个文档充分说明这个情况,把风险尽量告知相关人,不然出了事情还得背锅。推动 code review,当然有的 leader 自己就很菜,他根本没办法区分什么是好代码什么是坏代码,只是风起飞了把这只猪给吹上去了。
1  2  3  4  5  6  7  8  9  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3210 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 11:20 · PVG 19:20 · LAX 04:20 · JFK 07:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.