V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Licsber  ›  全部回复第 11 页 / 共 36 页
回复总数  702
1 ... 7  8  9  10  11  12  13  14  15  16 ... 36  
@JIUBASHI #23 宏观层面 为什么明知道我们的需求还没人做呢 端到端加密的国产网盘我还真没见过
国内不会不提醒就干掉用户内容的就只剩 115 、OneDrive 和 iCloud 了吧 说明国内的网盘需求仍然还是下载工具
阿里云盘这样的的做法确实有独到的考虑 节省了作为下载工具的巨额流量 这些一直没人提:
0. 我的以下分析基于阿里云盘不想做一个下载工具(即不想再做一个一模一样的度盘出来)
基于 2022 年 云上流量费用占大头 相比之下存储费用和闲置计算资源不值一提的大前提下
1. 只允许分享可被审查的内容(文本、图片、视频) 虽然是根据文件扩展名判断的
且禁止压缩包等打包 /加密手段分享内容 确保不会有违规资源审查不到时在某些渠道大量消耗流量
前端不提供修改拓展名操作 使得伪造拓展名必须在文件被上传之前进行 具有一定技术门槛(别笑
很多小白甚至不知道怎么开启“显示已知文件的拓展名”选项 节省这部分小白的流量消耗
2. 注意消耗流量体现在「下载」这个操作上 而允许分享的只有可「预览」的文件
而影视剧 /摄影作品等大家几乎不会下一份在本地 都会选择在线观看
达成引导这部分用户充值「 VIP 」解锁「 1080P 播放」的目的 同时节省巨额流量
如果以后不允许在线预览分享链接 而必须保存到云盘才可预览 那将引导这部分用户充值「超级 VIP 」
因为网上目前流传的大包几乎都在永久容量级别甚至更高 这将是可靠的盈利手段
3. 文本的流量完全不考虑 相较图片、视频 完全无所谓 可能前端网页、后端走的流量都更多
4. 图片因为可以批量预览 要考虑这部分缩略图成本 还因为批量预览这个属性 必须考虑内容审查
这也就导致了所有图片在上传的那一刻起 其实就已经被做了审查 这个成本是必要支出
图片也同样不会导致巨额流量消耗 相信大家看过一次的图很少会在本地存储
5. 视频需要下载的场合可能就「素材分享」和「剪片」这两个用途了
对于这部分影视达人 「 VIP 」和「超级 VIP 」的容量都显然不太够用 引导他们购买「超额容量」
6. 视频需要在线预览的场景可以覆盖「电影」、「电视剧」、「在线课程」
覆盖人群同时包含了学生 即会存在一群考研、考公党来看学习视频
7. 所以这么分析下来 小白羊这种第三方阿里云盘客户端还是有可能被封杀的
其一 它提供 4 小时有效期「直链」 以直接下载视频的方式提供给本地播放器原画质播放 这消耗了比转码多得多的流量
其二 它提供了「洗码」这个功能 使得同一资源存在超多无法通过秒传功能去重的副本 消耗存储容量
当然 在块存储方面 文件其实只有最后一个逻辑块有变化 所以理论上每副本只多出单一逻辑块大小的容量
其三 它提供了「账号间复制」绕过官方分享通过直链方式获取 proof_code 来共享文件
8. 我的分析结论:
其一 阿里云盘作为下载工具完全不合格 也符合它的定位 至少目前它非常不想当一个下载工具
其二 它完全没考虑一些用户群体的需求 如深度学习从业者 我们需要将各种数据集和模型参数「保存」与「分享」
而百度网盘完美的符合这项需求 数据集的特点就是超多人每次都会全量下载 而分享者给不出足够的流量带宽
模型参数的特点则是完全不会秒传(要是能秒传那要怀疑学术诚信问题了)、容量巨大、文件可能巨多
这部分人群的需求完全粘在了百度网盘上 (去 GitHub 看看 是不是 GoogleDrive 和百度云二分天下
其三 PT 党一般都有不止一个 NAS 阿里云盘的容量还是太小了 只能作为部分文件备份使用
其四 它作为云相册 对比百度的一刻相册仍然是略失败的 对所有图片强制审核代表着不可避免的误杀
毕竟谁不会拍到几张自家小宝宝光屁股的照片呢 被 Block 了还要申诉 就很烦 多来几次就弃用了
其五 团队协作方面完全比不上微盘 至少在好友功能未开发的当下
也不能建群 难道协作的意思就是互相分享摸鱼小视频吗
其六 作为阿里的「亲儿子」 和语雀也没有联动 隔壁飞书起码我云文档和文件用起来很顺畅
其七 所以我个人的做法是 在摸清它商业逻辑与盈利能力之前不会付费
仅用作文件云加密备份与在线播放器 不知道大家还有没有其他用法

欢迎讨论
2022-04-17 19:20:58 +08:00
回复了 Licsber 创建的主题 Python 如何配合 multiprocessing 使用 hashlib 来计算多种摘要?
终于写完了 单测也测完了 至少我是很满意的
```python3
BUF_SIZE = 4 * 1024 * 1024 # 4MiB
BUF_PRE_FETCH = 64 # 最多消耗 256MiB 额外内存


def cal_hashes(f: typing.IO):
f.seek(0)

res = {
'finish': False,
}
queues = {
'md5': Queue(),
'sha1': Queue(),
'sha256': Queue(),
}

def _producer(_f: typing.IO):
while True:
time.sleep(0.01)
empty_flag = True

for _, queue in queues.items():
if not queue.empty():
empty_flag = False
break

if empty_flag:
count = BUF_PRE_FETCH
while count > 0:
count -= 1
content = _f.read(BUF_SIZE)
if not content:
res['finish'] = True
return

for _, queue in queues.items():
queue.put_nowait(content)

# 合理的相信算完 256M 的数据
# 至少需要这么久
# 树莓派 4:120MiB/s
# 8 代 i5: 370MiB/s
time.sleep(0.3)

def _consumer(_algo: str):
hash_obj = hashlib.new(_algo)
while True:
if res['finish'] and queues[_algo].empty():
break

try:
content = queues[_algo].get(timeout=1)
except Empty:
continue

hash_obj.update(content)
queues[_algo].task_done()

res[_algo] = hash_obj.hexdigest().upper()

ths = []
producer = threading.Thread(target=_producer, args=(f,))
producer.start()
ths.append(producer)
for algorithm in queues.keys():
consumer = threading.Thread(target=_consumer, args=(algorithm,))
consumer.start()
ths.append(consumer)

for th in ths:
th.join()

return res
```
2022-04-17 17:31:59 +08:00
回复了 Licsber 创建的主题 Python 如何配合 multiprocessing 使用 hashlib 来计算多种摘要?
@LeeReamond #1 感谢 我刚思考了一会好像理解我哪里想错了
我现在用 threading 库实现一下 过会贴代码
@eason1874 #13 阿里云盘的内容生态完全没起来 对比下夸克都有自己的文件市场了 不少官方 PPT 等资源还挺不错
@philippiela #15 确实 115 每次营销都给人一种快倒闭的感觉 但是到现在依然健在 和 ys168 度过了一个时代
@shequ2046 #16 也不算黑产灰产吧 秒传如 @Hconk #17 所说 大家都用这个来躲官方分享 这样自己账号就会非常安全
毕竟谁也不知道自己分享的资源会不会某天就被违禁了 然后连累自己被封号 通过 hash 分享就可以跳过一部分监管
@brMu #19 没体验过夸克的离线 但是 115 的离线绝对是最 nb 的 多老的资源都可以成功
推荐 OP 直接使用 ffmpeg 保存 HEVC 编码过后的 一定要 cpu 编码
参考: /t/822616
@HeyWeGo #11 PT 大包上百 G 还是小了 经常 T 起步 所以我们经常折腾存储
@philippiela #8 这个是大家心照不宣 115 只要不分享就没有内容审查 也是卖的这么贵还有这么多人用的理由
@docx #9 搞不懂 才了解 uc 网盘 以为倒了 所以原来阿里系有三个网盘么 更看不懂了
@yaoyao1128 #10 感谢提供公司层面的视角 所以阿里云盘算亲儿子 但是阿里亲儿子的下场。。。。
不过 88 送过虾米音乐 然后虾米倒了 夸克是不是也会同样遭遇
话说这些云盘怎么不公开下规模数据啊 我看很多网盘会公开总数据规模、总用户数之类的
@K1W1 #1 迷惑 按 qq 和微信的关系的话 两个会长期共存 但给用户的感觉是两个都不想用

@geekvcn #2 有一说一阿里云盘是目前市面上白嫖最愉快的网盘 在线播放功能确实有很大优势
和 115 必须先手动转码才能在线播放比起来好用很多 特别是个人摄影作品等分享用途

@opengps #4 夸克不赚钱吧 我看学生会员 12 块一年 而且淘宝 vip 附带 pdd 上还有一堆出年卡的不到五块钱一年

@oott123 #5 秒传方案来说 我个人认为这三种都是天才方案 1 和 3 网友都有不同格式的链接方法
目前方案 2 小白羊也给了应对方法(产生巨大的.alimc 文件)
还有网友给出带 4 小时有效期直链的秒传链接方法 也是天才想法
但我不明白的是 这样挑战 proof 在阿里云盘目前最大容量超会 20T 额外 388/5T/1 年的情况下
明显在引导用户上传“独一无二”的文件 会显著增加存储成本

像 115 网盘 大家保存其他人的大包分享 /用秒传 json 直接复制大包 很容易就把空间塞满了
这样会引导购买 115 的永久容量包 导致大家的容量普遍都在 0.5-10PB 级别
然而 115 这样的单人容量下 实际上的“独一无二”文件是非常少的 可能 100000 个用户也只占这么多空间

阿里另一方面又推动了全审查 即图片文件全部走一遍审核(已验证 加盲水印都没办法绕过)
视频文件也会走一遍 sha1 筛查后 排着队走审核 不知道是否人工审核 哪怕没有分享(已验证)

也就是说 这套方案 2 更像是在强制用户使用官方分享 并且强制“分享成为用户间共享文件的唯一手段”
我能想到的后果是(只讨论视频这样的大文件 美剧等):
1. 分享者保留违规资源的欲望降低(几乎只能自己看 分享必出事 同时容量过少)
2. 用户保留违规资源的总量会增多( sha1 筛查 用户会倾向洗码 /重编码 导致云盘实际上存了同文件的超多不同副本)
3. 后期可以有效降低人工审核压力(理论上只用处理被举报的分享)
4. 不同分享间的去重很难做到(大家可能采用了不同的改 hash 方案)
5. 对 像我这样喜欢 不重要文件只存摘要的人 造成严重打击(我自己写的网盘基于内容寻址)

谈不上是好是坏 只能说很不喜欢阿里云盘这种做法
我现在做了视频文件的指纹特征 能确保被阿里云盘小白羊洗码功能改过任意次的视频指纹相同
准备再做点高级去重方法 接着扩容 nas 看来想要低成本多服务商安全的存不重要的文件任重道远
2022-04-15 18:25:40 +08:00
回复了 LxnChan 创建的主题 问与答 如何以最低成本注册一家公司
@LxnChan #7 过来人告诉你别信啥啥云上公司 自己有场所的话自己可以跑工商局
app 零申报很方便 需要记账的话请专业人员来做
2022-04-13 21:10:56 +08:00
回复了 zenoven 创建的主题 问与答 现在宅男们还有啥玩具可玩的?
最近买了个精致的小玩意
米家的激光测距仪 手感真的挺好 也挺好玩的
不过用处不是很大
2022-04-11 03:54:39 +08:00
回复了 justd 创建的主题 优惠信息 张大妈搜索 master3 349 下单了
@FrankFang128 #7 我是#1 看到你这条回复 成功让我退款然后抢不到单品了
( 又下单了一个带鼠标包的版本 加了 5 块钱 想想能入手还是比较值的


@LifeAqua #11 master3 不是很大 对我来说算是正好 用了一年了 可以替代触控板
( macOS 上能替代触控板这个评价应该是相当高了吧
不过非常容易脏 特别是手心附近 那种带摩擦力的材质越擦越脏 后来就不在乎了
2022-04-11 02:08:45 +08:00
回复了 justd 创建的主题 优惠信息 张大妈搜索 master3 349 下单了
冲了 虽然已经有了 买了另外一个颜色 感谢 OP 提醒
2022-04-10 03:19:30 +08:00
回复了 wonderfulcxm 创建的主题 问与答 如何把 wifi 热点的覆盖能力降低
打开路由器的弱信号剔除功能 设一个合理的 RSSI 数值
2022-04-03 18:27:21 +08:00
回复了 zungmou 创建的主题 Keras 用 keras 搭建出一个判断今天是周几的模型?
推荐知乎镜像问题:如何用深度学习判断某数是否是 2 的倍数?
这类问题对这种依靠“经验”的概率模型无解
建议 OP 放弃尝试 转而去研究 cv
2022-04-02 14:52:41 +08:00
回复了 Symo 创建的主题 macOS 定期性的重置 Macbook 的系统会更流畅吗?
重置能显著降低硬盘占用 因为自己也不知道什么时候用 brew 装的软件就再也不用了
2022-03-29 14:19:10 +08:00
回复了 vilic 创建的主题 分享创造 写了个 V2EX 爆贴爬虫,避免错过群体吃瓜事件
@vilic #8 水深火热是 v2 的隐藏节点
@Mirage09 #9 很显然 OP 不知道水深火热的意思
2022-03-28 14:30:18 +08:00
回复了 sprite82 创建的主题 路由器 请教各位软路由大佬一个问题,关于 R2S 的电源和 tf 卡
能用 怕你用一些山寨充电器 忽略协商直接 9V2A 的那种 然后就直接给干掉了
实测大厂手机自带的充电器都能用 比如华为、紫米等
2022-03-13 23:00:41 +08:00
回复了 hing 创建的主题 分享发现 语雀免费领取 1-4 年会员(必领 1 年)
发快了 BB8GCF 已用
我的:ZGEXEY
2022-03-13 22:59:31 +08:00
回复了 hing 创建的主题 分享发现 语雀免费领取 1-4 年会员(必领 1 年)
邀请码:BB8GCF
2022-03-13 13:51:14 +08:00
回复了 V9NN 创建的主题 互联网 抢注“支付宝号”要点总结
感谢提醒 拿了一个 java 的关键字
1 ... 7  8  9  10  11  12  13  14  15  16 ... 36  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5295 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 09:28 · PVG 17:28 · LAX 01:28 · JFK 04:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.