V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  necomancer  ›  全部回复第 24 页 / 共 32 页
回复总数  623
1 ... 16  17  18  19  20  21  22  23  24  25 ... 32  
2018-12-05 11:28:25 +08:00
回复了 cyy564 创建的主题 Python 请教一下 Python 中列表字典清洗数据的问题
Sorry,

ret = {}
for i in l:
....if not ret.get(i['type']):
........ret[i['type']] = 0
...ret[i['type']] +=1
2018-12-05 11:27:13 +08:00
回复了 cyy564 创建的主题 Python 请教一下 Python 中列表字典清洗数据的问题
@cyy564 百分比很好统计:

ret = {}
for i in l:
....if not ret.get(i['type']):
........ret[i['type']] = 0
...ret.get(i['type']) +=1

基本上在不知道 type 有多少的情况下也能轻松统计
2018-12-05 11:24:39 +08:00
回复了 cyy564 创建的主题 Python 请教一下 Python 中列表字典清洗数据的问题
from itertools import groupby
[ list(g) for c, g in groupby(lst, key=(lambda x : x.get('type'))) ]
2018-12-05 11:24:04 +08:00
回复了 cyy564 创建的主题 Python 请教一下 Python 中列表字典清洗数据的问题
数据少的话:
lst = sorted(l, key=(lambda x : x.get('type')))
ret = [[]]
for prv, nxt in zip(lst[:-1], lst[1:]):
....tmp = ret[-1]
....tmp.append(prv)
....if prv['type']!=nxt['type']:
........ret.append([])
tmp = ret[-1]
tmp.append(t[-1])
然后取 ret 里最多的,或者直接用 groupby
[ list(g) for c, g in groupby(lst, key=(lambda x : x.get('type'))) ]
但是都需要排序。

或者用 pandas:
import pandas as pd
l= [{'name': 'aa', 'type': '游戏'},
{'name': 'cc', 'type': '学习'},
{'name': 'bb', 'type': '游戏'}] # 可以不用考虑顺序

list(pd.DataFrame(l).groupby('type')) 可以搞定,输出是 n 个 categories 的 tuple 的 list

[(分组名 1,分组 1 数据的 dataframe),(分组名 2,分组 2 数据的 dataframe)...],数据大小可以用 dataframe 的 shape 来确定。

In [40]: list(pd.DataFrame(l).groupby('type'))
Out[40]:
[('学习', name type
1 cc 学习), ('游戏', name type
0 aa 游戏
2 bb 游戏)]

In [41]: p=list(pd.DataFrame(l).groupby('type'))[1][1]

In [42]: p.shape
Out[42]: (2, 2)

In [43]: p
Out[43]:
name type
0 aa 游戏
2 bb 游戏

对一定量的数据,pandas 就可以有很高的处理效率了,如果数据量再大,考虑上 #1 的方法吧。
2018-11-30 21:41:25 +08:00
回复了 Hzzone 创建的主题 Python 为什么同样的矩阵乘法, Pytorch 和 Cupy 要比 Numpy 慢?
直接用 * 是矩阵乘法吗……别的不知道,numpy 下是批量相乘吧……

numpy 里 x_cpu.dot(x_cpu) 才是矩阵乘法。
2018-11-29 00:01:16 +08:00
回复了 cunzhen 创建的主题 PHP 怎么让网页处于一直加载中?
我发现很多网站因为有 google 的 js,字体等一系列东西会有一个非常非常长的加载时间……
2018-11-28 11:42:57 +08:00
回复了 aodeng 创建的主题 程序员 做为一个程序员,大家都用什么东西记笔记?
凌美。
2018-11-27 20:50:56 +08:00
回复了 xairsky 创建的主题 Android 想买一部 4000 左右的安卓旗舰,在纠结中,求推荐。
sony xz3
thinkpad X 系列,键盘很爽。
2018-11-12 17:41:50 +08:00
回复了 zynlp 创建的主题 程序员 分享一个算法可视化的网站,
mark
2018-11-11 02:23:40 +08:00
回复了 songdg 创建的主题 Python 请教为什么不相等
一般 numpy 比较的时候用 np.isclose 或者 np.allclose

In [1]: arr = np.array([3.12, 3.43, 3.77, 4.15, 4.57],dtype=np.float32)

In [2]: np.isclose(arr[-1], 4.57)
Out[2]: True

浮点数一般不直接做相等,除非 dtype 也是一样的。python 里的小数一般是 np.float64

In [4]: arr = np.array([3.12, 3.43, 3.77, 4.15, 4.57],dtype=np.float64)

In [5]: arr[-1] == 4.57
Out[5]: True

我记得 numpy 官网文档里提过建议用 np.isclose()
2018-11-08 00:39:03 +08:00
回复了 fox1955 创建的主题 Linux [最效率软件] 平铺式桌面。结论令人震惊!
@Havee 哈哈哈哈
2018-11-08 00:06:56 +08:00
回复了 swordspoet 创建的主题 Python 求解一道关于列表和字典 Python 问题
t = sorted(data, key=(lambda x : (x['a'], x['b'])))
ret = [[]]
for prv, nxt in zip(t[:-1], t[1:]):
....tmp = ret[-1]
....tmp.append(prv)
....if prv['a']!=nxt['a']:
........ret.append([])
tmp = ret[-1]
tmp.append(t[-1])
2018-11-06 15:11:17 +08:00
回复了 Amone 创建的主题 Python 问个 Python 遍历的问题
import uuid
print('%s' % (uuid.uuid4()))

试试。有其他要求请看
help(uuid.uuid1)
help(uuid.uuid3)
help(uuid.uuid4)
help(uuid.uuid5)
2018-10-31 11:00:27 +08:00
回复了 mishini 创建的主题 音乐 有那种教人看懂指挥的 APP 或者网站吗?
没什么太多的意思,有一些关于乐队指挥的书。最好最快能理解指挥动作的方法是进乐队参加一次演奏。这个一般人机会不多,可以考虑参加快闪。其实合奏一次很快就能理解指挥是干什么的,合奏过程中你会发现他 /她每一个动作似乎都很清晰,一个眼神、点一下头或者手上一个细微的动作似乎都能理解他的意图。因为演奏时你知道乐谱,知道身边人在做什么,清楚自己在做什么,指挥只是给你一个“你这时候应该这么做”的提示。
2018-10-31 00:34:44 +08:00
回复了 Applenice 创建的主题 程序员 V 友们给推荐款笔记本吧
不求轻薄看看 precision 吧。
2018-10-28 23:23:15 +08:00
回复了 void1900 创建的主题 Linux 有人在 archlinux 下配置过 三指拖拽吗?
2018-10-28 23:06:32 +08:00
回复了 stdying 创建的主题 程序员 6000--7000 之间预算笔记本推荐,女生用
MS surface pro
2018-10-16 10:48:40 +08:00
回复了 songdg 创建的主题 Python 求解析一下这个函数的原理
2018-10-13 12:44:17 +08:00
回复了 fangyh09 创建的主题 Linux 服务器间拷贝文件 大家有什么好用的工具推荐吗
可以考虑 NFS 系统吗?相当于三个服务器共用硬盘。
1 ... 16  17  18  19  20  21  22  23  24  25 ... 32  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   902 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 79ms · UTC 22:09 · PVG 06:09 · LAX 15:09 · JFK 18:09
Developed with CodeLauncher
♥ Do have faith in what you're doing.