V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  dongxiao  ›  全部回复第 1 页 / 共 3 页
回复总数  60
1  2  3  
试试 ‘dask‘
https://dask.org/
2022-03-22 09:14:16 +08:00
回复了 cwjwgg 创建的主题 程序员 求套类似问答的知识库系统
自己开发的一个知识问答系统,供参考 `https://github.com/memirror/magicMirror`
2022-03-21 11:15:00 +08:00
回复了 ChuangChang 创建的主题 电影 求一些脑洞大开的电影
《那个男人来自地球》
2022-03-11 09:11:12 +08:00
回复了 zhongjun96 创建的主题 程序员 自定义指标查询,有什么好的实现方法?
规则引擎,比如可以看看 Drools
2022-03-04 09:49:57 +08:00
回复了 LeeReamond 创建的主题 Python numpy 对二维数组按某行或某列排序问题
```
d[:, d.argsort(axis=1)[0]]
```
2022-03-04 09:37:53 +08:00
回复了 yagamil 创建的主题 Python pandas dataframe 时间作为索引时 如何转化为日期而非时间?
执行的时候应该有条 warning 信息吧:
```FutureWarning: Indexing a DataFrame with a datetimelike index using a single string to slice the rows, like `frame[string]`, is deprecated and will be removed in a future version. Use `frame.loc[string]` instead.
```

所以你应该这么执行:
```
df.loc["2020-01-01"]
```
2022-01-07 09:34:39 +08:00
回复了 turtlekey 创建的主题 生活 分享一下小学时发生的两件趣事
想起了那年的高考作文,`深处种菱浅种稻,不深不浅种荷花`,我硬是理解成了写保护环境😂
2021-11-11 09:58:45 +08:00
回复了 keroppi 创建的主题 Python pandas 怎么对比当前行的前面 7 天的所有某列的数字?
pandas 先 rolling 后 聚合,比如以每一天与过去 7 天做比较:
1. dataframe.rolling("7d").min() == dataframe
2. dataframe.rolling("7d").min()
2021-09-03 09:18:44 +08:00
回复了 lwgo 创建的主题 奇思妙想 做一个开源的聊天机器人,怎么样?
做了个`魔镜`,可以问一些天气、医药、名人八卦、诗句啥的
https://github.com/memirror/magicMirror
https://github.com/memirror/mmflask
2021-08-04 15:49:56 +08:00
回复了 lskjdfgl 创建的主题 MySQL 基本工资标准表数据库怎么设计
可以考虑用拉链表
2021-06-23 11:47:39 +08:00
回复了 enderftt 创建的主题 Python Python lambda 改写
```
print(list(map(lambda x:x.update({'5':5}) or x,d)))
```
用 update 也没啥问题,比如可以用如上这种 trick 来实现
2021-04-17 23:31:17 +08:00
回复了 Te11UA 创建的主题 Python 异步 MySQL 库 databases 的 Table 结构怎么从经典模式转成 ORM?
``` python
from sqlalchemy import select

query = select(User)
```
试试这种可行嘛
2021-03-26 15:36:17 +08:00
回复了 2bin 创建的主题 Python 请教 Python 中 xpath 如何实现这种需求
html.xpath("string(//a)")
2021-03-26 15:25:23 +08:00
回复了 badacook 创建的主题 Python pandas DataFrame
```python

col1 = pd.Series(['a', 'b'])
col2 = pd.Series(['x', 'y'])
col3 = pd.Series(['1', '2'])

col1, col2, col3 = map(pd.DataFrame, [col1, col2, col3])
col1.index = [1 for _ in range(len(col1))]
col2.index = [1 for _ in range(len(col2))]
col3.index = [1 for _ in range(len(col3))]

r = (
col1
.join(col2, how="outer", lsuffix="_col1", rsuffix="_col2")
.join(col3, how="outer")
)
r.columns = ["col1", "col2", "col3"]

print(r)
```
试试 Embedding+FAISS
2020-12-10 11:27:40 +08:00
回复了 jayzau1973 创建的主题 Python 请教一个关于 Mysql 连接的问题
我用的 sqlalchemy,采用的方法是设置超时后把 session 设成 global,然后开了个多线程在超时前销毁 session 并重建,用的地方 import 这个包就行
2020-09-09 20:41:24 +08:00
回复了 Te11UA 创建的主题 Python Python 如何优雅地处理子线程异常?
使用装饰器,把捕获逻辑提取出来
这就是 SQL 根据某几个字段 distinct 吧,可以用 pandas 转成 DataFrame 然后 drop_duplicates,设置 subset 即可,或者用空间换时间,建个 set 存储已见到的数据 tuple,不在 set 内则追加新列表,一遍循环即可
@yellowtail 区别很大,.loc 相当于按键值取,你即使对 dataframe 重排,.loc 取得的值仍是不变的,.iloc 则是按位置,顺序变了取的值也就变了。看了下描述,你的需求可以用 dataframe 的 apply 实现或者 series 的 map 实现,用的广播方式,并行计算,如果用循环那可就太慢了
试试 df.loc[1,"a"]=1
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2835 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 49ms · UTC 14:59 · PVG 22:59 · LAX 06:59 · JFK 09:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.