V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
SorryChen
V2EX  ›  分享创造

一个科研狗开发的文献管理软件 Paperlib

  SorryChen · 2022-06-24 04:09:19 +08:00 · 15494 次点击
这是一个创建于 902 天前的主题,其中的信息可能已经有所发展或是发生改变。

我是一个在计算机视觉里蝶泳的科研狗,一个文献管理软件基本是我的刚需。从硕到博这么多年用了各种各样的软件:Papers 、Mendely 、Readcub Papers 、Zotero ,没有一款能让我满意舒服的。


现有的软件

诚然这些软件都是伟大的软件,但是或多或少都有些小问题,比如:

  1. 无法精准的抓取到会议论文的发表情况
  2. 功能做的不咋地,一堆用不上的功能,每年太贵的订阅费 = =
  3. 太丑太丑了,像上个世纪的界面(没错说的就是你 zotero )
  4. ......

我想要的

而我想要的就是一个简简单单的论文管理软件:

  1. 他必须能精准地匹配到会议论文的发表情况。我认为这是一个文献管理软件最重要的功能。其他领域可能看期刊很多,但是像我们领域,大部分论文都是会议论文,我想 NLP 应该跟我们 CV 也差不多。但是会议不像期刊,很多都要很久才有 DOI ,有的甚至没有 DOI ,所以市面上的这些软件,几乎没有一个能很好的精准的匹配会议论文 metadata 的。我想要他精准匹配到是不是发表到 ICLR ICML NIPS ECCV 等会议上。而我不想每次写论文对对着一堆 arxiv publication 一个一个去搜他们发表在哪里的去做校对。
  2. 不需要什么花里胡哨的管理功能,就简单的 Tag ,Folder ,加星,Note 。
  3. 能够方便地进行检索,普通搜索,全文搜索,高级语法搜索,让我在开会时候想跟老师讨论一个论文的时候不需要手忙脚乱的去翻文件夹或者 Google 。。。
  4. 作为计算机行当,虽然 Github 的 star 能够收藏论文的代码仓库,但是并不容易找,更多时候还是去 google 。如果这个软件能帮我自动搜 code repository 然后存在软件里就好了。
  5. 当我准备开始写自己论文的时候,如果有方便的方式一键复制 bibtex 就好了。体验就好像打开 spotlight 输入关键词,直接回车粘贴。
  6. 它有一个简洁的 UI ,清晰的图标,至少看着不是上个世纪的。毕竟颜值就是生产力。

于是,一年多以前,在博士刚开始的时候,我就开始着手自己开发一个,符合上述需求的软件。

跟周围同学分享了一下,大家都觉得挺好用的。之前因为觉得不完美,害怕推广了之后自己没精力维护。经过一年多的打磨,这个软件也伴随我一年多的科研,加两次论文投稿。我已经把大部分功能做到我满意的地步了。所以在这里分享一下,给有同样需要的科研狗们!它就是 Paperlib !


Paperlib

使用简介

亮点

  1. 从 arXiv ,doi.org ,DBLP ,IEEE ,openreview.net ,PaperwithCode ,Google Scholar ,为每一篇论文尽量匹配精确的信息以及代码仓库。
  2. 全文搜索,高级搜索。
  3. 快速导出,一键复制 BibTex 。
  4. 为论文评分,分配标签、文件夹,加星,方便进行分类管理。
  5. 可以云同步数据,macOS win 双平台。
  6. 完全开源。

缺点

  1. 这是按照我一个人的科研习惯打造的,我不确定是否大家用的习惯。
  2. 对比 zotero 这软件,说实话因为自己没怎么用,我可能还不知道它有什么极其强大的功能,也许 Paperlib 这里没有。
  3. 开发者只有我一个人,我无法像大公司那样按时修 Bug 。现在基本是就是我周末没事的时候修一修。(不过自己已经很久没遇到什么恶性 bug 了)
  4. 我的领域是计算机视觉,我不确定其他计算机领域的人,比如 NLP 啊,数据库啊,啥的,能不能准确匹配好论文元数据。如果不准确可以开 Issue ,在软件里我定义了一系列 metadata scrapers ,我们可以一起开发更多的符合计算机领域的。但是目前计划是仅仅覆盖到计算机领域。因为其他领域真的不了解。
  5. Electron 。关于 Electron ,可能大部分人都不喜欢吧。实际上 Paperlib 是有 macOS 原生 swiftUI 版本的 branch 的,完成了一些基础的功能。但是作为一个人开发的软件,平时又要科研,想要维护好 win 和 mac 双平台,实在是太难了。最后我只能转为使用 Electron 。如果有任何喜欢 Paperlib 想接手 swiftUI 版本的同学,我非常欢迎。现在我看了看资源占用实际上也没有很夸张,比 zotero 是小一些的。。。可能因为没那么多乱七八糟的功能吧。。

最后的最后,祝大家科研顺利吧!

网址: https://paperlib.app/en/

Github: https://github.com/GeoffreyChen777/paperlib

第 1 条附言  ·  2022-06-24 05:38:13 +08:00
目前发现好像老的 Mac 系统比如 10.11 好像不兼容,也许是 electron 版本太新了。。
第 2 条附言  ·  2022-06-24 14:56:39 +08:00
好像个别同学的 Preference-Cloud 是空白,正在排查
第 3 条附言  ·  2022-06-24 20:06:03 +08:00
目前发现在小分辨率电脑上尺寸分辨率不太友好。下版本改一下
第 4 条附言  ·  2022-06-25 07:50:56 +08:00
v1.7.5

睡觉前发了个新版本:

1. 修 Bug 。
2. 支持三种重命名格式。
3. 支持代理。
4. 支持从文件夹或者 Zotero CSV 导入。

希望不要再有 Bug 啦。
第 5 条附言  ·  2022-06-27 17:27:31 +08:00
Chrome 插件已经审核通过了
第 6 条附言  ·  2022-07-06 17:49:58 +08:00
Apple Silicon 版本已经可以下载啦
第 7 条附言  ·  2022-11-13 09:24:00 +08:00
287 条回复    2024-11-19 12:10:19 +08:00
1  2  3  
shizhao
    101
shizhao  
   2022-06-24 19:01:34 +08:00 via Android
那啥,zotero 可以简单理解为业界的标准格式
SorryChen
    102
SorryChen  
OP
   2022-06-24 19:02:30 +08:00
@c0pper 就实验运行上了,不能干瞪眼等着结果吧。。就写写。。
SorryChen
    103
SorryChen  
OP
   2022-06-24 19:02:51 +08:00
@shizhao 可以说说什么意思吗?标准格式是指?
gdm
    104
gdm  
   2022-06-24 19:25:32 +08:00
好像找不到怎么导入 bibtex ?
SorryChen
    105
SorryChen  
OP
   2022-06-24 19:26:55 +08:00
@gdm 您是指直接导入 bibtex 文件么?没有 PDF 那种?我设计的理念是,每一个论文词条都是依托于 PDF 的,所以如果你有这方面需要,可以考虑后面版本加一下。
1ychee
    106
1ychee  
   2022-06-24 19:30:53 +08:00
@SorryChen 您好,我们使用 @lizhi.io 域名邮箱给您 (cha***.che***@wa***.***.uk)发了一份邮件,您看看?

我们是一家正版软件代理商,想看看未来有无合作机会。
gdm
    107
gdm  
   2022-06-24 19:33:40 +08:00
@SorryChen 是的,毕竟每个博士生都会维护着自己的参考文献列表
我平常读得比较勤快的期刊,pdf 都是导入不了的,只能自己写蜘蛛去爬人家的网站来做 bib 文件,大写的尴尬
SorryChen
    108
SorryChen  
OP
   2022-06-24 19:39:23 +08:00
@gdm 原来是这样,看来是我们领域不太相同,我们这领域基本 PDF 都可以下载。你的需求我会考虑的
gdm
    109
gdm  
   2022-06-24 19:48:17 +08:00
@SorryChen 是毫无关系的两个领域
我这领域一堆古老的顶级 paper 要引,写论文蛮痛苦的
chuanqirenwu
    110
chuanqirenwu  
   2022-06-24 21:57:09 +08:00
博士科研之余还有精力开发软件吗?这执行力和精力让人佩服!
AkashicRecords
    111
AkashicRecords  
   2022-06-24 22:02:50 +08:00
作为 Zotero 的用户,试用了一下。对比 Zotero ,这个作品优点是简洁美观,对 CV 领域信息匹配全是挺强的。非常佩服 OP 能够根据自己的需求实现一个这么优秀的作品。
不过,Zotero 它虽然 UI 丑,但是在插件的加持下确实还是好用一点。比如对中文文献的支持以及可以自定 CLS 的 Word 插件,在国内投论文的话,还是难以替代。除此之外,Zotero 6.0 版本还新增了内置的 PDF 阅读器以及 Markdown 格式的笔记(之前是难用的富文本编辑器……),这对仅需快速查阅一下的论文、记些东西时挺方便的。
看了 OP 之前的帖子,对 Zotero 的上述东西也没啥需求……除此之外确实也没啥值得特别提到的了?
SorryChen
    112
SorryChen  
OP
   2022-06-24 22:06:13 +08:00
@AkashicRecords 对的,zotero 的插件,让他有非常大的优势。这个项目是我一开始本来想弄个自己用的,只是后来慢慢成型了,觉得不分享一下挺可惜的。这个项目因为面向的面足够窄,所以才能让我专注于开发一个小领域的核心需求面,同时面对的问题就是应该无法适用每一个人的需求了。感谢你的使用和反馈。
zoumouse
    113
zoumouse  
   2022-06-24 22:10:40 +08:00
能加个从 zotero 导入的功能嘛
SorryChen
    114
SorryChen  
OP
   2022-06-24 22:12:42 +08:00
@zoumouse 我得研究下 zotero 是怎么存的哈,不过最简单的话,就是全部 pdf 全选一下拖进去。
yhgogogo
    115
yhgogogo  
   2022-06-25 00:00:58 +08:00
留个眼,以后看看有没有 ipad os 版本
James369
    116
James369  
   2022-06-25 00:42:12 +08:00   ❤️ 1
看来 op 主做科研挺闲的嘛,哈哈
hamhamham
    117
hamhamham  
   2022-06-25 01:32:24 +08:00   ❤️ 1
Zotero 的浏览器插件有个功能很好用,识别到各种出版商网站的时候自动启用学校的 VPN (不是专门的 VPN 软件,而是 ezproxy 那种在 url 前面加一串字符就能用的,比如 https://login.ezproxy.library.xxxxx.edu/login?url=)。这个在学校外看论文的时候非常有用。
SorryChen
    118
SorryChen  
OP
   2022-06-25 01:40:05 +08:00
@hamhamham 额我们学校的操作跟你们的不太一样。。。我通常都是点 Institutional Sign In 登陆,然后 paperlib 的插件就可以正常导入并且下载 pdf 了,如果不登陆,就只能导入一些标题,无法下载 pdf 。
hamhamham
    119
hamhamham  
   2022-06-25 01:44:24 +08:00
@SorryChen 那这个可能是小众需求😂。我们学校在 Institutional Sign In 里经常找不到,所以这个方法更方便。
Zhengqing
    120
Zhengqing  
   2022-06-25 04:11:56 +08:00 via iPhone
救命啊 太需要了啊!
Zhengqing
    121
Zhengqing  
   2022-06-25 04:19:53 +08:00 via iPhone
要是有 swiftui 版本就好了!能更好看一点。可以加入 mac 上 word 的插入引用嘛!
SorryChen
    122
SorryChen  
OP
   2022-06-25 04:28:37 +08:00
@Zhengqing 有一个同学有意接手 SwiftUI 版本的继续开发,之前我玩成基础功能之后就放弃了,因为维护两个平台的代码,实在是没有精力。word 插件我目前没研究怎么写,也许未来可行吧,目前还是先把一些大家报的 bug 什么的修复好。
nonduality
    123
nonduality  
   2022-06-25 11:09:47 +08:00
10.12 下没法使用,界面一片空白。
我还是支持 Mac 原生程序,如果可能,把 Swift 版开源了吧。
goodhellonice
    124
goodhellonice  
   2022-06-25 11:58:52 +08:00
比较好奇 是用什么语言写的
theRealWhexy
    125
theRealWhexy  
   2022-06-25 12:29:53 +08:00
真罕见啊,CS 博士生画 UI 也这么好看(
SorryChen
    126
SorryChen  
OP
   2022-06-25 15:45:33 +08:00 via iPhone   ❤️ 1
@goodhellonice electron javascript
SorryChen
    127
SorryChen  
OP
   2022-06-25 15:47:18 +08:00 via iPhone
@nonduality 应该是较老版本 macos 的问题,swiftui 版本是开源了的,代码在 macos native 那个 branch 下。只是我没有那么多精力去维护,因为双平台各一份代码的话要双倍精力了,一个人搞不来。如果你愿意参与 native 版本开发,非常欢迎。感谢
SorryChen
    128
SorryChen  
OP
   2022-06-25 15:47:55 +08:00 via iPhone
@theRealWhexy 也没啥好看的,就是简洁大方我觉得就挺好:)
goodhellonice
    129
goodhellonice  
   2022-06-25 16:25:20 +08:00
@SorryChen 非常棒 感谢分享
zxCoder
    130
zxCoder  
   2022-06-25 20:51:43 +08:00
windows 版如果关闭按钮能放右上角就好了
SorryChen
    131
SorryChen  
OP
   2022-06-25 21:05:08 +08:00 via iPhone   ❤️ 1
@zxCoder 因为一开始是在 mac 上设计的,右上角被菜单按钮们占据了,win 的窗口控制放在右边我始终没找到一个好看的摆放方式…需要想想怎么布局
haiyang1992
    132
haiyang1992  
   2022-06-25 22:24:59 +08:00 via iPhone
可惜刚毕业已经不太需要了,无论如何支持 op
SorryChen
    133
SorryChen  
OP
   2022-06-26 05:42:45 +08:00 via iPhone
@haiyang1992 谢谢
ddzzhen
    134
ddzzhen  
   2022-06-26 08:24:45 +08:00 via Android
厉害,ui 好评
aliceclark
    135
aliceclark  
   2022-06-26 10:31:21 +08:00
我几乎有着和你一样的需求(大多数科研狗的共同需求吧)
也好几次 git init ,最后都没坚持下来,惭愧惭愧
下半年要开始写 dissertation 了,试试 Paperlib
目前来说,看上去有付费的冲动了
SorryChen
    136
SorryChen  
OP
   2022-06-26 18:28:56 +08:00 via iPhone
@aliceclark 谢谢支持,不过没搞付费,只有捐赠😂
jaylong
    137
jaylong  
   2022-06-27 16:02:06 +08:00
@SorryChen
我目前用的是 papers 管理文献
它的文献匹配搜索引擎包括这些:
ACM
ADS
arXiv
CERN DS
CrossRef DOI
Crossref Search
DBLP
Espacenet
Google Books
Google Patents
Google Scholar
Gutenberg
Highwire
IEEExplore
Inspire
JSTOR
Lib of Congress
MathSciNet
New York Times
OAlster
Open Content
Pubget
PubMed
ScienceDirect
Scopus
Web of Science
Wikipedia

作为生物类文章我最常勾选的其实就 4 个就够了
PubMed
ScienceDirect
Scopus
Web of Science
SorryChen
    138
SorryChen  
OP
   2022-06-27 16:51:48 +08:00 via iPhone
@jaylong papers 是我几年前用过的并且确实是属于中上好用的。坏消息是它停止更新了…
goodhellonice
    139
goodhellonice  
   2022-06-28 18:44:18 +08:00
试了下 对我专业不是很对口
SorryChen
    140
SorryChen  
OP
   2022-06-28 19:01:29 +08:00
@goodhellonice 麻烦问下你是什么专业呢
zxCoder
    141
zxCoder  
   2022-06-29 11:49:24 +08:00
论文对应的 pdf 是存储在本地吗,能多端同步吗,还是说要自己同步这些 pdf ?
SorryChen
    142
SorryChen  
OP
   2022-06-29 17:06:23 +08:00 via iPhone
@zxCoder 是本地,云数据库存 pdf 的话开销太大了。同步的话大部分人都是 onedrive 之类。也可以 webdav 。
zxCoder
    143
zxCoder  
   2022-06-30 20:45:26 +08:00
看代码里使用 pdfjs 解析导入的 pdf ,对于无法解析的 pdf (特别是没有 title 字段的),是怎么处理的呢?
SorryChen
    144
SorryChen  
OP
   2022-06-30 20:56:57 +08:00   ❤️ 1
@zxCoder 请问您说的处理指的具体是?如果是整个导入流程大概是这样:

总体上是一个个 scraper 串行执行。我根据大概的一个准确度设置的优先级,来提前停止节省搜索时间。

1. 首先是 PDFscraper ,首先解析 PDF 自带的 metadata ,如果里面有 title doi 等信息,那最好,进入下一个 scraper 。如果没有则找全文最大字体的字符。因为标题通常是全文最大的字。这样可以解决一部分文件的标题提取。对于有些特别的文件,比如来自 ICLR 会议的论文,写了单独的逻辑。当然对于更极端的情况,是会提取错误的。这个也是没办法。在不借助神经网络的情况下,我想不到别的单纯的程序能实现的方案。
2. 之后拿到标题之后,基本上就可以在很多数据库里搜 metadata 了。比如 DBLP 之类的。然后根据返回的结果看看是不是找到了然后赋值就可以了。像有 DOI 号的那些,直接 DOI 搜索就能找到唯一的 metadata 了。


大概就是这样
zxCoder
    145
zxCoder  
   2022-06-30 21:20:34 +08:00
@SorryChen 谢谢解答。刚刚我也仔细看了下代码(不太熟悉 electron )

”如果没有则找全文最大字体的字符。因为标题通常是全文最大的字。这样可以解决一部分文件的标题提取。“ 这个想法和我之前想的一样 hh ,之前写过一个解析 pdf metadata 的小脚本,就是大概用的这个逻辑
SorryChen
    146
SorryChen  
OP
   2022-06-30 21:24:25 +08:00
@zxCoder 在未来如果有可能的话,我是想尝试用 Deeplearning 的算法去解决这个问题,毕竟自己就是学这个的。也算是学以致用了。应该就能去解决各种极端状况的提取了。
xswer001
    147
xswer001  
   2022-07-02 15:51:58 +08:00
感谢作者,界面比 zotero 好看太多了。不过还不能原生支持 macOS native 会有点遗憾,electron 应用一直觉得没那么流畅
SorryChen
    148
SorryChen  
OP
   2022-07-02 17:44:15 +08:00 via iPhone
@z1249502889 没办法,一个人维护双平台成本太高了。如果有人能一起就好了
menc
    149
menc  
   2022-07-07 15:35:46 +08:00
一个可能不太现实的小问题,能不能把 sci-hub 下载集成进来呢(
SorryChen
    150
SorryChen  
OP
   2022-07-07 16:45:43 +08:00 via iPhone
@menc 请问是什么场景需要呢,现在导入论文一切都是从拖入 pdf 开始的,如果有了 pdf 不就代表已经下载了嘛😂
allAboutDbmss
    151
allAboutDbmss  
   2022-07-25 15:04:01 +08:00
在 edge 里面用这个 chrome 插件

点击插件后显示: paperlib processing...

这样是正常的吗?
SorryChen
    152
SorryChen  
OP
   2022-07-25 15:12:52 +08:00 via iPhone   ❤️ 1
@allAboutDbmss 你要打开主体软件,然后在相应网站点击插件,就会导入论文。比如 arxiv ,点了之后你会看到主体软件出现转圈的图标,表示在下载论文导入
allAboutDbmss
    153
allAboutDbmss  
   2022-07-26 15:52:51 +08:00
@SorryChen 主题软件是 mac 或 win 的桌面端软件吗?
可是我是 Linux, 以为 chrome 插件可以平替
SorryChen
    154
SorryChen  
OP
   2022-07-26 17:29:41 +08:00 via iPhone
@allAboutDbmss 插件是方便导入论文的,与主体软件通信,linux 理论上需要重新编译,然后看看有没有 bug ,我手上没有 linux 机器所以没测试
henrylau0220
    155
henrylau0220  
   2022-08-06 22:02:22 +08:00
感谢作者。提一些个人建议:
- 记住上一次设置,如排序方式、listview/tabelview 。不然每次关闭软件后,重新打开又是原始设置
- 能否给论文添加一个别名,在编辑论文信息页面中编辑,并能通过论文别名进行搜索
- 通过键盘上 delete 键删除论文
- 编辑论文信息时,通过快捷键保存编辑好的信息,如 ctrl+s
- 增加对论文的批量操作,如删除、打上标签(一次性导入多篇论文,比如从别的平台迁移过来,一篇篇打上 tag 很慢)
- 在左侧能直接创建新 tag 和 folder ,并能对已有 tag/folder 更换名称
- tag/folder 名称最好能支持中间包含空格
SorryChen
    156
SorryChen  
OP
   2022-08-06 22:15:21 +08:00
@henrylau0220 感谢您的建议

- 记住上一次设置,这些是近期会加上的。

- 论文别名可以很简单的通过 note 来实现,比如一篇论文是 Axx Bxx Cxx ,你在 note 里写上 ABC ,然后搜索 ABC 就能搜到了。默认搜索是包含 note 字段的。

- 通过键盘上 delete 键删除论文,这个我考虑考虑,不同平台的删除快捷键不太一样。

- 编辑论文信息时,通过快捷键保存编辑好的信息,如 ctrl+s ,同上。

- 增加对论文的批量操作:
1. 删除本来就是支持多篇操作的,比如 shift ,ctrl 多选之后,然后点击删除就行了
2. 多篇添加 tag ,你可以根据上述操作多选之后,直接拖拽到左侧的某一个 tag 或者 folder 上面。就添加了。
3. 导入多篇,这个功能本来就是支持的,比如把三个 PDF 文件同时框选拖入到主界面。另外,如果想导入一个文件夹下的所有,设置界面里面,import 选项卡有导入一个文件夹的功能。但是需要注意,如果一个文件夹下太多,全部导入第一次可能会导致有些论文的 metadata 搜索不到。因为有的数据库有每分钟请求次数限制。

- 在左侧能直接创建新 tag 和 folder ,并能对已有 tag/folder 更换名称,创建新的 tag 和 folder 这个东西,和我的设计逻辑不太一样。我设计的 tag 和 folder 是强依附于每一个论文的,也就是说,在没有对应论文之前,不存在空的 tag 和 folder 。所以还需要考虑这个设计。

- tag/folder 名称最好能支持中间包含空格,仅用空格是因为空格有时候会导致一些数据库字段的奇怪的 bug 。目前推荐使用连字符 - 或者下划线 _ 来进行分割。
henrylau0220
    157
henrylau0220  
   2022-08-06 22:45:04 +08:00
谢谢回复!我还有一个问题:如果一篇论文在 paperswithcode 上有多个 repo ,会以哪个为准呢?另外,能手动修改 repo 信息吗?因为可能有时候显示的是错误的,并不包含代码
SorryChen
    158
SorryChen  
OP
   2022-08-06 22:54:28 +08:00
@henrylau0220 目前从代码逻辑上是所有仓库都会显示,一个一个往后排,不过我还没仔细关注过,如果你遇到显示不全的,可以把论文标题回复给我,我来查查看。

另外关于修改代码 repo 信息,我还在设计编辑界面该如何显示。因为现在的论文信息编辑界面已经稍显拥挤了。现在的一个代码仓库有两个字段:

{
url: string,
isOfficial: bool
}

如果有多个仓库结果的话,如何能够精巧地在编辑界面排列开又不显得拥挤,需要思考一下,我还在设计中。
henrylau0220
    159
henrylau0220  
   2022-08-06 23:09:39 +08:00
@SorryChen 论文标题是 Zero-Shot Instance Segmentation ,paperswithcode 上显示了有三个 repo ,paperlib 上只显示了第二个,点进去还是错的,所以我才想能不能手动修改
SorryChen
    160
SorryChen  
OP
   2022-08-06 23:11:31 +08:00
@henrylau0220 谢谢,我来看看,如果有 Bug ,会尽快修复。
SorryChen
    161
SorryChen  
OP
   2022-08-08 21:18:38 +08:00
@henrylau0220 你好,你的这个问题我修复好啦,之前是因为 paperwithcode 的 API 如果按照标题搜索的话,只返回一个 repo ,现在是在标题搜索拿到对应的 id 之后再通过 id 搜索,最后得到所有 repo 之后取 star 数前三名的展示。现在你的这个论文应该能搜到相应的代码仓库了。
SorryChen
    162
SorryChen  
OP
   2022-08-08 21:20:20 +08:00
@henrylau0220 另外,那些保存界面和排序选项的功能也做好了。
SorryChen
    163
SorryChen  
OP
   2022-08-21 02:03:35 +08:00
@gdm 您好,这个功能已经实现啦,直接拖入 bibtex 就可以啦,欢迎尝试哈。同时也支持从 scihub 等地方搜索 pdf 啥的了。
SorryChen
    164
SorryChen  
OP
   2022-08-21 02:04:17 +08:00
@menc 您好,这个在 v1.9.6 已经实现啦。欢迎体验
gdm
    165
gdm  
   2022-08-21 23:04:39 +08:00
@SorryChen 谢谢! 2 万 1 千条数据导入成功,软件运行状态良好
SorryChen
    166
SorryChen  
OP
   2022-08-21 23:06:42 +08:00
@gdm 两万一千??!! 佩服佩服。。也太多了。。。。刚好可以压力测试看看有没有什么卡顿。。。有任何问题欢迎继续反馈。。
gdm
    167
gdm  
   2022-08-21 23:20:29 +08:00
@SorryChen 我用蜘蛛把全台湾同领域 I 的期刊抓下来,另外再用读秀数据提取了若干个出版社的书,就得到这么多东西了……
虽然我写论文用不到那么多数据,但等到引用的时候再抓就会很烦躁,索性全抓了。我这领域写博士论文,正常范围是 300-1000 个注脚,多抓一点准备起来也不亏
TimeLover
    168
TimeLover  
   2022-08-31 09:13:07 +08:00
导出的快捷键似乎冲突,能不能提供改键功能?
SorryChen
    169
SorryChen  
OP
   2022-08-31 15:07:01 +08:00 via iPhone
@TimeLover 你说的导出具体是哪个哇?
TimeLover
    170
TimeLover  
   2022-09-01 02:56:58 +08:00
MacOS 12.5.1, command + shift + K, command + shift + C, 似乎和我其它快捷键有冲突,所以用不了,想改键
TimeLover
    171
TimeLover  
   2022-09-01 03:01:54 +08:00
除了快捷键问题,我还一直收到这个报错,不知道是否相关
Uncaught Exception:
TypeError: Object has been destroyed
at BrowserWindow.<anonymous> (/Applications/Paperlib.app/Contents/Resources/app.asar/dist/main/index.cjs:1:6179)
at BrowserWindow.emit (node:events:402:35)
SorryChen
    172
SorryChen  
OP
   2022-09-01 03:02:40 +08:00 via iPhone
@TimeLover ok 知道啦,下个版本更新,你也可 尝试下 cmd shift i 呼出的插件,写作的时候更方便
SorryChen
    173
SorryChen  
OP
   2022-09-01 03:04:18 +08:00 via iPhone
@TimeLover 这个很奇怪,请问是何时何种操作出现这种报错?
TimeLover
    174
TimeLover  
   2022-09-01 03:17:57 +08:00
@SorryChen 就是我关闭窗口,保持后台运行状态,然后这时打开软件,就会报错。cmd shift i 每次只是一个 citation ,我都是导入很多 paper 之后一下子全选然后 cmd shift c 导出。还有一个请求,能不能添加 cmd a 全选的支持。感谢,我也是 phd ,软件很好用。
SorryChen
    175
SorryChen  
OP
   2022-09-01 03:29:10 +08:00 via iPhone
@TimeLover 你反馈的 bug 我会查一查,感谢建议
SorryChen
    176
SorryChen  
OP
   2022-09-01 07:15:23 +08:00
@TimeLover 您好 提出的 Bug 和改键需求已经修复和添加好了。

您可以先试试原来的键位是不是 OK 了,应该是可以正常工作了。如果不行再试试改键
TimeLover
    177
TimeLover  
   2022-09-02 12:13:24 +08:00
@SorryChen 感谢,原来键位 work 了。
fl2d
    178
fl2d  
   2022-09-10 22:04:58 +08:00
如果数据库与 pdf 都可以直接用一个 onedrive 或 dropbox 同步就更方便了
SorryChen
    179
SorryChen  
OP
   2022-09-10 22:46:29 +08:00 via iPhone
@fl2d onedrive 这种同步盘是很难做数据库同步的,试想一下你在 A 电脑写入了一个放在 onedrive 的数据库文件,但是 onedrive 没有及时同步,你在 B 电脑同样也写了一些东西进数据库。此时该如何合并呢? onedrive 无法处理这种数据库合并。因为 onedrive 本来设计的就是同步文档而不是数据库的。
fl2d
    180
fl2d  
   2022-09-11 09:36:09 +08:00
@SorryChen
我感觉可以把数据库里的每条记录分别写成文件,放在同步文件夹里,这样就从同步数据库变为同步记录了?本地数据库做了任何修改后都要修改同步文件夹里的相应记录,同步文件夹里的记录被远程修改后本地数据库也修改。
倒也不是 feature request ,只是一个思路,不知是否可行?
SorryChen
    181
SorryChen  
OP
   2022-09-11 09:38:50 +08:00 via iPhone
@fl2d 这样怎么做快速检索呢……,现在可以方便的搜索,分类正是因为用了专门的数据库哇
fl2d
    182
fl2d  
   2022-09-11 09:47:43 +08:00
@SorryChen
首次同步的时候本地 app 根据文件夹里的记录重建数据库,搜索啥的还是数据库。后面是根据同步文件夹里记录的修改来修改数据库。不过想了一下同步逻辑,似乎确实挺麻烦的😂
SorryChen
    183
SorryChen  
OP
   2022-09-11 17:59:13 +08:00
@fl2d 这不就相当于我自己重写了整个数据库的冲突处理,我觉得太麻烦啦,目前的方案是我想到的最好的方案了。。。其他的觉得自己写不太靠谱了 😂
luistrong
    184
luistrong  
   2022-09-30 18:48:39 +08:00
体验了一下 OP 的软件,首先感谢制作了一款界面精美的软件。
只提一个个人觉得最需要完善的功能:内置 pdf 阅读,如果跳到第三方阅读器会对文献阅读产生很强的割裂感,很多时候只是极快速的浏览或查找多篇文献中的某个内容,没有内置 pdf 阅读器的这种时候会很不方便。
个人 15 年开始几乎把所有的文献软件都试过了,还是觉得 papers3 最好用,无奈 papers3 在 M 芯片上无法打开。选择 papers3 的一个很大的原因是可以把视图调整为一个窗口内上面是文献列表,下面直接显示 pdf 内容,这样真是极大的提高了阅读和查看的效率!!这真是文献完美的展现方式啊!!!希望这个软件也可以支持这种视图。
SorryChen
    185
SorryChen  
OP
   2022-09-30 19:54:51 +08:00
@luistrong 如果只是内置简单的 PDF 查看,这非常简单,但是如果想做到完美的 PDF 阅读体验,那很难,因为很难做到比专业做 PDF 浏览器的那些软件好。我现在就在用 Skim 读论文,非常轻量顺滑。

如果你想要快速浏览,不编辑标注等,那你可以尝试按空格键,就可以打开预览窗口,就像在 mac 的 Finder 里预览文件一样。

我也同意 Papers3 是最好的,我也非常喜欢,但是很可惜已经不更新了。但是我在使用 Paper3 的时候也没怎么用过这种上面列表下面 PDF 的视图。我想仔细问一下,这样做的好处具体是什么呢?是在一种什么样的工作环境下会进行这样的操作。期待您的回复。

如果还有别的 Paperlib 做的不好的地方,可以随意指出, 谢谢您的建议。
luistrong
    186
luistrong  
   2022-09-30 20:56:18 +08:00
@SorryChen #185
https://imgur.com/a/jBmH8RE
这个是我的 papers3 的页面布局,当有大量文献时,很多时候找灵感或者搜索关键词,一篇一篇找过去,pdf 的可视化窗口非常有用,尤其是搜索的时候。还有场景就是一次性下载很多文献批量导入后,这种布局能够很快过一遍,比预览的小窗体验好不少。
个人对于云功能、批注功能用的比较少,文献看多了,基本只是备注一下关键词,另外数据库啥的个人觉得只要能做到文献基本信息的识别就可以了(能够导出引用)。
搜索和下载文献还是交给浏览器吧,毕竟还要登录信息,浏览器的搜索引擎用谷歌和谷歌学术就足够了,一些很冷门的文献也没多少含金量(谷歌一般也都能搜到)。
luistrong
    187
luistrong  
   2022-09-30 21:03:38 +08:00
@SorryChen #185 你可以用 papers3 体验一下这种视图,真是好用到飞起,3.4.1 版本的 pdf 窗口可以记忆放大倍数,后面版本的都不行了。
SorryChen
    188
SorryChen  
OP
   2022-09-30 21:15:26 +08:00
@luistrong 我是知道这个视图的,只是我没感觉出对我个人的用处。我感觉还是工作习惯不同导致的。

关于检索,看起来你的研究领域是材料,跟我计算机差别很大,我想你们领域大部分论文来自 Journal , 而计算机领域大部分论文来自 Conference 。

区别就是,Conference 的发表,想在 google scholar 这些地方收录,很可能这个论文的 idea 已经过时了。。我们领域的论文 idea 更新特别特别快,所以需要非常及时的追新。所以像这些现存的软件的逻辑是,在各大期刊网站点击插件,从网页上抓信息,导入软件。这个时候因为已经都是发表了的论文了,通常 metadata 非常好找。然而,通常我们领域的工作流程都是在 arxiv 预印本 未发表的时候就会关注到一些工作。所以我们导入自己数据库的时机,不是他在各大期刊网站发表收录之后,而是他只有一个草稿 PDF 的时候。等他发表的时候,可能很久都过去了。而且,大量的会议论文不像是 Journal 是没有 DOI 的,这些现存的软件,几乎无法找到元数据。这也就是我做这个软件的初衷。

不同领域的人可能是无法感受到这个痛点的,因为工作流程不一样。
SorryChen
    189
SorryChen  
OP
   2022-09-30 21:15:46 +08:00
@luistrong 另外 papers3 已经在我的电脑上打不开了。。不支持了。。
SorryChen
    190
SorryChen  
OP
   2022-09-30 21:24:27 +08:00
@luistrong https://imgur.com/a/x9YxWOg

这就是个很好的对比,上面是 zotero ,下面是 paperlib 。甚至 19 年的回忆论文,zotero 都无法检索到发表信息。
SorryChen
    191
SorryChen  
OP
   2022-09-30 21:24:44 +08:00
@SorryChen 回忆->会议
luistrong
    192
luistrong  
   2022-09-30 21:25:59 +08:00
@SorryChen #189 嗯,确实,不用领域对软件需求差别很大,papers3 的最后那版在 M 芯片上还是能打开的。
SorryChen
    193
SorryChen  
OP
   2022-09-30 21:27:46 +08:00
@luistrong 确实,只有自己才懂自己的领域,我很懂我的领域,但我不懂别的领域,这是我很头疼的地方。我也不知道该怎么去找不同学科的人去问,心中满意的文献管理软件是什么样的。我认识的朋友学科太有限了。
luistrong
    194
luistrong  
   2022-09-30 21:28:59 +08:00
@SorryChen #190 的确,paperlib 界面美观度比 zotero 好很多
SorryChen
    195
SorryChen  
OP
   2022-10-01 01:50:59 +08:00
@luistrong 进行了一个拙劣的模仿

https://imgur.com/a/5ZB8F4l

😂😂😂
luistrong
    196
luistrong  
   2022-10-01 08:23:04 +08:00
@SorryChen #195 牛啊!期待新的版本!👍
luistrong
    197
luistrong  
   2022-10-01 08:51:12 +08:00
@SorryChen #195
有了上列表下 pdf 显示的视图后,如果右侧栏能支持调节宽度就好了。因为有时外接显示器,屏幕够大,pdf 的可查看性足够, 有时如果内置屏幕看的话,现在的右侧边栏还是太宽了,pdf 显示区域会受限。现在的右侧边栏显示的信息基本上列表都能体现了,而且现在的右侧边栏下部还有很大的空白,变窄后完全可用。
另外,不知道软件对论文的 support information ( si )如何关联,papers3 的处理方式是可以拖到软件的右下角,可以跟主 pdf 关联。( si 对于工科的论文来说是必备的文件,好一点的期刊 si 的页数会超过正文好几倍,重要性很高)
软件的搜索功能好像不行,高级搜索和普通搜索都无法搜出结果。
SorryChen
    198
SorryChen  
OP
   2022-10-01 14:12:21 +08:00 via iPhone
@luistrong 如果你是说补充材料的话,直接拖到右侧详情面板就可以了,任何格式都可以连接上。关于搜索,请问你是说在你使用的时候搜索不能用吗?具体表现是如何?
luistrong
    199
luistrong  
   2022-10-01 19:44:36 +08:00
@SorryChen #198 就是搜索栏打入一个词后,按下搜索键,没有任何反应。
SorryChen
    200
SorryChen  
OP
   2022-10-01 20:04:43 +08:00 via iPhone
@luistrong 这实在是太奇怪了,我在很多机子上测试都没这个问题,请问您是什么系统?
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   761 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 22:02 · PVG 06:02 · LAX 14:02 · JFK 17:02
Developed with CodeLauncher
♥ Do have faith in what you're doing.