V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  SorryChen  ›  全部回复第 7 页 / 共 21 页
回复总数  410
1 ... 3  4  5  6  7  8  9  10  11  12 ... 21  
2022-07-07 16:45:43 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@menc 请问是什么场景需要呢,现在导入论文一切都是从拖入 pdf 开始的,如果有了 pdf 不就代表已经下载了嘛😂
2022-07-06 21:28:14 +08:00
回复了 zwyyy456 创建的主题 奇思妙想 如何开发一款自己的 PDF 阅读器
感觉如果码力欠缺还是研究研究绕一步,如果用 raycast utools 这种类似工具的话,写对应的插件比较好。PDF.js 体验属实不太好。PDF 阅读器市面上一票票公司写出来的,体验都不咋地,更不用说咱自己从头捣鼓了是不是。
2022-07-02 17:44:15 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@z1249502889 没办法,一个人维护双平台成本太高了。如果有人能一起就好了
2022-06-30 21:24:25 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@zxCoder 在未来如果有可能的话,我是想尝试用 Deeplearning 的算法去解决这个问题,毕竟自己就是学这个的。也算是学以致用了。应该就能去解决各种极端状况的提取了。
2022-06-30 20:56:57 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@zxCoder 请问您说的处理指的具体是?如果是整个导入流程大概是这样:

总体上是一个个 scraper 串行执行。我根据大概的一个准确度设置的优先级,来提前停止节省搜索时间。

1. 首先是 PDFscraper ,首先解析 PDF 自带的 metadata ,如果里面有 title doi 等信息,那最好,进入下一个 scraper 。如果没有则找全文最大字体的字符。因为标题通常是全文最大的字。这样可以解决一部分文件的标题提取。对于有些特别的文件,比如来自 ICLR 会议的论文,写了单独的逻辑。当然对于更极端的情况,是会提取错误的。这个也是没办法。在不借助神经网络的情况下,我想不到别的单纯的程序能实现的方案。
2. 之后拿到标题之后,基本上就可以在很多数据库里搜 metadata 了。比如 DBLP 之类的。然后根据返回的结果看看是不是找到了然后赋值就可以了。像有 DOI 号的那些,直接 DOI 搜索就能找到唯一的 metadata 了。


大概就是这样
2022-06-29 17:06:23 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@zxCoder 是本地,云数据库存 pdf 的话开销太大了。同步的话大部分人都是 onedrive 之类。也可以 webdav 。
2022-06-28 19:01:29 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@goodhellonice 麻烦问下你是什么专业呢
2022-06-27 16:51:48 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@jaylong papers 是我几年前用过的并且确实是属于中上好用的。坏消息是它停止更新了…
2022-06-26 18:28:56 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@aliceclark 谢谢支持,不过没搞付费,只有捐赠😂
2022-06-26 05:42:45 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@haiyang1992 谢谢
2022-06-25 21:05:08 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@zxCoder 因为一开始是在 mac 上设计的,右上角被菜单按钮们占据了,win 的窗口控制放在右边我始终没找到一个好看的摆放方式…需要想想怎么布局
2022-06-25 15:47:55 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@theRealWhexy 也没啥好看的,就是简洁大方我觉得就挺好:)
2022-06-25 15:47:18 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@nonduality 应该是较老版本 macos 的问题,swiftui 版本是开源了的,代码在 macos native 那个 branch 下。只是我没有那么多精力去维护,因为双平台各一份代码的话要双倍精力了,一个人搞不来。如果你愿意参与 native 版本开发,非常欢迎。感谢
2022-06-25 15:45:33 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@goodhellonice electron javascript
2022-06-25 04:28:37 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@Zhengqing 有一个同学有意接手 SwiftUI 版本的继续开发,之前我玩成基础功能之后就放弃了,因为维护两个平台的代码,实在是没有精力。word 插件我目前没研究怎么写,也许未来可行吧,目前还是先把一些大家报的 bug 什么的修复好。
2022-06-25 01:40:05 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@hamhamham 额我们学校的操作跟你们的不太一样。。。我通常都是点 Institutional Sign In 登陆,然后 paperlib 的插件就可以正常导入并且下载 pdf 了,如果不登陆,就只能导入一些标题,无法下载 pdf 。
2022-06-24 22:12:42 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@zoumouse 我得研究下 zotero 是怎么存的哈,不过最简单的话,就是全部 pdf 全选一下拖进去。
2022-06-24 22:06:13 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@AkashicRecords 对的,zotero 的插件,让他有非常大的优势。这个项目是我一开始本来想弄个自己用的,只是后来慢慢成型了,觉得不分享一下挺可惜的。这个项目因为面向的面足够窄,所以才能让我专注于开发一个小领域的核心需求面,同时面对的问题就是应该无法适用每一个人的需求了。感谢你的使用和反馈。
2022-06-24 19:39:23 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@gdm 原来是这样,看来是我们领域不太相同,我们这领域基本 PDF 都可以下载。你的需求我会考虑的
2022-06-24 19:26:55 +08:00
回复了 SorryChen 创建的主题 分享创造 一个科研狗开发的文献管理软件 Paperlib
@gdm 您是指直接导入 bibtex 文件么?没有 PDF 那种?我设计的理念是,每一个论文词条都是依托于 PDF 的,所以如果你有这方面需要,可以考虑后面版本加一下。
1 ... 3  4  5  6  7  8  9  10  11  12 ... 21  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1070 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 19:08 · PVG 03:08 · LAX 12:08 · JFK 15:08
Developed with CodeLauncher
♥ Do have faith in what you're doing.