V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dada88xyxy
V2EX  ›  程序员

请教一下大伙是怎么样保存互联网文章?

  •  3
     
  •   dada88xyxy · 2023-05-18 15:53:09 +08:00 · 13719 次点击
    这是一个创建于 547 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常会遇到一个事儿,在 pc 的时候,感觉需要保存的文章会收藏在浏览器里面,然后下次就可以点击访问。但是这样会遇到 2 个问题,1 个是 404 了;另外 1 个是不能全文搜索,有时候不记得在哪个网站,只记得某个关键词,想搜索可以找出来。

    在手机浏览器、微信看到的文章亦是如此,请教各位有什么好方式?

    需求:离线保存;全文搜索

    128 条回复    2024-03-05 10:47:07 +08:00
    1  2  
    basiak
        1
    basiak  
       2023-05-18 16:30:23 +08:00   ❤️ 1
    Instapaper(保存后不要 reload)
    Joplin
    Wallabag
    后俩个都能满足你的需求。第一个适合轻度,不能搜索,需搭配其他比如 Evernote 或者 IFTTT+Pinboard 实现搜索
    dada88xyxy
        2
    dada88xyxy  
    OP
       2023-05-18 16:33:06 +08:00
    @basiak 嗯嗯,好哒,我去学习看看,我就是想把它部署在本地的 nas 上面
    basiak
        3
    basiak  
       2023-05-18 16:38:56 +08:00
    @dada88xyxy Nas 上那就 docker 搭建 wallabag
    不过个人习惯 Instapaper+Joplin ,保存并高亮关键部分,设标签,定时清掉不需要的
    建议不要堆积太多,避免拖延症
    ianEros
        4
    ianEros  
       2023-05-18 16:41:12 +08:00   ❤️ 1
    简悦插件把网页转 markdown 复制
    保存到本地,typora 自动上传图片到图床
    再用 obsidian 管理和查看
    SenLief
        5
    SenLief  
       2023-05-18 16:43:11 +08:00
    evernote
    glogo
        6
    glogo  
       2023-05-18 16:44:05 +08:00
    OneNote, Word, 微软 Office 文档公众号
    dellymay
        7
    dellymay  
       2023-05-18 16:53:30 +08:00
    浏览器插件:Web Clipper
    我是直接扔语雀里去,需要时直接上语雀查
    JimGreen
        8
    JimGreen  
       2023-05-18 16:55:15 +08:00 via iPhone
    印象笔记。长截图。
    LavaC
        9
    LavaC  
       2023-05-18 16:59:09 +08:00   ❤️ 6
    浏览器插件 SingleFile ,设置里绑定个网盘,完事。
    上面那些剪藏的截图的肯定不如把网页整个保存下来完整。
    iold
        10
    iold  
       2023-05-18 17:01:28 +08:00
    我用的 Twilar
    kidzgy
        11
    kidzgy  
       2023-05-18 17:02:18 +08:00
    @LavaC #9 是的,我也是用这个 SingleFile ,非常好用
    glovebx
        12
    glovebx  
       2023-05-18 17:05:08 +08:00   ❤️ 1
    我现在用的开源项目 https://github.com/lcomplete/huntly ,docker 部署好了就一直开着
    shuxhan
        13
    shuxhan  
       2023-05-18 17:06:02 +08:00
    真不错的文章我会转成 md 放在 Obsidain 里备份
    mamili
        14
    mamili  
       2023-05-18 17:11:39 +08:00
    @shuxhan 求教用什么转的 md ?有些网页格式比较多还不好转,特别是图片,我现在还手动存
    Goalonez
        15
    Goalonez  
       2023-05-18 17:17:19 +08:00
    感觉还是简悦保存的效果比较好.虽然感觉简悦各种配置项很多,但是只用自己用得上的功能就可以了.
    看你用什么知识库,可以直接转存到 notion 或者语雀,授权一下就行,也可以通过插件保存到本地 obsidian.
    cbythe434
        16
    cbythe434  
       2023-05-18 17:41:56 +08:00
    在 pc 的时候?
    inu
        17
    inu  
       2023-05-18 17:42:26 +08:00
    我比较好奇大伙都保存什么样的文章,我感觉我都没专门保存过什么...
    MoeMoesakura
        18
    MoeMoesakura  
       2023-05-18 17:46:11 +08:00   ❤️ 1
    Telegram @corsabot , Export To Telegraph
    archive.today
    archive.org
    loomoo23
        19
    loomoo23  
       2023-05-18 17:46:22 +08:00
    用 SingleFile 插件(浏览器) 直接保存整个网页
    mineralsalt
        20
    mineralsalt  
       2023-05-18 17:47:58 +08:00
    我也有一样的烦恼, Joplin 配合浏览器插件可以
    hahastudio
        21
    hahastudio  
       2023-05-18 17:48:42 +08:00
    NAS 上装了 archivebox
    hezhile
        22
    hezhile  
       2023-05-18 17:49:52 +08:00
    cubox
    c2Ns
        23
    c2Ns  
       2023-05-18 17:52:00 +08:00
    edge 浏览器的网页捕获功能。
    rs9G7IrdOdiNR3h1
        24
    rs9G7IrdOdiNR3h1  
       2023-05-18 17:56:52 +08:00
    只有我 ctrl + d 进收藏夹吗?
    DOLLOR
        25
    DOLLOR  
       2023-05-18 18:00:24 +08:00
    浏览器自带保存为 PDF 功能
    garipan
        26
    garipan  
       2023-05-18 18:02:45 +08:00
    Google Keep ,非常好用呀。配合浏览器插件一键保存网页,自带缩略图,还可以摘录一些重要内容黏贴到文字区域。
    关键是不用担心 Google 跑路。我十年前用 keep 存的东西,今天也还可以查看。
    fengjianxinghun
        27
    fengjianxinghun  
       2023-05-18 18:03:51 +08:00
    @garipan google 关闭的服务还少么。。。天国的 GR
    vtexer
        28
    vtexer  
       2023-05-18 18:22:50 +08:00
    飞书的剪存,直接存在飞书文档里
    walker2laok
        29
    walker2laok  
       2023-05-18 18:35:37 +08:00
    @inu 这段话跟你的头像很配...
    iorilu
        30
    iorilu  
       2023-05-18 18:40:35 +08:00
    copy 到 obsidian 就行
    xiparos
        31
    xiparos  
       2023-05-18 18:41:07 +08:00
    cubox pro
    Helsing
        32
    Helsing  
       2023-05-18 18:49:15 +08:00 via iPhone
    cubox
    Radeon
        33
    Radeon  
       2023-05-18 18:50:41 +08:00
    SingleFile
    wqq096737ink
        34
    wqq096737ink  
       2023-05-18 18:51:07 +08:00   ❤️ 1
    @kidzgy
    @LavaC
    网页保存下来不是目的把 , 关键是后续如何搜索
    roycestevie6761
        35
    roycestevie6761  
       2023-05-18 18:51:58 +08:00
    printfriendlypdf
    toloric
        36
    toloric  
       2023-05-18 18:55:08 +08:00
    Notion

    刚弃用印象笔记并迁移到 Notion
    MXMIS
        37
    MXMIS  
       2023-05-18 19:00:49 +08:00
    我和楼主一样的需求,看到好文章随手 Ctrl+D 但是容易丢或者只记得关键词,我用 Wallabag
    hamsterbase
        38
    hamsterbase  
       2023-05-18 19:02:41 +08:00 via Android
    可以看看我的,我之前发了很多帖子了。

    1. 手感无敌,花了几个月打磨手感。
    2. 全文搜索
    3.数据都在本地,不上传任何数据。 无任何埋点,我连自己多少用户都不知道
    4.支持网页批注。
    5.有 api 和 sdk
    joesonw
        39
    joesonw  
       2023-05-18 19:06:17 +08:00 via iPhone
    Evernote 直接 clip ,google 的时候还能同步搜索出现在搜索结果旁边。
    terrysnake
        40
    terrysnake  
       2023-05-18 19:06:19 +08:00
    印象笔记吧,有浏览器插件,公众号给他链接也能保存。
    C47CH
        41
    C47CH  
       2023-05-18 19:09:22 +08:00
    当然是保存到 archive.org ,然后直接保存书签就行了,不过我不用搜索。
    thinszx
        42
    thinszx  
       2023-05-18 19:10:53 +08:00   ❤️ 1
    zotero ,科研利器,也很适合做这个,结合 onedrive 可以多端同步
    mauve
        43
    mauve  
       2023-05-18 19:12:28 +08:00   ❤️ 2
    SingleFile 配合插件自动到 DEVONThink 的 Inbox ,然后借助 Smart Rule 配合定期转成 PDF ,最后用上 ocrmypdf 脚本转换一些不能被检索到的文字,以便之后全局文字搜索,乍一看很复杂,其实都是自动化的,只需要点一下 Chrome 的上的 SingleFile 按钮就好了
    0superx0
        44
    0superx0  
       2023-05-18 19:13:19 +08:00   ❤️ 1
    ctrl+p 保存为 PDF 文件,
    保存到本地
    hicdn
        45
    hicdn  
       2023-05-18 19:15:40 +08:00 via Android
    不需要保存图片的,存 markdown ;需要保存图片的存 pdf 。本地搜索用 recoll 。
    quejuwen
        46
    quejuwen  
       2023-05-18 20:03:12 +08:00
    思源笔记,装浏览器插件
    dudubaba
        47
    dudubaba  
       2023-05-18 20:06:37 +08:00
    notion 搭配官方的剪裁插件
    abcdxe2v
        48
    abcdxe2v  
       2023-05-18 20:08:40 +08:00
    @MoeMoesakura archive.today 最近不能用了
    left7410
        49
    left7410  
       2023-05-18 20:09:31 +08:00
    浏览器装个印象笔记插件可以一键保存网页内容
    yangxii
        50
    yangxii  
       2023-05-18 20:10:55 +08:00
    @dudubaba notion 怎么做到?
    narip
        51
    narip  
       2023-05-18 20:29:13 +08:00
    mushuanl
        52
    mushuanl  
       2023-05-18 20:38:05 +08:00
    notion, 复制粘贴然后保持原链接。
    看过一段时间后自己整理一下
    14
        53
    14  
       2023-05-18 20:44:23 +08:00   ❤️ 2
    我也是 SingleFile:
    - 使用 Chrome 插件 https://chrome.google.com/webstore/detail/mpiodijhokgodhhofbcjdecpffjipkle 一键点击保存
    - 配合安装 https://github.com/gildas-lormeau/single-file-companion 实现静默保存到 Obsidian 文件夹,iCloud 同步
    - Obsidian 安装 https://github.com/nuthrash/obsidian-html-plugin 插件实现预览 SingleFile HTML 文件
    - iPhone 安装 Obsidian 也能同步查看
    zhangfeiwudi
        54
    zhangfeiwudi  
       2023-05-18 20:49:39 +08:00   ❤️ 3
    我比较土, 因为我很喜欢记笔记, 我一般保存文章我都是用自己的话全部写到 Obsidian 里 然后在贴上文章的地址。。 如果不需要写笔记的话 那说明这篇文章不值得我记录
    connection
        55
    connection  
       2023-05-18 21:13:34 +08:00
    evernote
    notion clipper
    cubox
    目前主要 cubox
    foxio2
        56
    foxio2  
       2023-05-18 21:55:05 +08:00
    以前用 Fireshot 也挺好 pdf 或者图片也方便以后检索,排版原汁原味。现在用 SingleFile ,html 也能够全局搜索到文章的细枝末节。而且不用排版,非常好。
    zololiu
        57
    zololiu  
       2023-05-18 21:58:21 +08:00
    有 NAS 的话直接部署 Wallabag 吧,也有手机客户端。
    ispinfx
        58
    ispinfx  
       2023-05-18 21:58:28 +08:00
    Raindrop 凑合着用
    zololiu
        59
    zololiu  
       2023-05-18 22:02:33 +08:00
    @glovebx 之前试过,占用有点高,另外好像不支持把文章以及文章图片保存到本地。
    XxxxD
        60
    XxxxD  
       2023-05-18 23:03:49 +08:00
    instapaper 稍后读,但是我记得之前收藏的一个文章删了就没了
    现在感觉有用的都是 ctrl+S 收藏页面,当然会有个附带的文件夹保存图片 CSS JS 啥的,看前面说的 ctrl+P 打印我也试了下,预览格式不太对,不注重格式可以考虑
    boshok
        61
    boshok  
       2023-05-18 23:08:59 +08:00
    evernote web clipper
    catsnl
        62
    catsnl  
       2023-05-18 23:09:50 +08:00 via iPhone
    简悦+notion
    91pornshanghai
        63
    91pornshanghai  
       2023-05-18 23:34:23 +08:00
    有一个 chrome 插件叫 SingleFile ,可以把网页保存为单个 html 文件
    TabGre
        64
    TabGre  
       2023-05-18 23:35:14 +08:00 via iPhone
    @mauve 我也适用这个软件 为什么不适用它自己的 clip 呢?另请具体工具转 pdf 的
    CatCode
        65
    CatCode  
       2023-05-18 23:58:02 +08:00
    SingleFile 插件同一个作者还做了个支持压缩的版本 SingleFileZ
    zhengkk
        66
    zhengkk  
       2023-05-19 00:21:01 +08:00
    我用的是 Chrome 的阅读清单功能
    piku
        67
    piku  
       2023-05-19 00:42:32 +08:00 via Android
    以前是丢收藏夹。现在分两种情况:一种是网页复制到 OneNote 粘贴(会自动带上格式和来源链接)。另一种是捡重点重写到笔记。
    ychen997
        68
    ychen997  
       2023-05-19 02:23:38 +08:00 via iPhone
    苹果全家桶的话就 Anybox 吧,用过的最好用的收藏夹 app
    ychen997
        69
    ychen997  
       2023-05-19 02:25:11 +08:00 via iPhone
    Anybox 最近还开放 API 可以跟 SingleFile 联动,还有 Raycast Alfred Popclip 的插件
    MetroWind
        70
    MetroWind  
       2023-05-19 02:34:33 +08:00
    给你们推荐个神器: https://github.com/Y2Z/monolith
    fuyun
        71
    fuyun  
       2023-05-19 02:35:46 +08:00
    自建一个 CMS ,接入 ElasticSearch ,或者直接用 WordPress 等,再找一个 ES 插件。
    keegan
        72
    keegan  
       2023-05-19 03:01:28 +08:00
    @mamili maoxian
    hackpro
        73
    hackpro  
       2023-05-19 04:10:55 +08:00 via iPhone
    SingleFile
    wenjing22
        74
    wenjing22  
       2023-05-19 04:28:03 +08:00   ❤️ 1
    xsen
        75
    xsen  
       2023-05-19 06:04:24 +08:00
    notion
    hamsterbase
        76
    hamsterbase  
       2023-05-19 08:38:39 +08:00   ❤️ 2
    @dada88xyxy


    常见的网页归档格式有 MHTML 和 webarchive 。这两种格式都可以将网页的全部图片、样式和 HTML 保存为一个文件。

    操作系统其实自带了保存网页归档的功能:

    安卓 Chrome:点击收藏旁边的下载按钮,保存格式为 MHTML 。
    iOS Safari:点击分享 > 点击选项 > 点击网页归档 > 点击储存到文件,保存格式为 webarchive 。
    Mac Safari:可以按 Ctrl + S 选择网页归档,保存格式为 webarchive 。
    PC Chrome:可以按 Ctrl + S 选择单文件,保存格式为 MHTML 。

    你也可以使用 SingleFile 插件,将网页保存为单个 HTML 文件。

    这些方式可以很好地实现网页的保存和查看。但很难实现网页的检索、管理以及进一步的批注和消化。

    为了更好地管理我之前保存的几千个 html 文件,我开发了 HamsterBase 。它支持解析 HTML 、webarchive 和 MHTML 。导入后支持批注、全文搜索。


    hamsterbase 支持自动导入,放到文件夹下可以自动导入。
    也提供了 API , 可以直接和 singilefile 联动,singilefile 可以一键保存网页到 hamsterbase 。

    ⚠️:hamsterbase 不会修改任何用户导入的文件, 只会压缩后储存。
    ⚠️:hamsterbase 不存储任何用户数据,所有数据都在你的本地。
    tedzhou1221
        77
    tedzhou1221  
       2023-05-19 09:03:35 +08:00
    cubox
    helooo
        78
    helooo  
       2023-05-19 09:15:33 +08:00 via Android
    飞书剪存
    dada88xyxy
        79
    dada88xyxy  
    OP
       2023-05-19 09:17:33 +08:00
    感谢各位大佬啊,好激动好激动,好多干货
    LavaC
        80
    LavaC  
       2023-05-19 09:34:45 +08:00
    @wqq096737ink 因为大部分剪藏都不太能保存页面结构。比如我要保存一个带评论区的微博,保存的时候就会发现类似用户头像、点赞数、图标这类元素在缺少 css 后都会占用太多剪藏后的文章内容,降低了可读性。倒不如先把网页连带 css 和 js 保存下来,保证最原始的阅读体验不变,后续你用 vscode 在文件夹全局搜索也好,另外剪藏也好,都有个可操作区间。
    lrzsw2008
        81
    lrzsw2008  
       2023-05-19 09:43:27 +08:00
    右键,另存为 /保存。
    matthewzhong
        82
    matthewzhong  
       2023-05-19 09:48:31 +08:00
    onenote webclipper 。或者收藏到书签,自己总结一篇文章发到博客。
    codeRhythm
        83
    codeRhythm  
       2023-05-19 09:49:12 +08:00
    我常用的是有道云笔记,对微信公众号特别友好,直接手机分享到 app 就可以自动转存了,网页也可以保存。不用搭建什么,简单好用
    mzDV4TUeHyesLbUQ
        84
    mzDV4TUeHyesLbUQ  
       2023-05-19 09:52:01 +08:00
    通过浏览器插件 SingleFile 直接保存网页。
    wzw369
        85
    wzw369  
       2023-05-19 09:52:56 +08:00 via Android
    手抄下来[doge]
    huanruiz
        86
    huanruiz  
       2023-05-19 09:57:02 +08:00
    直接 fullpage 截屏转 pdf, 好文章值得一个 pdf 的大小
    yellowbean
        87
    yellowbean  
       2023-05-19 10:30:32 +08:00 via Android
    obsidian+markdownload 浏览器插件,
    支持直接解析文章下载 md ,
    还支持鼠标右键菜单直接 send2ob ,
    插件设置页还可以预设格式,自动打标签,标来源时间作者等等......
    y051313
        88
    y051313  
       2023-05-19 10:34:29 +08:00
    带视频的怎么办?
    Scare
        89
    Scare  
       2023-05-19 12:04:09 +08:00
    真的好的,就认认真真用 Word/记事本手动存一下到电脑上,或者截图。
    感觉其他的,就算了吧。。。。
    记得以前翻了翻收藏夹,一大些,基本上都没再第二次看过。。。
    所幸就戒掉了仓鼠症,只选择真的很重要的,其他的就随缘了
    wipbssl
        90
    wipbssl  
       2023-05-19 12:09:16 +08:00
    web clipper 插件+joplin+自定义图床
    SachinBeyond
        91
    SachinBeyond  
       2023-05-19 12:15:55 +08:00
    @huanruiz 后期怎么 方便查找?保存不是目的,构建知识库,方便快速检索才是目的
    zzboat0422
        92
    zzboat0422  
       2023-05-19 12:34:04 +08:00
    印象笔记
    优点是全,目前支持平台最全面( iOS ,安卓,windows ,MacOS ,Linux ),支持浏览器最全面( chrome,edge,safari,各种国内基于 chromium 的浏览器)。
    缺点是慢,卡,运行占资源。

    有道云笔记浏览器剪藏插件不支持 safari
    onenote 没有 linux 版,且不直接支持 markdown
    worldquant
        93
    worldquant  
       2023-05-19 12:58:43 +08:00
    wallabag 浏览器插件一键保存,手机同步或者接入 rss 软件读取浏览很方便。
    mingoing428
        94
    mingoing428  
       2023-05-19 13:05:13 +08:00
    manasheep
        95
    manasheep  
       2023-05-19 14:00:50 +08:00
    飞书剪存。
    Chrome 的 SingleFile 插件,保存网页为单一文件,图片都做 BASE64 转码存入,非常方便,共享时直接传给别人就行了。
    sakishum
        96
    sakishum  
       2023-05-19 14:07:15 +08:00
    使用页面工具将网页生成 markdown 存到本地,推荐使用 https://devtool.tech/html-md
    shuxhan
        97
    shuxhan  
       2023-05-19 14:09:39 +08:00   ❤️ 1
    @mamili https://chrome.google.com/webstore/detail/obsidian-web/edoacekkjanmingkbkgjndndibhkegad 一个谷歌插件,同时也是 obsidain 插件,两个同时启用,我平时使用还行,没啥问题
    manasheep
        98
    manasheep  
       2023-05-19 14:10:21 +08:00
    对了,本地文件搜索,其实可以使用 Anytxt Searcher ,它支持各种办公文档,也可以通过设置添加 html 、htm 文件的支持,非常强大,而且免费,结合 SingleFile 使用很好。
    AItsuki
        99
    AItsuki  
       2023-05-19 14:17:59 +08:00
    不保存,放到阅读清单。看完做笔记(如果需要),做完笔记删除。太久没看的表示我可能不关心了,直接删除。
    exposir213
        100
    exposir213  
       2023-05-19 14:27:13 +08:00
    太麻烦了 notion 吧
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2733 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 15:18 · PVG 23:18 · LAX 07:18 · JFK 10:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.