V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
fuchaofather
V2EX  ›  NAS

immich 重磅更新 OCR

  •  
  •   fuchaofather · 11 小时 53 分钟前 · 2581 次点击

    immich 最新 release开始正式支持 OCR ,当前近乎已经是相册管理的完全体了。

    分享下我的硬件:

    • OES (¥ 99 )部署immich_server,immich_postgres
    • OECT(¥ 80)部署immich_machine_learning 可以用到 rk3566 的 npu 加速
    26 条回复    2025-10-31 18:56:18 +08:00
    unhappy224
        1
    unhappy224  
       11 小时 45 分钟前
    我想问问这套硬件跑起来会有性能问题吗?例如新导入几千张照片这样,扫描要多久?
    如果买好点的 n150 甚至是 7840 那一堆,会快多少?
    kuanos
        2
    kuanos  
       11 小时 33 分钟前
    immich 在 qnap 上每次布置都失败,很绝望啊
    Aprdec
        3
    Aprdec  
       11 小时 24 分钟前
    immich app 一次上传几百张 有 bug
    fuchaofather
        4
    fuchaofather  
    OP
       11 小时 23 分钟前
    @unhappy224 跟你选的模型也有关系,可以参考(官方文档)[https://docs.immich.app/features/searching]根据你的配置(内存、ARM 、CUDA 还是 RKNN )选择合适的模型。我的 oect 是 RKNN+4G 内存所以选择了`ViT-B-16-SigLIP-i18n-256__webli`,图片识别大概 1 秒 3-4 张的样子,OCR 因为 CPU 比较孱弱 6 秒一张
    mooyo
        5
    mooyo  
       11 小时 19 分钟前
    一更新就挂了。。
    [Nest] 6 - 10/31/2025, 10:33:29 AM LOG [Microservices:WebsocketRepository] Initialized websocket server

    Error: getaddrinfo EAI_AGAIN database

    at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26) {

    errno: -3001,

    code: 'EAI_AGAIN',

    syscall: 'getaddrinfo',

    hostname: 'database'

    }

    microservices worker error: Error: getaddrinfo EAI_AGAIN database, stack: Error: getaddrinfo EAI_AGAIN database

    at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26)

    microservices worker exited with code 1

    Killing api process

    没看到 release 上写了啥 breaking changes 啊。。
    fuchaofather
        6
    fuchaofather  
    OP
       10 小时 53 分钟前
    @mooyo 你是哪个版本上来的啊,我每个版本都在跟没啥问题
    mooyo
        7
    mooyo  
       10 小时 51 分钟前
    @fuchaofather #6 解决了。。看了下日志,是我的 pg 数据库启动的时候发现没空间,没拉起来。

    没空间的原因是我的这个虚拟机(跑在 mac mini 上的)只分配了 30G 空间( photo 是网络挂载的),我以为够了,其实已经被 docker 镜像塞满了。。
    lu5je0
        8
    lu5je0  
       10 小时 40 分钟前
    还差个 ultra HDR
    mogita
        9
    mogita  
       10 小时 24 分钟前
    同在 OECT 上运行,五千多照片视频,简直游刃有余。
    mooyo
        10
    mooyo  
       10 小时 18 分钟前
    mac mini 上有办法搞到硬件加速么?跑 docker 上看起来 OCR 性能不太行
    NoDataNoBB
        11
    NoDataNoBB  
       9 小时 38 分钟前
    有支持中文地图的方案吗
    faketemp
        12
    faketemp  
       9 小时 31 分钟前 via iPhone
    immich 虽好部署维护太难了 一不小心各种报错 gpu 核显调用也各种配置各种问题 折腾几次都很难完美跑起来 等有一键整合版再研究🧐
    SenLief
        13
    SenLief  
       9 小时 6 分钟前 via iPhone
    @NoDataNoBB 图源应该没办法改吧,只能把城市这些改为中文。
    chenluo0429
        14
    chenluo0429  
       8 小时 36 分钟前 via Android
    ocr 是真的慢,从早上开始的任务,15000 的资源 3 个并发,现在还有 1000+没跑完
    fuchaofather
        15
    fuchaofather  
    OP
       8 小时 31 分钟前
    @mooyo #10 我试过,有难度。你可以去 discuss 里找找看
    mooyo
        16
    mooyo  
       8 小时 15 分钟前
    @fuchaofather #15 感谢指引,看到了。

    思路是单独运行 machine-learning-svr 到一个支持 ml 的环境(裸环境直连 gpu ,tpu )。

    这个思路适用于存算分离的场景
    Xiaosteven
        17
    Xiaosteven  
       7 小时 21 分钟前
    我用 3090 的训练 ocr 真的慢,10 个并发直接干重启,改成 3 个并发,平均 10 秒 3 个...
    zhucegeqiu
        18
    zhucegeqiu  
       7 小时 14 分钟前   ❤️ 1
    sky300
        19
    sky300  
       7 小时 11 分钟前
    实在折腾不起了 直接入了个 MTPhotos ,省心了。
    rfrftt
        20
    rfrftt  
       7 小时 1 分钟前
    ocr j4125 上 nllb-clip-large-siglip__v1 模型, 差不多 20s 处理一张图
    Jasonqiao
        21
    Jasonqiao  
       6 小时 57 分钟前
    原来 OCR 这么吃性能么,以为是一个基础功能呢
    dobelee
        22
    dobelee  
       5 小时 58 分钟前
    没有 NPU 的群晖能跑吗?
    fuchaofather
        23
    fuchaofather  
    OP
       5 小时 13 分钟前
    @dobelee 能跑,有 gpu 也行,就是快慢的问题
    fuchaofather
        24
    fuchaofather  
    OP
       5 小时 12 分钟前
    @Jasonqiao 用的 PaddleOCR ,中文识别效果应该会很好
    YsHaNg
        25
    YsHaNg  
       4 小时 4 分钟前 via iPhone
    @faketemp n 卡 docker compose 一键起完全没问题
    SatoZ
        26
    SatoZ  
       2 小时 58 分钟前
    试了一下 发现效果极差啊 识别率非常低
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2554 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 13:54 · PVG 21:54 · LAX 06:54 · JFK 09:54
    ♥ Do have faith in what you're doing.