V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
roricon
V2EX  ›  编程

网站一般怎么做简体/繁体切换呢?内容怎么保存?搜索怎么处理?

  •  
  •   roricon · 2015-02-12 15:51:18 +08:00 · 4788 次点击
    这是一个创建于 3602 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我简单的想法是,统一保存简体内容,使用繁简切换的JS库。
    搜索时候转换成简体,返回结果再用JS处理一遍。

    我觉得肯定有更好的解决方式,希望大家能给点想法。

    10 条回复    2015-02-12 19:32:06 +08:00
    Agromania
        1
    Agromania  
       2015-02-12 15:56:03 +08:00   ❤️ 1
    如果内容不多,对准确要求高,建议维护简繁两个版本的内容,程序转换是不靠谱的。

    比如简体“后”,解释是古代君主或帝王的妻子的时候,繁体是“后”,解释是空间或时间上与“前”相对的时候,繁体是“後”

    这种情况非常之多。维护一个大词典,做分词和猜测意思,能够从某种程度上解决这个问题,但是古文中很多单字为句的,要联系上下文还要具备专业知识才能判断,不是程序能搞定的。
    roricon
        2
    roricon  
    OP
       2015-02-12 15:59:45 +08:00
    @Agromania
    看来我想的还是简单了。
    lichao
        3
    lichao  
       2015-02-12 16:03:09 +08:00   ❤️ 1
    举个简单的例子

    我们说 软件,他们说 軟體(软体)
    我们说 缓存,他们说 快取

    除非你的转换程序足够智能,否则还是维护两套内容吧
    Agromania
        4
    Agromania  
       2015-02-12 16:15:50 +08:00
    如果内容是你自己维护的,又要追求准确,最好是简体繁体分别维护。

    字典转换的库很不准确,转换出来的繁体在真正使用繁体的人眼里可能是笑话百出的
    词典准确性要好的多,比如楼上说的,你对简体内容做分词,根据词典做单元匹配,把“软件”转换成“軟體”。这个词典会非常大,我记得看过一个,词数是千万条的量级。应该要放在后端处理,JS搞不定。但是还是会遇到一些无法分词匹配不上的情况,

    比如“过年了,我家门上贴了一个 ‘发’ 字”
    这里应该转成發,如果转成髪就要闹笑话了。

    这个诗词网 http://sou-yun.com
    有一个简繁转换的功能http://sou-yun.com/STConvert.aspx
    也许不适用你的场景但是希望能对你有所启发,他们在转换的时候碰到1对多的情况 会分别告诉用户什么意思,让用户自己选择。
    seki
        5
    seki  
       2015-02-12 16:18:52 +08:00   ❤️ 1
    opencc
    wikipedia 也维护有一个较大的简繁转换库

    这些也都不重,但是要 js 完成的话总得把一个数据库传输到用户浏览器里,我国的窄带网玩不动啊
    Kilerd
        6
    Kilerd  
       2015-02-12 17:40:15 +08:00 via Android
    直接做好i18n就好啦,
    shiny
        7
    shiny  
       2015-02-12 17:41:49 +08:00
    简体转繁体会有比较多的错误,繁体转简体问题会少很多。
    tmqhliu
        8
    tmqhliu  
       2015-02-12 17:49:07 +08:00
    曾经用过繁体中文版的 Windows XP,用了一周时间,觉得界面有点乱,然后就果段重装……
    abelyao
        9
    abelyao  
       2015-02-12 19:12:05 +08:00
    曾见过一个简繁切换做得非常好的网站,它是这样的:
    cn.domain.com 为简体中文页面,面向大陆用户;
    hk.domain.com 为香港繁体页面,面向香港用户;
    tw.domain.com 为台湾繁体页面,面向台湾用户;

    如果当前你在访问 cn.domain.com/abc/xyz.html 页面,然后点击切换到香港繁体,会直接进入 hk.domain.com/abc/xyz.html 去,页面的外观样式完全一样,但是接下来你就是在 hk 这个子域继续浏览了,体验很赞。

    另外如果访问 domain.com 或者 www 的话,会根据 IP 地址所在地区自动跳入 cn / hk / tw。
    blacktulip
        10
    blacktulip  
       2015-02-12 19:32:06 +08:00
    楼主应该分开维护,非要维护一个的话,维护繁体比较靠谱
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5353 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:01 · PVG 16:01 · LAX 00:01 · JFK 03:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.