V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ghostgril
V2EX  ›  前端开发

首字母排序,多音字如何处理呢

  •  
  •   ghostgril · 2018-06-12 13:36:05 +08:00 · 2987 次点击
    这是一个创建于 2384 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在做一个地址按照首字母排序的页面,但是发现类似重庆这样的就会被分配到 Z 组里面去

    有什么解决方案吗

    9 条回复    2021-03-07 15:24:14 +08:00
    wxsm
        1
    wxsm  
       2018-06-12 16:45:32 +08:00 via iPhone
    用拼音排序,不要用汉字。
    qiayue
        2
    qiayue  
       2018-06-12 16:47:28 +08:00
    我觉得可以出现两次,C 和 Z 各出现一次
    ghostgril
        3
    ghostgril  
    OP
       2018-06-12 16:47:52 +08:00
    @wxsm 我的意思是: 数据是汉字的,我现在通过汉字解析出拼音来排序。但是现在解析会出问题,就是多音字没办法分辨出来
    ghostgril
        4
    ghostgril  
    OP
       2018-06-12 16:48:33 +08:00
    @qiayue 页面里出现两次重庆不好吧,而且其他地名也有多音字的区别
    iridescent0rsy
        5
    iridescent0rsy  
       2018-06-12 16:58:21 +08:00 via Android
    如果只是地名的话,多音字的全部枚举出来,特殊处理?我这个方法好笨的😂
    lmqdlr
        6
    lmqdlr  
       2018-06-12 16:59:04 +08:00 via Android
    QQ 里面的 行(hang)政部了解一下
    qiayue
        7
    qiayue  
       2018-06-12 17:05:00 +08:00
    出现重复有时候反而是个 feature,照顾读错的人
    就像搜狗输入法,你打错的拼音,也能够找到正确的字
    不过地名数据量不大,你人工把多音字纠正下就行
    yalanaika
        8
    yalanaika  
       2018-06-12 17:06:46 +08:00
    github 上转拼音 识别多音字的项目还是蛮多的 例如 https://github.com/letiantian/ChineseTone
    bmxbmx3
        9
    bmxbmx3  
       2021-03-07 15:24:14 +08:00
    pypi 有个 cn_sort 库应该能帮到你
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2697 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 09:58 · PVG 17:58 · LAX 01:58 · JFK 04:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.