V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ShowMeBug2020
V2EX  ›  分享发现

ShowMeBug 中如何科学的识别用户浏览器?

  •  
  •   ShowMeBug2020 · 2021-08-19 18:31:08 +08:00 · 963 次点击
    这是一个创建于 1190 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常有用户在 ShowMeBug 在线面试过程中,使用一些奇怪的浏览器来打开链接进行视频面试,然后出现一些音视频卡顿等问题。

    多次排查后发现产品的音视频功能一但使用了浏览器的 WebRTC 特性,就会对浏览器的要求特别高,如不在正常的浏览器支持范围内,就容易出现问题。所以我们在检测这个问题时,通常有两种方法识别出浏览器的型号和版本。

    第一种方法:使用 modernizr 来进行 feature detection, 通过探测这些 API 是否存在,来判读是否可以使用 WebRTC,毕竟 WebRTC 是有浏览器 API 组成。

    不过,这种方法不够严谨,WebRTC 是一项很新的技术,今年 1 月份才正式成为官方标准,但目前只支持部份浏览器,稳定性也还需要进一步加强。

    The World Wide Web Consortium (W3C) and the Internet Engineering Task Force (IETF) announced today that Web Real-Time Communications (WebRTC), which powers myriad services, is now an official standard, bringing audio and video communications anywhere on the Web.

    今年 1 月,W3C 和 IETF 宣布,为无数服务提供支持的 WebRTC 现已成为官方标准。

    ———— 2021.01.26

    网络实时通信 (WebRTC) 改变了通信格局;成为万维网联盟 (W3C) 建议书和多个互联网工程任务组 (IETF) 标准

    显然,feature detection 不符合我们的应用场景,目前不满足我们的需求,所以此方法 pass 。

    第二种方法,也是我们目前采用的,业内比较通用的办法就是检测 User-Agent 。

    curl http://202.38.95.46:12001/ -H "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) HEICORE/49.1.2623.213 Safari/537.36"
    

    User-Agent 是什么

    用户不能直接去互联网上获取信息,需要一个软件作为载体去代表用户的行为,这个软件就是 User-Agent (用户代理),浏览器就是一种典型的 User-Agent 。

    用户使用不同的软件去用统一的协议去做相同的事情。这也是定义在 http 请求里的,每一条 http 请求一定会携带 User-Agent 头 。

    网站的服务者可以通过 User-Agent 头来判断用户使用了什么浏览器,当然也可以根据 User-Agent 的内容来提供差异化的服务。

    标准语法和历史

    原本 User-Agent 浏览器的语法是很清晰的

    User-Agent: <product> / <product-version> <comment>
    

    User-Agent - HTTP | MDN

    因为可以根据 User-Agent 的内容来提供差异化的服务,所以当年在浏览器大战时期,浏览器的实现各不相同。当年 Mozilla ( Firefox 的前身)浏览器最强的,很多网站都只对 Mozilla 提供高质量的服务,后来有人把自己伪装成了 Mozilla (没错,就是 IE 先开始的)。从此 Mozilla/5.0 就变成了 User-Agent 的第一段。

    History of the browser user-agent string

    后来的浏览就在这上面不断扩充,就像今天这样:

    Linux / Firefox

    Mozilla/5.0 (X11; Linux x86_64; rv:89.0) Gecko/20100101 Firefox/89.0
    

    Mac OS / Safari

    Mozilla/5.0 (Macintosh; Intel Mac OS X 11_3) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1 Safari/605.1.15
    

    Chromium OS / Chrome

    Mozilla/5.0 (X11; CrOS x86_64 13904.16.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.25 Safari/537.36
    

    Windows / Edge

    Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4482.0 Safari/537.36 Edg/92.0.874.0
    

    这就变成了去识别 User-Agent 变得很困难,目前的识别基本上都是使用正则表达式,配合自己的 User-Agent 库来判断。

    这方面的库有很多,对比很多后,这个库是比较全的 ua-parser-js

    目前几乎所有的网站识别浏览器都是 User-Agent 来判断,有两个接口:

    前端有浏览器接口:

    window.navigator.userAgent
    

    后端可以通过浏览器的 http request header 来拿到 User-Agent

    user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36
    

    如何使用 User-Agent

    在移动端因为算力的问题,在有些老旧的处理器上也会出现卡顿的情况,不过,我们可以在浏览器里跑一下 Benchmark 来判断算力是否够用,移动端的 User-Agent 会携带处理器信息(可以去查数据库来判断)

    所以说,目前所进行的操作是:检测用户浏览器 ——> 给予提示,并在文档页显示支持性列表

    最后,要通过定义的规则生成这样一个表格:

    Screen_Shot_2021-08-13_at_17.09.59.png

    为了降低未来的维护成本要使用一套数据源,既可以检测,又可以在文档页生成列表

    ua-parser-js 的返回结果的数据结构比较科学,直接复用这一数据结构

    interface Result {
      ua: string;
      browser: {
        name: string | undefined;
        version: string | undefined;
      };
      device: {
        model: string | undefined;
        type: string | undefined;
        vendor: string | undefined;
      };
      engine: {
        name: string | undefined;
        version: string | undefined;
      };
      os: {
        name: string | undefined;
        version: string | undefined;
      };
      cpu: {
        architecture: string | undefined;
      };
    }
    

    这样我们可以定义三条规则:

    • daily_list (某个测试版的浏览器)
    • white_list (测试过没有问题的浏览器)
    • black_list (已知有问题的浏览器)
    // 存在优先级关系: daily_list > white_list > black_list
    //
    // https://www.npmjs.com/package/ua-parser-js
    // @params: ua-parser-js.result
    // @params: { <list_name>: <whiteList | blackList>}
    // @return: string(list_name)
    function browserDetect(ua, list) {
      const { daily_list, white_list, black_list } = list
      if (checkList(ua, daily_list)) return 'daily_list'
      if (checkList(ua, white_list)) return 'white_list'
      if (checkList(ua, black_list)) return 'black_list'
      return ''
    }
    

    基于这种数据结构,加入一种简单的语法。支持版本号判断,加入这个几种符号的支持:>, , =, <,

    由于没有现成可以用的,所以要自己写一段判断

    compare-versions

    这样的话配置文件就可以这样写:config/browser.yml

    # https://www.npmjs.com/package/ua-parser-js
    #
    # 本文件的语法是在这个库之上做的修改
    
    # 白名单,完全没有问题的版本
    white_list:
      - browser:
          name: "Chrome"
          version: ">= 85.0.0.0"
      - browser:
          name: "Firefox"
          version: ">= 85.0.0.0"
      - browser:
          name: "Edge"
          version: ">= 45.0.0.0"
        device:
          type: "mobile"
        os:
          name: "Android"
          version: ">= 10.0"
    
    black_list:
      # 老版本的 Edge 不支持
      - browser:
          name: "Edge"
          version: "< 80.0.0.0"
        os:
          name: "Windows"
    
      # 手机微信内置浏览器
      - browser:
          name: "WeChat"
        device:
          type: "mobile"
    

    使用我们产品的用户,上至自己编译浏览器自己用的极客,下至用微信内置浏览器的小白, 所以要在 beta 版、dev 版、canary 开发版、nightly 版等各种版本中给予提示,检测 WebRTC 不稳定,就可能会有问题。

    曾经有人用了开发版的浏览器,面试中出现音视频不稳定,直到他更新了的版本之后才恢复正常。

    由于开发版浏览器并不会在 ua 里面携带 dev 的标识,只能通过版本号来判断。可以使用 caniuse-lite 的数据库,取出最新稳定版的的版本号,然后进行版本号比对。

    但是 caniuse-lite 的数据库有 1.3M 如果直接使用,会打包整个数据库。这个体积的增加了太多,需要优化一下,所以采用把查询结果打包成文件的办法,实际上真正有用的数据非常的少。

    创建一个生成器,可以动态创建这个文件 latest_browser_list_generator.js

    #!/usr/bin/env node
    
    const browserslist = require('browserslist')
    const fs = require('fs')
    
    const list = {
      'firefox': true,
      'chrome': true,
      'edge': true,
    }
    
    const latest = browserslist("last 1 version").filter(i => list[i.split(' ')[0]])
    fs.writeFileSync('latest_browser_list.js', `export default ${JSON.stringify(latest)}`)
    

    之后定期执行这两个就可以了

    • npx browserslist@latest --update-db
    • node latest_browser_list_generator.js

    当然,这个可以用 GitHub action 或 GitLab CI 来每周执行一次

    除此之外,360 浏览器的检测方法

    360 浏览器隐藏了自己的 UA 。360 浏览器只有在访问自己的网站(比如:360.cn)是才会在 UA 里携带 QIHU 360SE ( 360 安全浏览器)或 QIHU 360EE ( 360 极速浏览器)字段

    360 安全浏览器和 360 极速浏览器的判断 - V2EX

    对待国内浏览器(这个可以检测到 360 )

    GitHub - mumuy/browser: Useragent analysis tool.浏览器分析判断工具 - 用户代理、操作系统信息

    不过这个库的作者并没有提供可以直接使用包,只能把核心代码提取出来。

      // https://github.com/mumuy/browser/blob/4a50ee18cc76a5013dea3596bb33fbab9ed584c3/Browser.js#L111-L143
      if (_window.chrome) {
        let chrome_version = u.replace(/^.*Chrome\/([\d]+).*$/, '$1')
        if (_window.chrome.adblock2345 || _window.chrome.common2345) {
          match['2345Explorer'] = true
        } else if (
          _mime('type', 'application/360softmgrplugin') ||
          _mime('type', 'application/mozilla-npqihooquicklogin')
        ) {
          is360 = true
        } else if (chrome_version > 36 && _window.showModalDialog) {
          is360 = true
        } else if (chrome_version > 45) {
          is360 = _mime('type', 'application/vnd.chromium.remoting-viewer')
          if (!is360 && chrome_version >= 69) {
            is360 = _mime('type', 'application/hwepass2001.installepass2001') || _mime('type', 'application/asx')
          }
        }
      }
    
      // 修正
      if (match['Mobile']) {
        match['Mobile'] = !(u.indexOf('iPad') > -1)
      } else if (is360) {
        if (_mime('type', 'application/gameplugin')) {
          match['360SE'] = true
        } else if (
          _navigator &&
          typeof _navigator['connection'] !== 'undefined' &&
          typeof _navigator['connection']['saveData'] == 'undefined'
        ) {
          match['360SE'] = true
        } else {
          match['360EE'] = true
        }
      }
    

    不过这里要注意:navigator.mimeTypes 已经从 Web 标准中移除(也许未来的某天这个方法就没法用了)

    Navigator.mimeTypes - Web APIs | MDN

    判断 360 的版本,是做了一个版本的对应关系

    // https://github.com/mumuy/browser/blob/4a50ee18cc76a5013dea3596bb33fbab9ed584c3/Browser.js#L283-L292
    function get360SEVersion(u) {
      let hash = { '86': '13.0', '78': '12.0', '69': '11.0', '63': '10.0', '55': '9.1', '45': '8.1', '42': '8.0', '31': '7.0', '21': '6.3' }
      let chrome_version = u.replace(/^.*Chrome\/([\d]+).*$/, '$1')
      return hash[chrome_version] || ''
    }
    function get360EEVersion(u) {
      let hash = { '86': '13.0', '78': '12.0', '69': '11.0', '63': '9.5', '55': '9.0', '50': '8.7', '30': '7.5' }
      let chrome_version = u.replace(/^.*Chrome\/([\d]+).*$/, '$1')
      return hash[chrome_version] || ''
    }
    

    最后

    虽然我们分享了如何科学识别检测用户浏览器的方法,但是为了网络环境的健康,为了不重蹈浏览器大战时的覆辙,呼吁大家不要针对特定浏览器提供差异化内容。

    作者:新一

    3 条回复    2021-08-22 00:53:51 +08:00
    awing
        1
    awing  
       2021-08-19 23:15:45 +08:00
    我来打破 0 回复 /dog
    anouser
        3
    anouser  
       2021-08-22 00:53:51 +08:00
    实际上还是做 feature detection 比较好。
    user agent 的话,各种套壳的浏览器,以后你还要更新维护。不如直接把你用到的 API,放到用户环境里面去检测一下,如果都支持就可以继续。对于 ua 检测来说,就是推荐用户使用你们觉着体验比较好的客户端
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1003 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 22:19 · PVG 06:19 · LAX 14:19 · JFK 17:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.