V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
huzhikuizainali

PCA 影响机器学习的可解释性吧?

  •  
  •   huzhikuizainali · Feb 7, 2022 · 1898 views
    This topic created in 1544 days ago, the information mentioned may be changed or developed.
    比如样本有多个属性(变量):年龄,性别,年收入,年消费额,年投资额……如果直接做回归预测,比如预测样本第二年的消费额。出来的结果是有可解释性的。因为所有属性都在。

    但是如果应用了 PCA 降维以后,原有属性都淹没在新的属性当中了吧?可是新属性的含义有不明。所以是不是影响机器学习结论的可解释性?

    如果是,有什么可以增加解释性的的解决方法么?
    ypw
        1
    ypw  
       Feb 7, 2022
    pca 可以提供每个属性的权重,并不是新属性含义不明。

    事实上 pca 只是一个线性变换:

    ```py
    np.dot(X, pca.components_.T)
    ```

    参考链接: https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html
    GrayXu
        2
    GrayXu  
       Feb 7, 2022
    > 可是新属性的含义有不明

    这句话是错误的。
    huzhikuizainali
        3
    huzhikuizainali  
    OP
       Feb 7, 2022
    @GrayXu 比如原来 x1 ,x2……xm 代表不同的属性。PCA 以后变成 z1 ,z2……zk ( k<m )这是 z 和 x 怎么对应呢?有这方面的中文介绍么?
    bstjanced555
        4
    bstjanced555  
       Feb 10, 2022
    或许 pca 可以看作是原始特征在另一空间的投影?这个空间是为了提取 x1...xm 与目标结果 y 对应的某些联合特征,也就相当于 1 楼说的属性权重
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1302 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 16:55 · PVG 00:55 · LAX 09:55 · JFK 12:55
    ♥ Do have faith in what you're doing.