数据驱动的决策分析,数据决策分析系统
墨初 知识笔记 80阅读
在决策树构造过程中,查询熊猫的批量函数需要花费大量的时间。如果之前有熊猫图书馆调用的基础就好很多了。选择numpy作为决策树的存储结构是不合适的,因为每个节点的结构子数是不确定的。如果矩阵的列数是按照分支的最大数量来设置的,会浪费很多空间。用listdict保存各个节点的数据,用json文件读取应该更方便。

标签:
在决策树构造过程中,查询熊猫的批量函数需要花费大量的时间。如果之前有熊猫图书馆调用的基础就好很多了。选择numpy作为决策树的存储结构是不合适的,因为每个节点的结构子数是不确定的。如果矩阵的列数是按照分支的最大数量来设置的,会浪费很多空间。用listdict保存各个节点的数据,用json文件读取应该更方便。