Python量化交易中常用的数据类型有哪些?
个人最常用的还是numpy的数据类型,也就是np.array,由于这种数据格式和matlab中矩阵的相关用法是比较相似的,而我个人比较熟悉用matlabmssql 通用数据类型,所以在用python处理数据的时候也就把这个习惯带过来了,在进行矩阵的相关操作的时候(比如矩阵的加减运算,矩阵相乘和矩阵点乘,取转置)比较方便。 另外一种也会用到的数据格式叫做pandas dataframe,一般在用的时候喜欢简称pd.dataframe,这种格式一般在调用api获取数据时接收到的就是这种数据类型,这种数据类型不太适合想象成矩阵,因为它一般会涉及到用一个“column”直接调取一整列来进行操作,另外pandas库里面有一些数据处理操作很方便,比如删除缺失值函数pd.dropna(),以及中位数去极值操作winzorise_med()函数也需要数据格式为pandas dataframe。 以上两种数据格式基本上就搞定量化交易中数据处理的部分了,除此之外有时候可能需要存储一些字符串列表,比如存储筛选的股票代码,交易信息等,这个时候统一用list就行,list进行修改还是挺方便的,也比较泛用。 至于模型的训练,比如sklearn里面各种机器学习的算法模型,我基本上都是用numpy数组带进去训练的。 都看到这里了,别忘了点赞加关注鸭! (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |