
量化选股Day7
一直好奇量化选股是怎么选股的,查了一下资料(https://mp.weixin.qq.com/s/hs1lZ-cCgQDgCpa26_BkYg)
量化选股的核心在于通过系统化的方法,从海量数据中挖掘有效信息,构建投资组合并控制风险。
1、获取原始数据:(1)量价数据:价格和交易数据,比如每分钟股价、成交量、资金流向等;(2)基本面数据:公司基本面相关的数据,比如财报、市盈率(PE)、净资产收益率(ROE)等;(3)另类数据:比如舆情数据,电商数据,分析师一致性预期,社交媒体热度、甚至卫星图像(比如通过停车场车辆数预测商场业绩)
2、数据清洗:获得了大量原始数据之后,不能直接将其输入给模型。因为原始数据往往包含很多噪音,很多有价值的信息会被湮没在噪音里;也会存在缺失值、极值、格式错误等问题;并且很多非结构化的数据机器不能直接识别;需要对数据进行预处理,这个步骤叫做数据清洗,预处理之后,才能放入模型进行训练。
3、样本内数据和样本外数据:数据处理完之后就会纳入数据集。一般情况下,还需要对数据集做一个分割,把它切分为训练集和测试集,这也是常说的样本内数据和样本外数据。#量化 #量化交易 #股票
昨天去参加了一个很好玩的活动所以没学习
一直好奇量化选股是怎么选股的,查了一下资料(https://mp.weixin.qq.com/s/hs1lZ-cCgQDgCpa26_BkYg)
量化选股的核心在于通过系统化的方法,从海量数据中挖掘有效信息,构建投资组合并控制风险。
1、获取原始数据:(1)量价数据:价格和交易数据,比如每分钟股价、成交量、资金流向等;(2)基本面数据:公司基本面相关的数据,比如财报、市盈率(PE)、净资产收益率(ROE)等;(3)另类数据:比如舆情数据,电商数据,分析师一致性预期,社交媒体热度、甚至卫星图像(比如通过停车场车辆数预测商场业绩)
2、数据清洗:获得了大量原始数据之后,不能直接将其输入给模型。因为原始数据往往包含很多噪音,很多有价值的信息会被湮没在噪音里;也会存在缺失值、极值、格式错误等问题;并且很多非结构化的数据机器不能直接识别;需要对数据进行预处理,这个步骤叫做数据清洗,预处理之后,才能放入模型进行训练。
3、样本内数据和样本外数据:数据处理完之后就会纳入数据集。一般情况下,还需要对数据集做一个分割,把它切分为训练集和测试集,这也是常说的样本内数据和样本外数据。#量化 #量化交易 #股票
昨天去参加了一个很好玩的活动所以没学习


