








CNDD-0284 上市公司董事长致辞特质性信息文本指标及学术论文应用
01 数据介绍
▪ 数据名称: 董事长致辞、特质性信息文本
▪ 数据编号:0284
▪ 数据层级:A股上市公司层面
▪ 数据范围:2016-2024年
▪ 样本数量:1,538条
▪ 数据来源:根据上市公司每年董事长致辞文本爬取
▪ 数据说明: CNDD上市公司董事长致辞特质性信息文本数据参考伊志宏等(2019),统计了上市公司董事长致辞文本中含有“特质性词典”相关的词频指标。数据提供.xlsx和.dta两种格式,可用stata或excel打开。
▪ 数据维度:年度数据
▪ 数据介绍:在词典的选取上,特质性词典集借鉴伊志宏等(2019), 公司特质信息定义为“与公司战略、市场地位、 产品、技术、销售、项目投资、融资策略、会计业绩、高管团队、公司治理、供应商、经销商、公司风险等 各方面信息相关的信息”。本文采取人工标注加机器学习的方法对分析师报告中的公司特质信息进 行判别,人工判断某一信息是否为“公司特质信息”的依据在于这一信息只对分析师跟踪的该企 业产生影响还是对行业内所有公司产生影响。比如,某航空公司的研究报告中“2015 年夏秋计划 航班增速明显收窄,三大航票价上行确立”这一信息中,航空业航班增速预期不仅影响该公司营 收,同时也影响其他航空公司,因此应归类于非公司特质信息。而“上海港已连续数年蝉联国际集 装箱港吞吐量第一,但从结构来看,中转箱占比始终低于其他国际大港如新加坡、釜山、香港”这 一句子客观描述了上海港这一企业经营现状, 不影响其他公司经营状况, 应归类到公司特质信息。#CNDeepData #董事长致辞 #特质性信息 #文本分析 #信息披露 #面板数据 #Stata #管理层讨论 #公司特质 #信息质量
01 数据介绍
▪ 数据名称: 董事长致辞、特质性信息文本
▪ 数据编号:0284
▪ 数据层级:A股上市公司层面
▪ 数据范围:2016-2024年
▪ 样本数量:1,538条
▪ 数据来源:根据上市公司每年董事长致辞文本爬取
▪ 数据说明: CNDD上市公司董事长致辞特质性信息文本数据参考伊志宏等(2019),统计了上市公司董事长致辞文本中含有“特质性词典”相关的词频指标。数据提供.xlsx和.dta两种格式,可用stata或excel打开。
▪ 数据维度:年度数据
▪ 数据介绍:在词典的选取上,特质性词典集借鉴伊志宏等(2019), 公司特质信息定义为“与公司战略、市场地位、 产品、技术、销售、项目投资、融资策略、会计业绩、高管团队、公司治理、供应商、经销商、公司风险等 各方面信息相关的信息”。本文采取人工标注加机器学习的方法对分析师报告中的公司特质信息进 行判别,人工判断某一信息是否为“公司特质信息”的依据在于这一信息只对分析师跟踪的该企 业产生影响还是对行业内所有公司产生影响。比如,某航空公司的研究报告中“2015 年夏秋计划 航班增速明显收窄,三大航票价上行确立”这一信息中,航空业航班增速预期不仅影响该公司营 收,同时也影响其他航空公司,因此应归类于非公司特质信息。而“上海港已连续数年蝉联国际集 装箱港吞吐量第一,但从结构来看,中转箱占比始终低于其他国际大港如新加坡、釜山、香港”这 一句子客观描述了上海港这一企业经营现状, 不影响其他公司经营状况, 应归类到公司特质信息。#CNDeepData #董事长致辞 #特质性信息 #文本分析 #信息披露 #面板数据 #Stata #管理层讨论 #公司特质 #信息质量


