
一、总体数据说明(模糊口径)
1. 整体规模
活动中我们共收到数百条实际发送的弹幕,去重后形成不同的弹幕文本样本
2. 整体情况说明
存在大量完全一致的固定祝福语,被多次重复发送 同时存在大量一次性、个性化的自由输入文本 弹幕内容以短文本为主,多数在 10 字以内
二、弹幕内容方向分类(语义聚类)
说明:我们对所有不重复弹幕文本进行人工语义归类(非关键词机械匹配),共划分为 7 类。各类别之间允许语义相邻,但每条文本仅归入一个主类别。

1. 通用祝福 / 新年祝词

新年快乐
万事如意
平安喜乐
心想事成
好运连连
2. 财运 / 收入 / 物质相关

暴富 / 财源滚滚
工资翻倍 / 年终奖
买房 / 房贷压力
基金别绿 / 股票回血
3. 学业 / 科研 / 考试相关

论文 / paper / reviewer / accept
考研 / 考公 / GRE / 托福 / GPA
博士毕业 / 科研进展
4. 工作 / 职场 / 打工人相关

升职、加薪、绩效、KPI
老板、同事、甲方
加班、996、955、不背锅
5. 感情 / 亲密关系

脱单、爱情、喜欢的人
结婚、异地
情绪稳定、被温柔以待
6. 健康 / 身体 / 心理状态

身体健康、不生病
脱发、睡眠、焦虑、emo
手术、康复
7. 生活方式 / 自我成长

自律、心态、情绪管理
做自己、喜欢自己
旅行、生活质量
三、高频弹幕文本与词语统计
3.1 高频弹幕文本(Top 4)
新年快乐 平安喜乐 万事如意 财源滚滚
3.2 高频词语 / 概念统计(语义合并后)

四、数据层面的补充说明(内容结构)
固定祝福语在整体弹幕中具有较高的重复出现频率 个性化自由输入文本数量较多,且单条文本的重复程度较低 学业科研相关词汇在弹幕文本中具有较高识别度,且表达形式相对集中
五、访问来源分布(区域级)

1. 国际访问来源(大区域)
东亚地区(主要集中在中国) 东南亚地区 北美地区 欧洲地区 其他分散区域

2. 中国境内访问来源(地理大区)
华北地区 东北及北部地区 华东地区 华南地区 华中地区 西北地区 西南地区 
六、访问来源分布与弹幕内容结构的并列说明
在多区域访问背景下,弹幕内容以通用祝福类文本作为主要构成 财运、学业、工作等主题在不同访问区域中均有出现 弹幕文本结构中同时存在固定祝福语与自由输入文本
注:分析口径说明
本报告为对现有数据的结构性整理与展示仅在总体规模部分采用模糊化表述,其余分类比例、词语结构与内容划分保持原始统计口径。本报告不对数据作趋势判断、因果分析或用户行为推断


