
在西海岸这边一家做宠物行业的tech,朋友之前做的是data science的暑期intern,方向主要是建模、推荐策略和后台数据系统。每天都是围着怎么让宠物过得更好转,所以他老说写的不是代码,是猫猫狗狗的生活改善工具。?听着就挺暖的,现在他那还有些 data方向的 hc,另外如果有SDE、marketing方向的友友可以来撩,都会尽力帮ref
data那从onboarding 开始就挺紧凑。training从整个后端系统结构,到电商端的数据流,再到各种宠物行为、健康档案的业务背景都会过一遍
后面几周就会被分到各自的组,比如推荐策略、用户画像、数据平台或 pipeline 优化。他在的组主要做底层数据服务,就是把乱七八糟的消费、搜索、健康数据变成结构化的宠物画像
每个 intern 都会配 mentor,有固定的 project,比如改 pipeline、做商品推荐实验、优化 scoring 或跑一些 A/B test。最后一周都要向全组做 deliverable 分享
他那组偏 data infra + recommendation。日常是跑模型、清数据、刷 log,偶尔跟 SDE 们一起修 pipeline
早上第一件事就是看 overnight 的跑数情况,模型偶尔会抽风,但大部分时候是一些边界 case 或数据延迟的问题
中午经常会有分享 session,内容可以很技术(比如为什么这个 feature 在某些品类下失效),也可以很生活(比如为什么某只狗的主人喜欢凌晨三点下单这种迷惑行为分析)
节奏不卷,没人凌晨 ping,也没人盯着你工时。下午就是沉下去写代码、调模型、做实验
他说DS在宠物影响的业务里,没那么抽象,也没那么冰冷。很多策略不是凭数据拍脑袋,而是真得懂一点宠物为什么这样。比如为什么狗狗换粮需要过渡、为什么小型犬挑食更明显、为什么某些猫偏好布料玩具多过自动玩具。
这些东西看着软,但连上推荐逻辑、评分公式之后,突然一切都合理了。
他还说比起模型难点,更难的是数据太大、请求量太高,任何一个小优化都能肉眼看到曲线跌下去。有一次他只是改了点很小的逻辑,第二天延迟曲线就长得不一样了
技术方面也稳步提升吧,从刚开始连数据源都看不太懂,到后来可以独立写 pipeline、调参数、上线小功能,mentor 也一直鼓励他多试多问,不会让人觉得压迫
后面基本上return不会太卡人,主要看:项目有没有按时推进、实验有没有跑通、沟通顺不顺、代码是不是干净…
#美国留学生#marketing#25ng#宠物企业#dataanalyst #宠物行业 #sde#宠物生活 #datascientist #数据科学
data那从onboarding 开始就挺紧凑。training从整个后端系统结构,到电商端的数据流,再到各种宠物行为、健康档案的业务背景都会过一遍
后面几周就会被分到各自的组,比如推荐策略、用户画像、数据平台或 pipeline 优化。他在的组主要做底层数据服务,就是把乱七八糟的消费、搜索、健康数据变成结构化的宠物画像
每个 intern 都会配 mentor,有固定的 project,比如改 pipeline、做商品推荐实验、优化 scoring 或跑一些 A/B test。最后一周都要向全组做 deliverable 分享
他那组偏 data infra + recommendation。日常是跑模型、清数据、刷 log,偶尔跟 SDE 们一起修 pipeline
早上第一件事就是看 overnight 的跑数情况,模型偶尔会抽风,但大部分时候是一些边界 case 或数据延迟的问题
中午经常会有分享 session,内容可以很技术(比如为什么这个 feature 在某些品类下失效),也可以很生活(比如为什么某只狗的主人喜欢凌晨三点下单这种迷惑行为分析)
节奏不卷,没人凌晨 ping,也没人盯着你工时。下午就是沉下去写代码、调模型、做实验
他说DS在宠物影响的业务里,没那么抽象,也没那么冰冷。很多策略不是凭数据拍脑袋,而是真得懂一点宠物为什么这样。比如为什么狗狗换粮需要过渡、为什么小型犬挑食更明显、为什么某些猫偏好布料玩具多过自动玩具。
这些东西看着软,但连上推荐逻辑、评分公式之后,突然一切都合理了。
他还说比起模型难点,更难的是数据太大、请求量太高,任何一个小优化都能肉眼看到曲线跌下去。有一次他只是改了点很小的逻辑,第二天延迟曲线就长得不一样了
技术方面也稳步提升吧,从刚开始连数据源都看不太懂,到后来可以独立写 pipeline、调参数、上线小功能,mentor 也一直鼓励他多试多问,不会让人觉得压迫
后面基本上return不会太卡人,主要看:项目有没有按时推进、实验有没有跑通、沟通顺不顺、代码是不是干净…
#美国留学生#marketing#25ng#宠物企业#dataanalyst #宠物行业 #sde#宠物生活 #datascientist #数据科学


