肿瘤多组学数据挖掘实习生(2026届校招)
北京
硕士及以上
统计学类·生物科学类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:
1、 多组学数据整合与预处理: 协助处理、整合及标准化来自真实世界的肿瘤多组学数据,包括临床诊疗信息、病理影像报告、基因突变谱、RNA表达量等,为AI模型准备高质量、标准化的输入数据。
2、 文献调研与科学问题定义: 针对特定肿瘤类型或临床问题(如免疫治疗疗效预测、耐药机制探索),进行深入的文献综述,协助将临床问题转化为可计算、可验证的数据科学问题。
3、 统计分析与非监督学习: 应用生存分析、多变量回归等统计方法,并利用聚类、降维等非监督学习技术,对患者进行分子分型或发现数据中的潜在结构。
4、 预测模型构建: 在导师指导下,尝试使用经典的机器学习模型,探索构建肿瘤诊断、预后或治疗反应的预测模型。
5、 结果解读与可视化: 将复杂的分析结果转化为清晰的、具有生物学或临床意义的图表和见解,并协助撰写项目报告。
6、 团队协作: 与我们的生物信息学家、AI算法工程师和临床科学家紧密合作,共同推进科研项目的进展。
任职要求:
1、 学历专业:在校硕士或博士研究生,专业为生物统计学、生物信息学、计算机科学、人工智能、生物医学工程、统计学或相关领域。
2、 肿瘤学与多组学基础:对肿瘤生物学有基本了解,并对基因组学、转录组学等组学数据的概念(如SNV, CNV, RNA-seq)有浓厚兴趣,并渴望将其与AI技术结合。
3、 医学统计知识: 具备扎实的统计学基础,熟悉假设检验、回归模型、生存分析等核心方法。
4、 编程与数据处理能力:熟练掌握 Python 或 R 进行数据分析与绘图,有使用SQL进行数据查询的经验者优先。
5、 文献调研能力: 具备优秀的中英文文献阅读和总结能力,能快速学习前沿科学知识。
6、 逻辑思维与主动性: 具备强大的逻辑分析和解决问题的能力,对探索未知有强烈的好奇心和主动性。
加分项
1、 有使用深度学习处理生物医学数据(如医学影像、基因组序列、电子病历文本)的经验。
2、 有实际处理肿瘤基因组学数据(如TCGA, ICGC等公共数据库)或真实世界临床数据的项目经验。
3、 了解常用的机器学习算法(如随机森林、支持向量机等)并有实践经历。
4、 熟悉生物信息学常用工具或数据库(如cBioPortal, OncoKB, COSMIC等)。
5、 有科研论文撰写或发表经验者优先。

