logologo
寻找工作
返回简章2025-10-27 更新

大模型算法实习生

北京
硕士及以上
计算机类·统计学类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责 1.设计并实现文本特征分析管线,包括: (1)文本结构、语言风格、语义相似度等多维度特征; (2)信息密度、可读性、关键词与实体分布等指标。 2.构建并优化分类或聚类模型,识别“高引用”与“低引用”文章差异; 3.使用可解释性工具(如 SHAP、LIME)提炼关键引用特征; 4.建立可视化分析平台或自动化报告系统(如 Streamlit Dashboard); 5.与内容及研究团队协作,持续验证分析结果的有效性与可迁移性。 任职要求 1.精通 Python 及常用数据分析包(pandas, numpy, scikit-learn); 2.熟悉 NLP 基础流程:分词、词性标注、NER、TF-IDF、句向量; 3.具备语义建模经验(sentence-transformers、OpenAI Embedding、Cohere 等); 4.掌握至少一种文本分类或聚类算法(如 Logistic Regression、XGBoost、HDBSCAN); 5.熟悉模型解释与可视化(shap, lime, matplotlib, plotly); 6.熟练使用 AI 辅助编程工具(如 Cursor、GitHub Copilot等),能高效利用智能开发环境完成建模与分析任务。