logologo
寻找工作
返回简章2025-12-13 更新

大模型算法实习生

深圳
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责: 1、负责大模型应用的开发,构建完整的AI应用系统; 2、开发和优化RAG(检索增强生成)系统,包括文档解析、向量存储、检索召回等; 3、参与大模型推理服务的部署和优化,包括模型量化、推理加速等工作; 4、负责大模型服务的负载均衡和调度策略设计与实现; 5、优化模型内存管理,实现高效的分页(Paging)和缓存策略; 6、构建模型监控、日志和性能分析系统。 任职要求: 1、计算机相关专业在校学生(本科大三及以上或研究生); 2、扎实的编程基础,熟练掌握Python,了解C++/CUDA优先; 3、具备良好的数据结构和算法基础; 4、熟悉深度学习、大模型、自然语言处理的基本概念; 加分项: 1、熟悉主流大模型架构 Transformer、LLaMA、ChatGLM 等,熟悉大模型推理框架,如vLLM、TensorRT-LLM、llama.cpp等; 2、掌握模型量化技术,如 INT8/INT4 量化、GPTQ、AWQ 等,了解模型加速技术 Flash Attention、PagedAttention等; 3、熟悉向量数据库,如Chroma、Pinecone、Milvus、Qdrant 等,掌握文档解析和预处理 PDF、Word、Markdown等格式 4、了解负载均衡技术如 Nginx、HAProxy 等,掌握容器化技术如 Docker、Kubernetes 等; 5、了解前端、后端的开发技术,如React/Vue.js、FastAPI/Flask、PostgreSQL/MySQL、Redis缓存等; 6、有云平台的使用经验(AWS、阿里云、腾讯云),有自动化部署和CI/CD流程经验。