logologo
寻找工作
2026-01-26 发布

北京尔创互动科技有限公司

通信配套服务 · 民营企业 · 成立9年

简章详情

在招职位如下:

爬虫与采集工程师

工作城市:广州
薪资:6k-12k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
职责: 1、构建“生成式引擎结果采集”链路:对接国内模型平台的联网搜索调用,固化请求参数、响应落库、版本化 schema,确保可复现与可回放。 2、采集并留存证据链:把“回答内容 + 搜索来源列表 + 角标引用”做快照留存,用于后续归因与争议排查。​3、建设站点侧采集:接入客户 CDN/网关/服务器访问日志,解析与识别“可能与 AI/搜索相关的抓取行为”,沉淀 top pages、抓取失败、抓取但未被引用等数据集。​4、反爬与风控:限频、重试、代理池、任务调度、幂等与成本控制,并确保采集遵循目标平台规则与客户合规要求(尤其金融/教育)。 要求: 有爬虫/后端经验,具备分布式任务系统落地经验(队列、调度、容错、幂等)。(不限工作年限) 熟悉浏览器自动化/渲染采集(Playwright/Puppeteer 等)与数据留存(HTML/截图/响应元信息)。 有“采集数据产品化”意识:字段稳定、可回溯、可审计。 加分项: 1、熟悉大模型的联网搜索能力的工程对接细节,能把“引用监控”做成标准化能力。 2、香港科技大学等南沙附近的计算机、数学等专业优先。

数据监控与指标工程师

工作城市:广州
薪资:9k-15k
学历要求:硕士,博士
岗位性质:实习
岗位描述:
职责(偏数据平台与指标) 1、建立“AI 可见度”指标体系:围绕引用/来源(citable sources)、覆盖问题集、答案稳定性、以及 prompt 维度表现,定义口径、维表、聚合与多租户隔离。 告警与异常检测:对引用率/来源变化、抓取失败、采集延迟、答案波动做实时/准实时告警,并提供回溯链路(定位到具体 prompt、版本、来源 URL)。 3、归因分析:将“引用角标/来源列表”与客户页面、页面结构化数据、更新时间、站点可访问性等特征关联,输出可执行的修复建议与实验结论。​要求(关键能力) 1、有数据工程/分析工程经验,能独立建模、定义指标并建设数据质量体系。 2、熟悉 Kafka/RabbitMQ、Flink/Spark、ClickHouse/ES/OLAP、以及 BI 看板与权限体系。 3、有可观测性与 SLA 思维:延迟、完整性、准确性校验与成本优化。 4、有好奇心,自主学习能力。

鼠鼠求职首页