Files
wechat_crawler/岗位提取使用说明.md

112 lines
2.6 KiB
Markdown
Raw Permalink Normal View History

# 微信群岗位信息提取工具使用说明
## 功能说明
本工具可以自动监听指定微信群的消息使用阿里云百炼API智能提取招聘岗位信息并保存为结构化JSON数据。
## 提取的信息字段
- **job_name**: 工作名称
- **job_description**: 工作描述
- **job_location**: 工作地点
- **salary_min**: 月薪最低(元)
- **salary_max**: 月薪最高(元)
- **company_name**: 公司名称
- **contact_person**: 联系人
- **contact_info**: 联系方式
## 使用步骤
### 1. 安装依赖
```bash
pip install -e .
pip install requests
```
### 2. 配置文件
编辑 `config.json` 文件,配置以下参数:
```json
{
"target_group": "招聘信息群",
"bailian_api_url": "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation",
"api_key": "sk-46cb053d75eb4ad88713917ba0f1c81a",
"check_interval": 5,
"output_file": "jobs_data.json"
}
```
参数说明:
- `target_group`: 要监听的微信群名称(必须完全匹配)
- `bailian_api_url`: 百炼API地址
- `api_key`: 百炼API密钥
- `check_interval`: 消息检查间隔(秒)
- `output_file`: 输出文件名
### 3. 运行程序
确保微信已登录并打开主窗口,然后运行:
```bash
python job_extractor.py
```
### 4. 停止监听
`Ctrl+C` 停止程序
## 输出文件格式
提取的岗位信息会保存到 `jobs_data.json` 文件中,格式示例:
```json
[
{
"job_name": "Python开发工程师",
"job_description": "负责后端开发熟悉Django/Flask框架",
"job_location": "北京市朝阳区",
"salary_min": 15000,
"salary_max": 25000,
"company_name": "某科技公司",
"contact_person": "张经理",
"contact_info": "13800138000",
"_metadata": {
"source": "wechat_group",
"group_name": "招聘信息群",
"sender": "HR小王",
"extract_time": "2026-02-11 10:30:00",
"original_message": "招聘Python开发..."
}
}
]
```
## 注意事项
1. 确保微信版本为 3.9.x
2. 微信必须保持登录状态
3. 群名称必须完全匹配(区分大小写)
4. API密钥请妥善保管不要泄露
5. 程序会持续运行直到手动停止
## 常见问题
### Q: 提示"找不到聊天窗口"
A: 请检查 `config.json` 中的 `target_group` 是否与微信群名称完全一致
### Q: API调用失败
A: 请检查:
- API密钥是否正确
- 网络连接是否正常
- API额度是否充足
### Q: 没有提取到岗位信息
A: 可能原因:
- 消息内容不包含招聘信息
- 消息格式不规范
- API识别失败
可以查看控制台输出的详细日志进行排查