wechat_crawler/岗位提取使用说明.md

# 微信群岗位信息提取工具使用说明

## 功能说明

本工具可以自动监听指定微信群的消息，使用阿里云百炼API智能提取招聘岗位信息，并保存为结构化JSON数据。

## 提取的信息字段

- **job_name**: 工作名称
- **job_description**: 工作描述
- **job_location**: 工作地点
- **salary_min**: 月薪最低（元）
- **salary_max**: 月薪最高（元）
- **company_name**: 公司名称
- **contact_person**: 联系人
- **contact_info**: 联系方式

## 使用步骤

### 1. 安装依赖

```bash
pip install -e .
pip install requests
```

### 2. 配置文件

编辑 `config.json` 文件，配置以下参数：

```json
{
  "target_group": "招聘信息群",
  "bailian_api_url": "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation",
  "api_key": "sk-46cb053d75eb4ad88713917ba0f1c81a",
  "check_interval": 5,
  "output_file": "jobs_data.json"
}
```

参数说明：
- `target_group`: 要监听的微信群名称（必须完全匹配）
- `bailian_api_url`: 百炼API地址
- `api_key`: 百炼API密钥
- `check_interval`: 消息检查间隔（秒）
- `output_file`: 输出文件名

### 3. 运行程序

确保微信已登录并打开主窗口，然后运行：

```bash
python job_extractor.py
```

### 4. 停止监听

按 `Ctrl+C` 停止程序

## 输出文件格式

提取的岗位信息会保存到 `jobs_data.json` 文件中，格式示例：

```json
[
  {
    "job_name": "Python开发工程师",
    "job_description": "负责后端开发，熟悉Django/Flask框架",
    "job_location": "北京市朝阳区",
    "salary_min": 15000,
    "salary_max": 25000,
    "company_name": "某科技公司",
    "contact_person": "张经理",
    "contact_info": "13800138000",
    "_metadata": {
      "source": "wechat_group",
      "group_name": "招聘信息群",
      "sender": "HR小王",
      "extract_time": "2026-02-11 10:30:00",
      "original_message": "招聘Python开发..."
    }
  }
]
```

## 注意事项

1. 确保微信版本为 3.9.x
2. 微信必须保持登录状态
3. 群名称必须完全匹配（区分大小写）
4. API密钥请妥善保管，不要泄露
5. 程序会持续运行直到手动停止

## 常见问题

### Q: 提示"找不到聊天窗口"
A: 请检查 `config.json` 中的 `target_group` 是否与微信群名称完全一致

### Q: API调用失败
A: 请检查：
- API密钥是否正确
- 网络连接是否正常
- API额度是否充足

### Q: 没有提取到岗位信息
A: 可能原因：
- 消息内容不包含招聘信息
- 消息格式不规范
- API识别失败

可以查看控制台输出的详细日志进行排查
-												feat: Initialize wxauto WeChat automation project with job extraction tools

- Add wxauto package with WeChat UI automation and message handling capabilities
- Implement job_extractor.py for automated job posting extraction from WeChat groups
- Add job_extractor_gui.py providing graphical interface for job extraction tool
- Create comprehensive documentation in Chinese covering GUI usage, multi-group support, and quick start guides
- Add build configuration files (build_exe.py, build_exe.spec) for packaging as standalone executable
- Include utility scripts for WeChat interaction (auto_send_msg.py, get_history.py, receive_file_transfer.py)
- Add project configuration files (pyproject.toml, setup.cfg, requirements.txt)
- Include test files (test_api.py, test_com_fix.py) for API and compatibility validation
- Add Apache 2.0 LICENSE and comprehensive README documentation
- Configure .gitignore to exclude build artifacts, logs, and temporary files

											
										
										
											2026-02-11 14:49:38 +08:00
+								# 微信群岗位信息提取工具使用说明
 								## 功能说明
 								本工具可以自动监听指定微信群的消息，使用阿里云百炼API智能提取招聘岗位信息，并保存为结构化JSON数据。
 								## 提取的信息字段
 								- **job_name**: 工作名称
 								- **job_description**: 工作描述
 								- **job_location**: 工作地点
 								- **salary_min**: 月薪最低（元）
 								- **salary_max**: 月薪最高（元）
 								- **company_name**: 公司名称
 								- **contact_person**: 联系人
 								- **contact_info**: 联系方式
 								## 使用步骤
 								### 1. 安装依赖
 								```bash
 								pip install -e .
 								pip install requests
 								```
 								### 2. 配置文件
 								编辑 `config.json` 文件，配置以下参数：
 								```json
 								{
 								  "target_group": "招聘信息群",
 								  "bailian_api_url": "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation",
 								  "api_key": "sk-46cb053d75eb4ad88713917ba0f1c81a",
 								  "check_interval": 5,
 								  "output_file": "jobs_data.json"
 								}
 								```
 								参数说明：
 								- `target_group`: 要监听的微信群名称（必须完全匹配）
 								- `bailian_api_url`: 百炼API地址
 								- `api_key`: 百炼API密钥
 								- `check_interval`: 消息检查间隔（秒）
 								- `output_file`: 输出文件名
 								### 3. 运行程序
 								确保微信已登录并打开主窗口，然后运行：
 								```bash
 								python job_extractor.py
 								```
 								### 4. 停止监听
 								按 `Ctrl+C` 停止程序
 								## 输出文件格式
 								提取的岗位信息会保存到 `jobs_data.json` 文件中，格式示例：
 								```json
 								[
 								  {
 								    "job_name": "Python开发工程师",
 								    "job_description": "负责后端开发，熟悉Django/Flask框架",
 								    "job_location": "北京市朝阳区",
 								    "salary_min": 15000,
 								    "salary_max": 25000,
 								    "company_name": "某科技公司",
 								    "contact_person": "张经理",
 								    "contact_info": "13800138000",
 								    "_metadata": {
 								      "source": "wechat_group",
 								      "group_name": "招聘信息群",
 								      "sender": "HR小王",
 								      "extract_time": "2026-02-11 10:30:00",
 								      "original_message": "招聘Python开发..."
 								    }
 								  }
 								]
 								```
 								## 注意事项
 . 确保微信版本为 3.9.x
 . 微信必须保持登录状态
 . 群名称必须完全匹配（区分大小写）
 . API密钥请妥善保管，不要泄露
 . 程序会持续运行直到手动停止
 								## 常见问题
 								### Q: 提示"找不到聊天窗口"
 								A: 请检查 `config.json` 中的 `target_group` 是否与微信群名称完全一致
 								### Q: API调用失败
 								A: 请检查：
 								- API密钥是否正确
 								- 网络连接是否正常
 								- API额度是否充足
 								### Q: 没有提取到岗位信息
 								A: 可能原因：
 								- 消息内容不包含招聘信息
 								- 消息格式不规范
 								- API识别失败
 								可以查看控制台输出的详细日志进行排查