# -*- coding: utf-8 -*-
"""
深圳商机大数据爬虫 - 配置文件
在这里维护抓取地址和关键字，修改后重启爬虫自动生效
"""

# ========== 抓取地址配置
# 每个地址是一个项目源，可以添加多个源
CRAWL_SOURCES = [
    {
        "name": "深圳政府采购网",
        "url": "http://www.szzfcg.cn/portal/documentSearchIndex.html",
        "enabled": True
    },
    {
        "name": "深圳公共资源交易中心",
        "url": "https://www.szggzy.com/jygg/list.html",
        "enabled": True
    },
    {
        "name": "中国招标投标公共服务平台",
        "url": "http://www.cebpubservice.com/",
        "enabled": True
    }
]

# ========== 商机过滤关键字（全行业信息化/大数据/智能化）
BUSINESS_KEYWORDS = [
    '信息化', '大数据', '智能化', '智慧', '数字化',
    '数字', '人工智能', 'AI', '物联网', '云计算', 
    'cloud', 'big data', 'digital', '智慧', '信息化建设'
]

# ========== 室分工程关键字（你要求的）
ROOM_DISTRIBUTION_KEYWORDS = [
    '5G', '信号分布', '室分分布', 'FTTH', '光纤入户', 
    '国标机房', '三网建设', '4G', '直放站', '信号放大器',
    '室内分布', '信号覆盖', '基站', '宽带接入', '通信工程'
]

# ========== 推送频率配置
PUSH_CONFIG = {
    "business_hours": 24,  # 商机推送频率，单位小时，默认每天一次
    "room_distribution_hours": 1,  # 室分检查频率，默认每小时一次
    "major_project_check_hours": 6,  # 重大项目检查频率，默认每6小时一次
}

# ========== 重大项目关注列表
MAJOR_PROJECTS_FILE = "./sz-2026-major-projects.json"
