天眼查API助力Python：高效查询企业信息的实践指南

作者：暴富20212025.09.18 16:00浏览量：4

简介：本文详细介绍如何使用Python调用天眼查API实现企业信息查询，涵盖API接入流程、参数配置、错误处理及代码示例，助力开发者快速构建企业信息检索系统。

一、天眼查API的价值与适用场景

天眼查作为国内领先的企业信息查询平台，其API接口为开发者提供了结构化、高时效的企业数据服务。相较于网页爬取，API调用具有三大核心优势：

数据合法性：通过官方授权接口获取数据，规避法律风险
效率提升：单次请求可获取企业基础信息、股东结构、司法风险等20+维度数据
稳定性保障：官方维护的接口服务，避免网页结构变更导致的解析失败

典型应用场景包括：

金融风控系统中的企业征信核查
供应链管理系统中的供应商资质审查
商业智能工具中的竞品分析模块
法律服务平台的案件关联企业检索

二、Python调用天眼查API的技术实现

2.1 准备工作

API密钥申请：
- 登录天眼查开发者平台（https://open.tianyancha.com）
- 完成企业认证后获取API Key和Secret
- 注意：免费版每日调用限额为100次，商业应用需购买套餐

开发环境配置：

# 推荐使用requests库处理HTTP请求
pip install requests
# 数据解析建议使用pandas
pip install pandas

2.2 核心接口调用流程

2.2.1 身份认证

天眼查API采用HMAC-SHA256签名认证机制：

import hmac
import hashlib
import base64
import time
from urllib.parse import quote
def generate_sign(secret, method, path, params, timestamp):
    raw_str = f"{method}\n{path}\n{params}\n{timestamp}"
    secret_bytes = secret.encode('utf-8')
    raw_bytes = raw_str.encode('utf-8')
    sign = hmac.new(secret_bytes, raw_bytes, hashlib.sha256).digest()
    return base64.b64encode(sign).decode('utf-8')
# 示例调用
api_key = "your_api_key"
api_secret = "your_api_secret"
timestamp = str(int(time.time()))
path = "/api/company/search"
params = "keyword=阿里巴巴"
method = "GET"
sign = generate_sign(api_secret, method, path, params, timestamp)

2.2.2 企业搜索接口

import requests
def search_company(keyword, page=1, size=10):
    url = "https://api.tianyancha.com/api/company/search"
    headers = {
        "X-TYC-APIKEY": api_key,
        "X-TYC-TIMESTAMP": timestamp,
        "X-TYC-SIGN": sign,
        "Content-Type": "application/json"
    }
    params = {
        "keyword": keyword,
        "page": page,
        "size": size
    }
    try:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"请求失败: {e}")
        return None
# 示例：搜索包含"腾讯"的企业
result = search_company("腾讯")

2.2.3 企业详情接口

def get_company_detail(company_id):
    url = f"https://api.tianyancha.com/api/company/{company_id}"
    headers = {
        "X-TYC-APIKEY": api_key,
        "X-TYC-TIMESTAMP": str(int(time.time())),
        # 需重新生成签名
        "X-TYC-SIGN": generate_sign(api_secret, "GET", f"/api/company/{company_id}", "", str(int(time.time()))),
    }
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"获取详情失败: {e}")
        return None
# 示例：获取企业ID为123456的详情
detail = get_company_detail("123456")

三、进阶应用技巧

3.1 批量查询优化

import pandas as pd
from concurrent.futures import ThreadPoolExecutor
def batch_search(keywords, max_workers=5):
    results = []
    with ThreadPoolExecutor(max_workers=max_workers) as executor:
        futures = [executor.submit(search_company, kw) for kw in keywords]
        for future in futures:
            data = future.result()
            if data:
                results.extend(data.get("items", []))
    return pd.DataFrame(results)
# 示例：批量查询多个关键词
keywords = ["字节跳动", "美团", "京东"]
df = batch_search(keywords)

3.2 数据持久化方案

import sqlite3
def save_to_db(company_data):
    conn = sqlite3.connect("company_data.db")
    cursor = conn.cursor()
    cursor.execute("""
        CREATE TABLE IF NOT EXISTS companies (
            id TEXT PRIMARY KEY,
            name TEXT,
            legal_person TEXT,
            registered_capital TEXT,
            establish_date TEXT,
            business_status TEXT
        )
    """)
    for item in company_data.get("items", []):
        cursor.execute("""
            INSERT OR REPLACE INTO companies VALUES (?,?,?,?,?,?)
        """, (
            item["id"],
            item["name"],
            item["legalPersonName"],
            item["registeredCapital"],
            item["establishTime"],
            item["businessStatus"]
        ))
    conn.commit()
    conn.close()
# 示例：保存搜索结果
search_result = search_company("华为")
if search_result:
    save_to_db(search_result)

四、常见问题处理

4.1 接口调用频率限制

免费版：100次/日，QPS≤5

解决方案：

实现请求队列，控制并发数
错误码429时，自动重试（间隔递增）
```python
import time
from requests.exceptions import HTTPError

def safe_request(func, max_retries=3):

for i in range(max_retries):
    try:
        return func()
    except HTTPError as e:
        if e.response.status_code == 429 and i < max_retries - 1:
            sleep_time = (i + 1) * 2
            time.sleep(sleep_time)
        else:
            raise

```

4.2 数据解析异常处理

def parse_company_data(raw_data):
    try:
        if not raw_data or "code" not in raw_data or raw_data["code"] != 0:
            raise ValueError("无效的响应数据")
        company = {
            "name": raw_data["data"]["name"],
            "legal_person": raw_data["data"].get("legalPersonName", "未知"),
            "status": raw_data["data"]["businessStatus"],
            "shareholders": [
                {"name": s["name"], "ratio": s["stockPercent"]}
                for s in raw_data["data"].get("stockHolders", [])
            ]
        }
        return company
    except (KeyError, TypeError) as e:
        print(f"数据解析错误: {e}")
        return None

五、最佳实践建议

缓存策略：
- 对高频查询的企业ID建立本地缓存（Redis/SQLite）
- 设置合理的TTL（如企业基本信息缓存24小时）
错误监控：
- 记录所有API调用日志（请求参数、响应时间、错误码）
- 设置异常报警阈值（如连续5次429错误）
数据更新机制：
- 对关键企业信息（如司法风险）实现增量更新
- 使用ETag或Last-Modified头实现条件请求
安全规范：
- API密钥存储在环境变量或密钥管理服务中
- 实现请求日志脱敏处理

六、总结与展望

通过Python调用天眼查API，开发者可以高效构建企业信息查询系统。关键实施要点包括：

严格遵循API调用规范，做好身份认证
实现健壮的错误处理和重试机制
结合业务场景设计合理的数据缓存策略
持续监控接口调用指标，优化调用频率

未来随着企业数据服务的发展，建议关注：

天眼查新推出的深度分析接口
结合OCR技术实现非结构化数据解析
探索企业关联图谱的可视化应用

通过系统化的API调用方案，开发者能够为企业风控、供应链管理等场景提供可靠的数据支持，创造显著的业务价值。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

天眼查API助力Python：高效查询企业信息的实践指南

一、天眼查API的价值与适用场景

二、Python调用天眼查API的技术实现

2.1 准备工作

2.2 核心接口调用流程

2.2.1 身份认证

2.2.2 企业搜索接口

2.2.3 企业详情接口

三、进阶应用技巧

3.1 批量查询优化

3.2 数据持久化方案

四、常见问题处理

4.1 接口调用频率限制

4.2 数据解析异常处理

五、最佳实践建议

六、总结与展望

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者