Python调用大语言模型API接口详细教程

Python基础 2 月前 0 33

Python调用大语言模型API接口详细教程

一、引言

随着人工智能技术的快速发展，大语言模型（LLM）已经成为开发者和研究人员的重要工具。通过API接口调用这些模型，可以轻松地将AI能力集成到自己的应用程序中。本文将详细介绍如何使用Python调用各种大语言模型的API接口，包括基础概念、环境配置、代码实现以及常见问题解决方案。

二、基础知识

什么是API？

API（Application Programming Interface，应用程序编程接口）是一套预先定义的函数或协议，允许不同的软件组件相互通信。对于大语言模型来说，API允许我们通过HTTP请求发送文本给模型，并接收模型的回复。

API调用的基本流程

准备API密钥（Authentication）
构建HTTP请求
发送请求到模型服务器
接收并解析响应
处理结果

三、环境准备

1. 安装必要的库

pip install requests openai python-dotenv

2. 获取API密钥

不同平台的API密钥获取方式：

OpenAI：登录OpenAI官网，在账户设置中获取API密钥
Anthropic：登录Anthropic开发者平台获取密钥
Minimax：登录Minimax控制台获取密钥
Qwen：登录阿里云控制台获取密钥

3. 创建配置文件

创建.env文件存储敏感信息：

OPENAI_API_KEY=your_openai_api_key
ANTHROPIC_API_KEY=your_anthropic_api_key
MINIMAX_API_KEY=your_minimax_api_key
QWEN_API_KEY=your_qwen_api_key

四、使用Python调用不同模型

1. OpenAI GPT系列模型

import openai
import os
from dotenv import load_dotenv

# Load environment variables
load_dotenv()

# Set API key
openai.api_key = os.getenv("OPENAI_API_KEY")

def call_gpt_model(prompt, model="gpt-3.5-turbo"):
    try:
        response = openai.ChatCompletion.create(
            model=model,
            messages=[
                {"role": "system", "content": "你是一个有用的助手"},
                {"role": "user", "content": prompt}
            ],
            temperature=0.7,
            max_tokens=1000
        )
        
        return response.choices[0].message['content'].strip()
    
    except Exception as e:
        print(f"调用OpenAI API时发生错误: {e}")
        return None

# Example usage
if __name__ == "__main__":
    prompt = "请解释什么是机器学习"
    result = call_gpt_model(prompt)
    print(f"GPT回复: {result}")

2. Anthropic Claude模型

import anthropic
import os
from dotenv import load_dotenv

# Load environment variables
load_dotenv()

def call_claude_model(prompt):
    client = anthropic.Client(api_key=os.getenv("ANTHROPIC_API_KEY"))
    
    try:
        response = client.completion(
            prompt=f"{anthropic.HUMAN_PROMPT} {prompt}{anthropic.AI_PROMPT}",
            model="claude-v1",
            max_tokens_to_sample=1000,
            temperature=0.7
        )
        
        return response.completion.strip()
    
    except Exception as e:
        print(f"调用Claude API时发生错误: {e}")
        return None

# Example usage
if __name__ == "__main__":
    prompt = "请解释什么是深度学习"
    result = call_claude_model(prompt)
    print(f"Claude回复: {result}")

3. Minimax模型

import requests
import json
import os
from dotenv import load_dotenv

# Load environment variables
load_dotenv()

def call_minimax_model(prompt):
    url = "https://api.minimaxi.com/v1/text/chatcompletion"
    
    headers = {
        "Authorization": f"Bearer {os.getenv('MINIMAX_API_KEY')}",
        "Content-Type": "application/json"
    }
    
    payload = {
        "model": "abab5.5-chat",
        "messages": [
            {
                "sender_type": "USER",
                "sender_name": "user",
                "text": prompt
            }
        ],
        "temperature": 0.7,
        "top_p": 0.9,
        "max_tokens": 1000
    }
    
    try:
        response = requests.post(url, headers=headers, json=payload)
        response.raise_for_status()  # Check HTTP errors
        
        result = response.json()
        return result['choices'][0]['messages'][0]['text'].strip()
    
    except Exception as e:
        print(f"调用Minimax API时发生错误: {e}")
        return None

# Example usage
if __name__ == "__main__":
    prompt = "请解释什么是自然语言处理"
    result = call_minimax_model(prompt)
    print(f"Minimax回复: {result}")

4. Qwen（通义千问）模型

import requests
import json
import os
from dotenv import load_dotenv

# Load environment variables
load_dotenv()

def call_qwen_model(prompt):
    url = "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation"
    
    headers = {
        "Authorization": f"Bearer {os.getenv('QWEN_API_KEY')}",
        "Content-Type": "application/json"
    }
    
    payload = {
        "model": "qwen-max",
        "input": {
            "messages": [
                {
                    "role": "user",
                    "content": prompt
                }
            ]
        },
        "parameters": {
            "temperature": 0.7,
            "max_tokens": 1000
        }
    }
    
    try:
        response = requests.post(url, headers=headers, json=payload)
        response.raise_for_status()
        
        result = response.json()
        return result['output']['text'].strip()
    
    except Exception as e:
        print(f"调用Qwen API时发生错误: {e}")
        return None

# Example usage
if __name__ == "__main__":
    prompt = "请解释什么是大语言模型"
    result = call_qwen_model(prompt)
    print(f"Qwen回复: {result}")

五、通用API调用类封装

为了简化开发，我们可以创建一个通用的API调用类：

import requests
import json
import os
from abc import ABC, abstractmethod
from dotenv import load_dotenv

load_dotenv()

class BaseModelAPI:
    pass

class OpenAIModel:
    def __init__(self):
        self.api_key = os.getenv("OPENAI_API_KEY")
        self.url = "https://api.openai.com/v1/chat/completions"
    
    def call(self, prompt, model="gpt-3.5-turbo", temperature=0.7, max_tokens=1000):
        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }
        
        payload = {
            "model": model,
            "messages": [
                {"role": "system", "content": "你是一个有用的助手"},
                {"role": "user", "content": prompt}
            ],
            "temperature": temperature,
            "max_tokens": max_tokens
        }
        
        response = requests.post(self.url, headers=headers, json=payload)
        response.raise_for_status()
        
        return response.json()["choices"][0]["message"]["content"].strip()

class GenericModelAPI:
    def __init__(self, api_url, api_key, model_name, api_format="openai"):
        self.api_url = api_url
        self.api_key = api_key
        self.model_name = model_name
        self.api_format = api_format
    
    def call(self, prompt, **kwargs):
        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }
        
        if self.api_format == "openai":
            payload = {
                "model": self.model_name,
                "messages": [
                    {"role": "system", "content": "你是一个有用的助手"},
                    {"role": "user", "content": prompt}
                ],
                "temperature": kwargs.get("temperature", 0.7),
                "max_tokens": kwargs.get("max_tokens", 1000)
            }
        else:
            # Other API formats
            payload = {
                "model": self.model_name,
                "prompt": prompt,
                "temperature": kwargs.get("temperature", 0.7),
                "max_tokens": kwargs.get("max_tokens", 1000)
            }
        
        response = requests.post(self.api_url, headers=headers, json=payload)
        response.raise_for_status()
        
        result = response.json()
        
        if self.api_format == "openai":
            return result["choices"][0]["message"]["content"].strip()
        else:
            return result.get("response", "").strip()

# Example usage
if __name__ == "__main__":
    # Using OpenAI
    openai_model = OpenAIModel()
    result = openai_model.call("请解释什么是人工智能")
    print(f"OpenAI回复: {result}")
    
    # Using generic API class to call other models
    # For example, calling Minimax
    minimax_api = GenericModelAPI(
        api_url="https://api.minimaxi.com/v1/text/chatcompletion",
        api_key=os.getenv("MINIMAX_API_KEY"),
        model_name="abab5.5-chat",
        api_format="minimax"
    )
    # Note: Need to adjust according to actual API format

六、错误处理与最佳实践

1. 错误处理

import time
import random
from functools import wraps

def retry_with_backoff(max_retries=3, base_delay=1, max_delay=60):
    def decorator(func):
        @wraps(func)
        def wrapper(*args, **kwargs):
            for attempt in range(max_retries):
                try:
                    return func(*args, **kwargs)
                except requests.exceptions.RequestException as e:
                    if attempt == max_retries - 1:
                        raise e
                    
                    delay = min(base_delay * (2 ** attempt) + random.uniform(0, 1), max_delay)
                    print(f"请求失败，{delay:.2f}秒后重试... (尝试 {attempt + 1}/{max_retries})")
                    time.sleep(delay)
            
            return None
        return wrapper
    return decorator

@retry_with_backoff(max_retries=3)
def robust_call_model(prompt, model_api):
    return model_api.call(prompt)

2. 请求限制与节流

import time
from collections import deque

class RateLimiter:
    def __init__(self, max_requests=60, time_window=60):
        self.max_requests = max_requests
        self.time_window = time_window
        self.requests = deque()
    
    def wait_if_needed(self):
        now = time.time()
        
        # Clear request records beyond the time window
        while self.requests and self.requests[0] = self.max_requests:
            sleep_time = self.time_window - (now - self.requests[0])
            if sleep_time > 0:
                print(f"请求频率过高，等待 {sleep_time:.2f} 秒...")
                time.sleep(sleep_time)
        
        self.requests.append(now)

# Example usage
limiter = RateLimiter(max_requests=10, time_window=60)  # Max 10 requests per minute

def call_model_with_rate_limit(prompt, model_api):
    limiter.wait_if_needed()
    return model_api.call(prompt)

七、异步调用提高性能

对于需要大量并发调用的场景，可以使用异步方式：

import asyncio
import aiohttp
import os
from dotenv import load_dotenv

load_dotenv()

async def async_call_openai(session, prompt, semaphore):
    async with semaphore:  # Control concurrency
        headers = {
            "Authorization": f"Bearer {os.getenv('OPENAI_API_KEY')}",
            "Content-Type": "application/json"
        }
        
        payload = {
            "model": "gpt-3.5-turbo",
            "messages": [
                {"role": "system", "content": "你是一个有用的助手"},
                {"role": "user", "content": prompt}
            ],
            "temperature": 0.7,
            "max_tokens": 1000
        }
        
        async with session.post("https://api.openai.com/v1/chat/completions", 
                               headers=headers, json=payload) as response:
            result = await response.json()
            return result["choices"][0]["message"]["content"].strip()

async def async_batch_calls(prompts, max_concurrent=5):
    semaphore = asyncio.Semaphore(max_concurrent)
    
    async with aiohttp.ClientSession() as session:
        tasks = [async_call_openai(session, prompt, semaphore) for prompt in prompts]
        results = await asyncio.gather(*tasks, return_exceptions=True)
        
        return results

# Example usage
if __name__ == "__main__":
    prompts = [
        "请解释什么是人工智能",
        "请解释什么是机器学习", 
        "请解释什么是深度学习"
    ]
    
    # Run asynchronous batch processing
    results = asyncio.run(async_batch_calls(prompts))
    
    for i, result in enumerate(results):
        print(f"Prompt {i+1}: {prompts[i]}")
        print(f"Response: {result}
")

八、配置管理与部署

1. 配置文件管理

创建config.py文件：

import os
from dotenv import load_dotenv

load_dotenv()

class Config:
    # API configuration
    OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
    ANTHROPIC_API_KEY = os.getenv("ANTHROPIC_API_KEY")
    MINIMAX_API_KEY = os.getenv("MINIMAX_API_KEY")
    QWEN_API_KEY = os.getenv("QWEN_API_KEY")
    
    # Model configuration
    DEFAULT_MODEL = os.getenv("DEFAULT_MODEL", "gpt-3.5-turbo")
    TEMPERATURE = float(os.getenv("TEMPERATURE", "0.7"))
    MAX_TOKENS = int(os.getenv("MAX_TOKENS", "1000"))
    
    # Rate limiting
    RATE_LIMIT_REQUESTS = int(os.getenv("RATE_LIMIT_REQUESTS", "60"))
    RATE_LIMIT_WINDOW = int(os.getenv("RATE_LIMIT_WINDOW", "60"))

config = Config.

2. Docker部署

创建Dockerfile：

FROM python:3.9-slim

WORKDIR /app

COPY requirements.txt .
RUN pip install -r requirements.txt

COPY . .

CMD ["python", "main.py"]

创建requirements.txt：

requests==2.31.0
openai==0.28.0
python-dotenv==1.0.0
anthropic==0.5.0
aiohttp==3.8.5

九、安全考虑

1. API密钥安全

import os
import logging

# Set up logging
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

def validate_api_key(api_key):
    if not api_key:
        logger.error("API密钥不能为空")
        return False
    
    if not isinstance(api_key, str) or len(api_key) < 10:
        logger.error("API密钥格式不正确")
        return False
    
    return True

def secure_load_api_keys():
    keys = {}
    for env_var in ['OPENAI_API_KEY', 'ANTHROPIC_API_KEY', 'MINIMAX_API_KEY', 'QWEN_API_KEY']:
        key = os.getenv(env_var)
        if key and validate_api_key(key):
            keys[env_var] = key
        else:
            logger.warning(f"{env_var}未正确配置或验证失败")
    
    return keys

2. HTTPS和SSL验证

import ssl
import certifi

def create_secure_session():
    import urllib3
    urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
    
    session = requests.Session()
    session.verify = certifi.where()  # Use certificates package to verify SSL
    
    return session

十、常见问题与解决方案

1. API调用失败

问题: requests.exceptions.ConnectionError

解决方案:

检查网络连接
验证API端点URL
检查防火墙设置

2. 认证失败

问题: 401 Unauthorized

解决方案:

检查API密钥是否正确
确认API密钥是否有足够权限
检查请求头格式

3. 请求频率限制

问题: 429 Too Many Requests

解决方案:

实现请求频率限制
使用指数退避重试机制
联系服务商提升配额

4. 响应超时

问题: requests.exceptions.Timeout

解决方案:

设置合适的超时时间
实现超时重试机制
优化请求内容长度

十一、性能优化建议

1. 批量处理

def batch_process(prompts, model_api, batch_size=10):
    results = []
    
    for i in range(0, len(prompts), batch_size):
        batch = prompts[i:i + batch_size]
        
        # Process current batch in parallel
        batch_results = []
        for prompt in batch:
            result = model_api.call(prompt)
            batch_results.append(result)
        
        results.extend(batch_results)
        
        # Appropriate delay between batches to avoid rate limiting
        time.sleep(1)
    
    return results

2. 结果缓存

import hashlib

class CachedModelAPI:
    def __init__(self, model_api, cache_size=128):
        self.model_api = model_api
        self.cache = {}
        self.cache_size = cache_size
    
    def _get_cache_key(self, prompt, **kwargs):
        key_data = f"{prompt}_{str(sorted(kwargs.items()))}"
        return hashlib.md5(key_data.encode()).hexdigest()
    
    def call(self, prompt, **kwargs):
        cache_key = self._get_cache_key(prompt, **kwargs)
        
        if cache_key in self.cache:
            print("从缓存返回结果")
            return self.cache[cache_key]
        
        result = self.model_api.call(prompt, **kwargs)
        
        # Control cache size
        if len(self.cache) >= self.cache_size:
            # Remove earliest added cache item
            oldest_key = next(iter(self.cache))
            del self.cache[oldest_key]
        
        self.cache[cache_key] = result
        return result

十二、总结

通过本文的学习，你应该已经掌握了：

基础概念：理解了API调用的基本原理和流程
环境配置：学会了如何设置开发环境和配置API密钥
代码实现：掌握了调用不同模型API的具体方法
错误处理：了解了常见的错误类型及解决方案
性能优化：学习了提高API调用效率的方法
安全考虑：知道了如何安全地管理API密钥

现在你可以开始实践，将这些知识应用到你的项目中。记住，实践是最好的学习方式，多尝试、多调试，你会越来越熟练！

注意：在使用任何模型API时，请务必遵守相关平台的使用条款和法律法规，合理使用API，避免滥用。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

Python调用大语言模型API接口详细教程

一、引言

二、基础知识

什么是API？

API调用的基本流程

三、环境准备

1. 安装必要的库

2. 获取API密钥

3. 创建配置文件

四、使用Python调用不同模型

1. OpenAI GPT系列模型

2. Anthropic Claude模型

3. Minimax模型

4. Qwen（通义千问）模型

五、通用API调用类封装

六、错误处理与最佳实践

1. 错误处理

2. 请求限制与节流

七、异步调用提高性能

八、配置管理与部署

1. 配置文件管理

2. Docker部署

九、安全考虑

1. API密钥安全

2. HTTPS和SSL验证

十、常见问题与解决方案

1. API调用失败

2. 认证失败

3. 请求频率限制

4. 响应超时

十一、性能优化建议

1. 批量处理

2. 结果缓存

十二、总结

相关文章

发表回复 取消回复

发表回复取消回复