AstrBot/model/provider/provider_openai_official.py

from openai import OpenAI
from openai.types.chat.chat_completion import ChatCompletion
import json
import time
import os
import sys
from cores.database.conn import dbConn
from model.provider.provider import Provider
import threading
from util import general_utils as gu
import traceback

abs_path = os.path.dirname(os.path.realpath(sys.argv[0])) + '/'
key_record_path = abs_path + 'chatgpt_key_record'

class ProviderOpenAIOfficial(Provider):
    def __init__(self, cfg):
        self.key_list = []
        # 如果 cfg['key']中有长度为1的字符串，那么是格式错误，直接报错
        for key in cfg['key']:
            if len(key) == 1:
                input("检查到了长度为 1 的Key。配置文件中的 openai.key 处的格式错误 (符号 - 的后面要加空格)，请退出程序并检查配置文件，按回车跳过。")
                raise BaseException("配置文件格式错误")
        if cfg['key'] != '' and cfg['key'] != None:
            self.key_list = cfg['key']
        else:
            input("[System] 请先去完善ChatGPT的Key。详情请前往https://beta.openai.com/account/api-keys")
        if len(self.key_list) == 0:
            raise Exception("您打开了 OpenAI 模型服务，但是未填写 key。请前往填写。")

        self.key_stat = {}
        for k in self.key_list:
            self.key_stat[k] = {'exceed': False, 'used': 0}

        self.api_base = None
        if 'api_base' in cfg and cfg['api_base'] != 'none' and cfg['api_base'] != '':
            self.api_base = cfg['api_base']
            print(f"设置 api_base 为: {self.api_base}")
        # openai client
        self.client = OpenAI(
            api_key=self.key_list[0],
            base_url=self.api_base
        )

        self.openai_model_configs: dict = cfg['chatGPTConfigs']
        gu.log(f'加载 OpenAI Chat Configs: {self.openai_model_configs}')
        self.openai_configs = cfg
        # 会话缓存
        self.session_dict = {}
        # 最大缓存token
        self.max_tokens = cfg['total_tokens_limit']
        # 历史记录持久化间隔时间
        self.history_dump_interval = 20

        # 读取历史记录
        try:
            db1 = dbConn()
            for session in db1.get_all_session():
                self.session_dict[session[0]] = json.loads(session[1])['data']
            gu.log("读取历史记录成功。")
        except BaseException as e:
            gu.log("读取历史记录失败，但不影响使用。", level=gu.LEVEL_ERROR)


        # 读取统计信息
        if not os.path.exists(abs_path+"configs/stat"):
            with open(abs_path+"configs/stat", 'w', encoding='utf-8') as f:
                    json.dump({}, f)
        self.stat_file = open(abs_path+"configs/stat", 'r', encoding='utf-8')
        global count
        res = self.stat_file.read()
        if res == '':
            count = {}
        else:
            try:
                count = json.loads(res)
            except BaseException:
                pass

        # 创建转储定时器线程
        threading.Thread(target=self.dump_history, daemon=True).start()

        # 人格
        self.now_personality = {}


    # 转储历史记录
    def dump_history(self):
        time.sleep(10)
        db = dbConn()
        while True:
            try:
                # print("转储历史记录...")
                for key in self.session_dict:
                    # print("TEST: "+str(db.get_session(key)))
                    data = self.session_dict[key]
                    data_json = {
                        'data': data
                    }
                    if db.check_session(key):
                        db.update_session(key, json.dumps(data_json))
                    else:
                        db.insert_session(key, json.dumps(data_json))
                # print("转储历史记录完毕")
            except BaseException as e:
                print(e)
            # 每隔10分钟转储一次
            time.sleep(10*self.history_dump_interval)

    def text_chat(self, prompt, session_id = None, image_url = None, function_call=None):
        if session_id is None:
            session_id = "unknown"
            if "unknown" in self.session_dict:
                del self.session_dict["unknown"]
        # 会话机制
        if session_id not in self.session_dict:
            self.session_dict[session_id] = []

            fjson = {}
            try:
                f = open(abs_path+"configs/session", "r", encoding="utf-8")
                fjson = json.loads(f.read())
                f.close()
            except:
                pass
            finally:
                fjson[session_id] = 'true'
                f = open(abs_path+"configs/session", "w", encoding="utf-8")
                f.write(json.dumps(fjson))
                f.flush()
                f.close()

        cache_data_list, new_record, req = self.wrap(prompt, session_id, image_url)
        gu.log(f"CACHE_DATA_: {str(cache_data_list)}", level=gu.LEVEL_DEBUG, max_len=99999)
        gu.log(f"OPENAI REQUEST: {str(req)}", level=gu.LEVEL_DEBUG, max_len=9999)
        retry = 0
        response = None
        err = ''

        # 截断倍率
        truncate_rate = 0.75

        use_gpt4v = False
        for i in req:
            if isinstance(i['content'], list):
                use_gpt4v = True
                break
        if image_url is not None:
            use_gpt4v = True
        if use_gpt4v:
            conf = self.openai_model_configs.copy()
            conf['model'] = 'gpt-4-vision-preview'
        else:
            conf = self.openai_model_configs
        print(req)
        while retry < 10:
            try:
                if function_call is None:
                    response = self.client.chat.completions.create(
                        messages=req,
                        **conf
                    )
                else:
                    response = self.client.chat.completions.create(
                        messages=req,
                        tools = function_call,
                        **conf
                    )
                break
            except Exception as e:
                print(traceback.format_exc())
                if 'Invalid content type. image_url is only supported by certain models.' in str(e):
                    raise e
                if 'You exceeded' in str(e) or 'Billing hard limit has been reached' in str(e) or 'No API key provided' in str(e) or 'Incorrect API key provided' in str(e):
                    gu.log("当前Key已超额或异常, 正在切换", level=gu.LEVEL_WARNING)
                    self.key_stat[self.client.api_key]['exceed'] = True
                    is_switched = self.handle_switch_key()
                    if not is_switched:
                        # 所有Key都超额或不正常
                        raise e
                    retry -= 1
                elif 'maximum context length' in str(e):
                    gu.log("token超限, 清空对应缓存，并进行消息截断")
                    self.session_dict[session_id] = []
                    prompt = prompt[:int(len(prompt)*truncate_rate)]
                    truncate_rate -= 0.05
                    cache_data_list, new_record, req = self.wrap(prompt, session_id)

                elif 'Limit: 3 / min. Please try again in 20s.' in str(e) or "OpenAI response error" in str(e):
                    time.sleep(30)
                    continue
                else:
                    gu.log(str(e), level=gu.LEVEL_ERROR)
                time.sleep(2)
                err = str(e)
                retry += 1
        if retry >= 10:
            gu.log(r"如果报错, 且您的机器在中国大陆内, 请确保您的电脑已经设置好代理软件(梯子), 并在配置文件设置了系统代理地址。详见https://github.com/Soulter/QQChannelChatGPT/wiki/%E4%BA%8C%E3%80%81%E9%A1%B9%E7%9B%AE%E9%85%8D%E7%BD%AE%E6%96%87%E4%BB%B6%E9%85%8D%E7%BD%AE", max_len=999)
            raise BaseException("连接出错: "+str(err))
        assert isinstance(response, ChatCompletion)
        print(response)

        # 结果分类
        choice = response.choices[0]
        if choice.message.content != None:
            # 文本形式
            chatgpt_res = str(choice.message.content).strip()
        elif choice.message.tool_calls != None and len(choice.message.tool_calls) > 0:
            # tools call (function calling)
            return choice.message.tool_calls[0].function

        gu.log(f"OPENAI RESPONSE: {response.usage}", level=gu.LEVEL_DEBUG, max_len=9999)

        self.key_stat[self.client.api_key]['used'] += response.usage.total_tokens
        current_usage_tokens = response.usage.total_tokens

        # 超过指定tokens， 尽可能的保留最多的条目，直到小于max_tokens
        if current_usage_tokens > self.max_tokens:
            t = current_usage_tokens
            index = 0
            while t > self.max_tokens:
                if index >= len(cache_data_list):
                    break
                # 保留人格信息
                if cache_data_list[index]['type'] != 'personality':
                    t -= int(cache_data_list[index]['single_tokens'])
                    del cache_data_list[index]
                else:
                    index += 1
            # 删除完后更新相关字段
            self.session_dict[session_id] = cache_data_list
            # cache_prompt = get_prompts_by_cache_list(cache_data_list)

        # 添加新条目进入缓存的prompt
        new_record['AI'] = {
            'role': 'assistant',
            'content': chatgpt_res,
        }
        new_record['usage_tokens'] = current_usage_tokens
        if len(cache_data_list) > 0:
            new_record['single_tokens'] = current_usage_tokens - int(cache_data_list[-1]['usage_tokens'])
        else:
            new_record['single_tokens'] = current_usage_tokens

        cache_data_list.append(new_record)

        self.session_dict[session_id] = cache_data_list

        return chatgpt_res

    def image_chat(self, prompt, img_num = 1, img_size = "1024x1024"):
        retry = 0
        image_url = ''
        while retry < 5:
            try:
                response = self.client.images.generate(
                    prompt=prompt,
                    n=img_num,
                    size=img_size
                )
                image_url = []
                for i in range(img_num):
                    image_url.append(response['data'][i]['url'])
                break
            except Exception as e:
                gu.log(str(e), level=gu.LEVEL_ERROR)
                if 'You exceeded' in str(e) or 'Billing hard limit has been reached' in str(
                        e) or 'No API key provided' in str(e) or 'Incorrect API key provided' in str(e):
                    gu.log("当前 Key 已超额或者不正常, 正在切换", level=gu.LEVEL_WARNING)
                    self.key_stat[self.client.api_key]['exceed'] = True
                    is_switched = self.handle_switch_key()
                    if not is_switched:
                        # 所有Key都超额或不正常
                        raise e
                else:
                    retry += 1
        if retry >= 5:
            raise BaseException("连接超时")

        return image_url

    def forget(self, session_id = None) -> bool:
        if session_id is None:
            return False
        self.session_dict[session_id] = []
        return True

    '''
    获取缓存的会话
    '''
    def get_prompts_by_cache_list(self, cache_data_list, divide=False, paging=False, size=5, page=1):
        prompts = ""
        if paging:
            page_begin = (page-1)*size
            page_end = page*size
            if page_begin < 0:
                page_begin = 0
            if page_end > len(cache_data_list):
                page_end = len(cache_data_list)
            cache_data_list = cache_data_list[page_begin:page_end]
        for item in cache_data_list:
            prompts += str(item['user']['role']) + ":\n" + str(item['user']['content']) + "\n"
            prompts += str(item['AI']['role']) + ":\n" + str(item['AI']['content']) + "\n"

            if divide:
                prompts += "----------\n"
        return prompts


    def get_user_usage_tokens(self,cache_list):
        usage_tokens = 0
        for item in cache_list:
            usage_tokens += int(item['single_tokens'])
        return usage_tokens

    '''
    获取统计信息
    '''
    def get_stat(self):
        try:
            f = open(abs_path+"configs/stat", "r", encoding="utf-8")
            fjson = json.loads(f.read())
            f.close()
            guild_count = 0
            guild_msg_count = 0
            guild_direct_msg_count = 0

            for k,v in fjson.items():
                guild_count += 1
                guild_msg_count += v['count']
                guild_direct_msg_count += v['direct_count']

            session_count = 0

            f = open(abs_path+"configs/session", "r", encoding="utf-8")
            fjson = json.loads(f.read())
            f.close()
            for k,v in fjson.items():
                session_count += 1
            return guild_count, guild_msg_count, guild_direct_msg_count, session_count
        except:
            return -1, -1, -1, -1

    # 包装信息
    def wrap(self, prompt, session_id, image_url = None):
        if image_url is not None:
            prompt = [
                {
                    "type": "text",
                    "text": prompt
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": image_url
                    }
                }
            ]
        # 获得缓存信息
        context = self.session_dict[session_id]
        new_record = {
            "user": {
                "role": "user",
                "content": prompt,
            },
            "AI": {},
            'type': "common",
            'usage_tokens': 0,
        }
        req_list = []
        for i in context:
            if 'user' in i:
                req_list.append(i['user'])
            if 'AI' in i:
                req_list.append(i['AI'])
        req_list.append(new_record['user'])
        return context, new_record, req_list

    def handle_switch_key(self):
        # messages = [{"role": "user", "content": prompt}]
        is_all_exceed = True
        for key in self.key_stat:
            if key == None or self.key_stat[key]['exceed']:
                continue
            is_all_exceed = False
            self.client.api_key = key
            gu.log(f"切换到Key: {key}, 已使用token: {self.key_stat[key]['used']}", level=gu.LEVEL_INFO)
            break
        if is_all_exceed:
            gu.log("所有Key已超额", level=gu.LEVEL_CRITICAL)
            return False
        return True

    def get_configs(self):
        return self.openai_configs

    def get_key_stat(self):
        return self.key_stat

    def get_key_list(self):
        return self.key_list

    def get_curr_key(self):
        return self.client.api_key

    # 添加key
    def append_key(self, key, sponsor):
        self.key_list.append(key)
        self.key_stat[key] = {'exceed': False, 'used': 0, 'sponsor': sponsor}

    # 检查key是否可用
    def check_key(self, key):
        client_ = OpenAI(
            api_key=key,
            base_url=self.api_base
        )
        messages = [{"role": "user", "content": "please just echo `test`"}]
        try:
            client_.chat.completions.create(
                messages=messages,
                **self.openai_model_configs
            )
            return True
        except Exception as e:
            pass
        return False