ragflow/conf/models/siliconflow.json

{
  "name": "SiliconFlow",
  "url": {
    "default": "https://api.siliconflow.cn/v1"
  },
  "url_suffix": {
    "chat": "chat/completions",
    "models": "models",
    "embedding": "embeddings",
    "rerank": "rerank",
    "balance": "user/info",
    "tts": "audio/speech",
    "asr": "audio/transcriptions"
  },
  "models": [
    {
      "name": "qwen/qwen3-8b",
      "max_tokens": 32768,
      "model_types": [
        "chat"
      ]
    },
    {
      "name": "qwen/qwen3.5-4b",
      "max_tokens": 262144,
      "model_types": [
        "chat"
      ]
    },
    {
      "name": "tencent/hunyuan-mt-7b",
      "max_tokens": 32768,
      "model_types": [
        "chat"
      ]
    },
    {
      "name": "BAAI/bge-reranker-v2-m3",
      "max_tokens": 8192,
      "model_types": [
        "rerank"
      ]
    },
    {
      "name": "Qwen/Qwen3-Embedding-0.6B",
      "max_tokens": 8192,
      "model_types": [
        "embedding"
      ]
    },
    {
      "name": "fnlp/MOSS-TTSD-v0.5",
      "max_tokens": 8192,
      "model_types": [
        "tts"
      ]
    },
    {
      "name": "FunAudioLLM/CosyVoice2-0.5B",
      "max_tokens": 8192,
      "model_types": [
        "tts"
      ]
    },
    {
      "name": "FunAudioLLM/SenseVoiceSmall",
      "max_tokens": 8192,
      "model_types": [
        "asr"
      ]
    }
  ]
}