Revert "Refactor dataset / kb API to RESTFul style" (#13614)

Reverts infiniflow/ragflow#13263
2026-03-18 13:20:03 +08:00 · 2026-03-16 10:44:38 +08:00
parent ae9b1c7f6a
commit a2d72202cf
53 changed files with 1207 additions and 1721 deletions
--- a/admin/client/ragflow_client.py
+++ b/admin/client/ragflow_client.py
@ -764,14 +764,14 @@ class RAGFlowClient:

        iterations = command.get("iterations", 1)
        if iterations > 1:
-            response = self.http_client.request("GET", "/datasets", use_api_base=True, auth_kind="web",
+            response = self.http_client.request("POST", "/kb/list", use_api_base=False, auth_kind="web",
                                                iterations=iterations)
            return response
        else:
-            response = self.http_client.request("GET", "/datasets", use_api_base=True, auth_kind="web")
+            response = self.http_client.request("POST", "/kb/list", use_api_base=False, auth_kind="web")
            res_json = response.json()
            if response.status_code == 200:
-                self._print_table_simple(res_json["data"])
+                self._print_table_simple(res_json["data"]["kbs"])
            else:
                print(f"Fail to list datasets, code: {res_json['code']}, message: {res_json['message']}")
            return None
@ -781,13 +781,13 @@ class RAGFlowClient:
            print("This command is only allowed in USER mode")
        payload = {
            "name": command["dataset_name"],
-            "embedding_model": command["embedding"]
+            "embd_id": command["embedding"]
        }
        if "parser_id" in command:
-            payload["chunk_method"] = command["parser"]
+            payload["parser_id"] = command["parser"]
        if "pipeline" in command:
            payload["pipeline_id"] = command["pipeline"]
-        response = self.http_client.request("POST", "/datasets", json_body=payload, use_api_base=True,
+        response = self.http_client.request("POST", "/kb/create", json_body=payload, use_api_base=False,
                                            auth_kind="web")
        res_json = response.json()
        if response.status_code == 200:
@ -803,8 +803,8 @@ class RAGFlowClient:
        dataset_id = self._get_dataset_id(dataset_name)
        if dataset_id is None:
            return
-        payload = {"ids": [dataset_id]}
-        response = self.http_client.request("DELETE", "/datasets", json_body=payload, use_api_base=True, auth_kind="web")
+        payload = {"kb_id": dataset_id}
+        response = self.http_client.request("POST", "/kb/rm", json_body=payload, use_api_base=False, auth_kind="web")
        res_json = response.json()
        if response.status_code == 200:
            print(f"Drop dataset {dataset_name} successfully")
@ -1349,13 +1349,13 @@ class RAGFlowClient:
        return res_json["data"]["docs"]

    def _get_dataset_id(self, dataset_name: str):
-        response = self.http_client.request("GET", "/datasets", use_api_base=True, auth_kind="web")
+        response = self.http_client.request("POST", "/kb/list", use_api_base=False, auth_kind="web")
        res_json = response.json()
        if response.status_code != 200:
            print(f"Fail to list datasets, code: {res_json['code']}, message: {res_json['message']}")
            return None

-        dataset_list = res_json["data"]
+        dataset_list = res_json["data"]["kbs"]
        dataset_id: str = ""
        for dataset in dataset_list:
            if dataset["name"] == dataset_name:
--- a/api/apps/kb_app.py
+++ b/api/apps/kb_app.py
@ -13,6 +13,7 @@
 #  See the License for the specific language governing permissions and
 #  limitations under the License.
 #
+import json
 import logging
 import random
 import re
@ -25,29 +26,34 @@ from api.db.services.connector_service import Connector2KbService
 from api.db.services.llm_service import LLMBundle
 from api.db.services.document_service import DocumentService, queue_raptor_o_graphrag_tasks
 from api.db.services.doc_metadata_service import DocMetadataService
+from api.db.services.file2document_service import File2DocumentService
+from api.db.services.file_service import FileService
 from api.db.services.pipeline_operation_log_service import PipelineOperationLogService
 from api.db.services.task_service import TaskService, GRAPH_RAPTOR_FAKE_DOC_ID
-from api.db.services.user_service import UserTenantService
+from api.db.services.user_service import TenantService, UserTenantService
 from api.db.joint_services.tenant_model_service import get_model_config_by_type_and_name, get_model_config_by_id
 from api.utils.api_utils import (
    get_error_data_result,
    server_error_response,
    get_data_error_result,
    validate_request,
+    not_allowed_parameters,
    get_request_json,
 )
+from common.misc_utils import thread_pool_exec
 from api.db import VALID_FILE_TYPES
 from api.db.services.knowledgebase_service import KnowledgebaseService
+from api.db.db_models import File
 from api.utils.api_utils import get_json_result
+from api.utils.tenant_utils import ensure_tenant_model_id_for_params
 from rag.nlp import search
+from api.constants import DATASET_NAME_LIMIT
 from rag.utils.redis_conn import REDIS_CONN
-from common.constants import RetCode, PipelineTaskType, VALID_TASK_STATUS, LLMType
+from common.constants import RetCode, PipelineTaskType, StatusEnum, VALID_TASK_STATUS, FileSource, LLMType, PAGERANK_FLD
 from common import settings
 from common.doc_store.doc_store_base import OrderByExpr
 from api.apps import login_required, current_user

-"""
-Deprecated, todo delete 
@manager.route('/create', methods=['post'])  # noqa: F821
@login_required
@validate_request("name")
@ -180,7 +186,7 @@ async def update():
        return get_json_result(data=kb)
    except Exception as e:
        return server_error_response(e)
-"""
+

@manager.route('/update_metadata_setting', methods=['post'])  # noqa: F821
@login_required
@ -228,8 +234,7 @@ def detail():
    except Exception as e:
        return server_error_response(e)

-"""
-Deprecated, todo delete
+
@manager.route('/list', methods=['POST'])  # noqa: F821
@login_required
 async def list_kbs():
@ -324,7 +329,7 @@ async def rm():
        return await thread_pool_exec(_rm_sync)
    except Exception as e:
        return server_error_response(e)
-"""
+

@manager.route('/<kb_id>/tags', methods=['GET'])  # noqa: F821
@login_required
@ -400,8 +405,7 @@ async def rename_tags(kb_id):
                                     kb_id)
    return get_json_result(data=True)

-"""
-Deprecated, todo delete
+
@manager.route('/<kb_id>/knowledge_graph', methods=['GET'])  # noqa: F821
@login_required
 async def knowledge_graph(kb_id):
@ -455,7 +459,7 @@ def delete_knowledge_graph(kb_id):
    settings.docStoreConn.delete({"knowledge_graph_kwd": ["graph", "subgraph", "entity", "relation"]}, search.index_name(kb.tenant_id), kb_id)

    return get_json_result(data=True)
-"""
+

@manager.route("/get_meta", methods=["GET"])  # noqa: F821
@login_required
@ -594,8 +598,6 @@ def pipeline_log_detail():
    return get_json_result(data=log.to_dict())


-"""
-Deprecated, todo delete
@manager.route("/run_graphrag", methods=["POST"])  # noqa: F821
@login_required
 async def run_graphrag():
@ -732,7 +734,7 @@ def trace_raptor():
        return get_error_data_result(message="RAPTOR Task Not Found or Error Occurred")

    return get_json_result(data=task.to_dict())
-"""
+

@manager.route("/run_mindmap", methods=["POST"])  # noqa: F821
@login_required
--- a/api/apps/restful_apis/dataset_api.py
+++ b/api/apps/restful_apis/dataset_api.py
@ -1,517 +0,0 @@
-#
-#  Copyright 2026 The InfiniFlow Authors. All Rights Reserved.
-#
-#  Licensed under the Apache License, Version 2.0 (the "License");
-#  you may not use this file except in compliance with the License.
-#  You may obtain a copy of the License at
-#
-#      http://www.apache.org/licenses/LICENSE-2.0
-#
-#  Unless required by applicable law or agreed to in writing, software
-#  distributed under the License is distributed on an "AS IS" BASIS,
-#  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-#  See the License for the specific language governing permissions and
-#  limitations under the License.
-#
-import logging
-
-from peewee import OperationalError
-from quart import request
-from common.constants import RetCode
-from api.apps import login_required, current_user
-from api.utils.api_utils import get_error_argument_result, get_error_data_result, get_result, add_tenant_id_to_kwargs
-from api.utils.validation_utils import (
-    CreateDatasetReq,
-    DeleteDatasetReq,
-    ListDatasetReq,
-    UpdateDatasetReq,
-    validate_and_parse_json_request,
-    validate_and_parse_request_args,
-)
-from api.apps.services import dataset_api_service
-
-
-@manager.route("/datasets", methods=["POST"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def create(tenant_id: str=None):
-    """
-    Create a new dataset.
-    ---
-    tags:
-      - Datasets
-    security:
-      - ApiKeyAuth: []
-    parameters:
-      - in: header
-        name: Authorization
-        type: string
-        required: true
-        description: Bearer token for authentication.
-      - in: body
-        name: body
-        description: Dataset creation parameters.
-        required: true
-        schema:
-          type: object
-          required:
-            - name
-          properties:
-            name:
-              type: string
-              description: Dataset name (required).
-            avatar:
-              type: string
-              description: Optional base64-encoded avatar image.
-            description:
-              type: string
-              description: Optional dataset description.
-            embedding_model:
-              type: string
-              description: Optional embedding model name; if omitted, the tenant's default embedding model is used.
-            permission:
-              type: string
-              enum: ['me', 'team']
-              description: Visibility of the dataset (private to me or shared with team).
-            chunk_method:
-              type: string
-              enum: ["naive", "book", "email", "laws", "manual", "one", "paper",
-                     "picture", "presentation", "qa", "table", "tag"]
-              description: Chunking method; if omitted, defaults to "naive".
-            parser_config:
-              type: object
-              description: Optional parser configuration; server-side defaults will be applied.
-    responses:
-      200:
-        description: Successful operation.
-        schema:
-          type: object
-          properties:
-            data:
-              type: object
-    """
-    req, err = await validate_and_parse_json_request(request, CreateDatasetReq)
-    if err is not None:
-        return get_error_argument_result(err)
-
-    try:
-        if not tenant_id:
-            tenant_id = current_user.id
-        success, result = await dataset_api_service.create_dataset(tenant_id, req)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets", methods=["DELETE"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def delete(tenant_id):
-    """
-    Delete datasets.
-    ---
-    tags:
-      - Datasets
-    security:
-      - ApiKeyAuth: []
-    parameters:
-      - in: header
-        name: Authorization
-        type: string
-        required: true
-        description: Bearer token for authentication.
-      - in: body
-        name: body
-        description: Dataset deletion parameters.
-        required: true
-        schema:
-          type: object
-          required:
-            - ids
-          properties:
-            ids:
-              type: array or null
-              items:
-                type: string
-              description: |
-                Specifies the datasets to delete:
-                - If `null`, all datasets will be deleted.
-                - If an array of IDs, only the specified datasets will be deleted.
-                - If an empty array, no datasets will be deleted.
-    responses:
-      200:
-        description: Successful operation.
-        schema:
-          type: object
-    """
-    req, err = await validate_and_parse_json_request(request, DeleteDatasetReq)
-    if err is not None:
-        return get_error_argument_result(err)
-
-    try:
-        success, result = await dataset_api_service.delete_datasets(tenant_id, req.get("ids"), req.get("delete_all", False))
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except OperationalError as e:
-        logging.exception(e)
-        return get_error_data_result(message="Database operation failed")
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>", methods=["PUT"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def update(tenant_id, dataset_id):
-    """
-    Update a dataset.
-    ---
-    tags:
-      - Datasets
-    security:
-      - ApiKeyAuth: []
-    parameters:
-      - in: path
-        name: dataset_id
-        type: string
-        required: true
-        description: ID of the dataset to update.
-      - in: header
-        name: Authorization
-        type: string
-        required: true
-        description: Bearer token for authentication.
-      - in: body
-        name: body
-        description: Dataset update parameters.
-        required: true
-        schema:
-          type: object
-          properties:
-            name:
-              type: string
-              description: New name of the dataset.
-            avatar:
-              type: string
-              description: Updated base64 encoding of the avatar.
-            description:
-              type: string
-              description: Updated description of the dataset.
-            embedding_model:
-              type: string
-              description: Updated embedding model Name.
-            permission:
-              type: string
-              enum: ['me', 'team']
-              description: Updated dataset permission.
-            chunk_method:
-              type: string
-              enum: ["naive", "book", "email", "laws", "manual", "one", "paper",
-                     "picture", "presentation", "qa", "table", "tag"
-                     ]
-              description: Updated chunking method.
-            pagerank:
-              type: integer
-              description: Updated page rank.
-            parser_config:
-              type: object
-              description: Updated parser configuration.
-    responses:
-      200:
-        description: Successful operation.
-        schema:
-          type: object
-    """
-    # Field name transformations during model dump:
-    # | Original       | Dump Output  |
-    # |----------------|-------------|
-    # | embedding_model| embd_id     |
-    # | chunk_method   | parser_id   |
-    extras = {"dataset_id": dataset_id}
-    req, err = await validate_and_parse_json_request(request, UpdateDatasetReq, extras=extras, exclude_unset=True)
-    if err is not None:
-        return get_error_argument_result(err)
-
-    try:
-        success, result = await dataset_api_service.update_dataset(tenant_id, dataset_id, req)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except OperationalError as e:
-        logging.exception(e)
-        return get_error_data_result(message="Database operation failed")
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets", methods=["GET"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-def list_datasets(tenant_id):
-    """
-    List datasets.
-    ---
-    tags:
-      - Datasets
-    security:
-      - ApiKeyAuth: []
-    parameters:
-      - in: query
-        name: id
-        type: string
-        required: false
-        description: Dataset ID to filter.
-      - in: query
-        name: name
-        type: string
-        required: false
-        description: Dataset name to filter.
-      - in: query
-        name: page
-        type: integer
-        required: false
-        default: 1
-        description: Page number.
-      - in: query
-        name: page_size
-        type: integer
-        required: false
-        default: 30
-        description: Number of items per page.
-      - in: query
-        name: orderby
-        type: string
-        required: false
-        default: "create_time"
-        description: Field to order by.
-      - in: query
-        name: desc
-        type: boolean
-        required: false
-        default: true
-        description: Order in descending.
-      - in: header
-        name: Authorization
-        type: string
-        required: true
-        description: Bearer token for authentication.
-    responses:
-      200:
-        description: Successful operation.
-        schema:
-          type: array
-          items:
-            type: object
-    """
-    args, err = validate_and_parse_request_args(request, ListDatasetReq)
-    if err is not None:
-        return get_error_argument_result(err)
-
-    try:
-        success, result = dataset_api_service.list_datasets(tenant_id, args)
-        if success:
-            return get_result(data=result.get("data"), total=result.get("total"))
-        else:
-            return get_error_data_result(message=result)
-    except OperationalError as e:
-        logging.exception(e)
-        return get_error_data_result(message="Database operation failed")
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route('/datasets/<dataset_id>/knowledge_graph', methods=['GET'])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def knowledge_graph(tenant_id, dataset_id):
-    try:
-        success, result = await dataset_api_service.get_knowledge_graph(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_result(
-                data=False,
-                message=result,
-                code=RetCode.AUTHENTICATION_ERROR
-            )
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route('/datasets/<dataset_id>/knowledge_graph', methods=['DELETE'])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-def delete_knowledge_graph(tenant_id, dataset_id):
-    try:
-        success, result = dataset_api_service.delete_knowledge_graph(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_result(
-                data=False,
-                message=result,
-                code=RetCode.AUTHENTICATION_ERROR
-            )
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>/run_graphrag", methods=["POST"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def run_graphrag(tenant_id, dataset_id):
-    try:
-        success, result = dataset_api_service.run_graphrag(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>/trace_graphrag", methods=["GET"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-def trace_graphrag(tenant_id, dataset_id):
-    try:
-        success, result = dataset_api_service.trace_graphrag(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>/run_raptor", methods=["POST"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def run_raptor(tenant_id, dataset_id):
-    try:
-        success, result = dataset_api_service.run_raptor(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>/trace_raptor", methods=["GET"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-def trace_raptor(tenant_id, dataset_id):
-    try:
-        success, result = dataset_api_service.trace_raptor(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>/auto_metadata", methods=["GET"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-def get_auto_metadata(tenant_id, dataset_id):
-    """
-    Get auto-metadata configuration for a dataset.
-    ---
-    tags:
-      - Datasets
-    security:
-      - ApiKeyAuth: []
-    parameters:
-      - in: path
-        name: dataset_id
-        type: string
-        required: true
-        description: ID of the dataset.
-      - in: header
-        name: Authorization
-        type: string
-        required: true
-        description: Bearer token for authentication.
-    responses:
-      200:
-        description: Successful operation.
-        schema:
-          type: object
-    """
-    try:
-        success, result = dataset_api_service.get_auto_metadata(dataset_id, tenant_id)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
-
-
-@manager.route("/datasets/<dataset_id>/auto_metadata", methods=["PUT"])  # noqa: F821
-@login_required
-@add_tenant_id_to_kwargs
-async def update_auto_metadata(tenant_id, dataset_id):
-    """
-    Update auto-metadata configuration for a dataset.
-    ---
-    tags:
-      - Datasets
-    security:
-      - ApiKeyAuth: []
-    parameters:
-      - in: path
-        name: dataset_id
-        type: string
-        required: true
-        description: ID of the dataset.
-      - in: header
-        name: Authorization
-        type: string
-        required: true
-        description: Bearer token for authentication.
-      - in: body
-        name: body
-        description: Auto-metadata configuration.
-        required: true
-        schema:
-          type: object
-    responses:
-      200:
-        description: Successful operation.
-        schema:
-          type: object
-    """
-    from api.utils.validation_utils import AutoMetadataConfig
-    cfg, err = await validate_and_parse_json_request(request, AutoMetadataConfig)
-    if err is not None:
-        return get_error_argument_result(err)
-
-    try:
-        success, result = await dataset_api_service.update_auto_metadata(dataset_id, tenant_id, cfg)
-        if success:
-            return get_result(data=result)
-        else:
-            return get_error_data_result(message=result)
-    except Exception as e:
-        logging.exception(e)
-        return get_error_data_result(message="Internal server error")
--- a/api/apps/restful_apis/memory_api.py
+++ b/api/apps/restful_apis/memory_api.py
@ -1,5 +1,5 @@
 #
-#  Copyright 2026 The InfiniFlow Authors. All Rights Reserved.
+#  Copyright 2025 The InfiniFlow Authors. All Rights Reserved.
 #
 #  Licensed under the Apache License, Version 2.0 (the "License");
 #  you may not use this file except in compliance with the License.
--- a/api/apps/sdk/dataset.py
+++ b/api/apps/sdk/dataset.py
@ -0,0 +1,798 @@
+#
+#  Copyright 2024 The InfiniFlow Authors. All Rights Reserved.
+#
+#  Licensed under the Apache License, Version 2.0 (the "License");
+#  you may not use this file except in compliance with the License.
+#  You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+#  Unless required by applicable law or agreed to in writing, software
+#  distributed under the License is distributed on an "AS IS" BASIS,
+#  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+#  See the License for the specific language governing permissions and
+#  limitations under the License.
+#
+
+
+import logging
+import os
+import json
+from quart import request
+from peewee import OperationalError
+from api.db.db_models import File
+from api.db.services.document_service import DocumentService, queue_raptor_o_graphrag_tasks
+from api.db.services.file2document_service import File2DocumentService
+from api.db.services.file_service import FileService
+from api.db.services.knowledgebase_service import KnowledgebaseService
+from api.db.services.task_service import GRAPH_RAPTOR_FAKE_DOC_ID, TaskService
+from api.db.services.user_service import TenantService
+from common.constants import RetCode, FileSource, StatusEnum
+from api.utils.api_utils import (
+    deep_merge,
+    get_error_argument_result,
+    get_error_data_result,
+    get_error_permission_result,
+    get_parser_config,
+    get_result,
+    remap_dictionary_keys,
+    token_required,
+    verify_embedding_availability,
+)
+from api.utils.validation_utils import (
+    AutoMetadataConfig,
+    CreateDatasetReq,
+    DeleteDatasetReq,
+    ListDatasetReq,
+    UpdateDatasetReq,
+    validate_and_parse_json_request,
+    validate_and_parse_request_args,
+)
+from rag.nlp import search
+from common.constants import PAGERANK_FLD
+from common import settings
+
+
+@manager.route("/datasets", methods=["POST"])  # noqa: F821
+@token_required
+async def create(tenant_id):
+    """
+    Create a new dataset.
+    ---
+    tags:
+      - Datasets
+    security:
+      - ApiKeyAuth: []
+    parameters:
+      - in: header
+        name: Authorization
+        type: string
+        required: true
+        description: Bearer token for authentication.
+      - in: body
+        name: body
+        description: Dataset creation parameters.
+        required: true
+        schema:
+          type: object
+          required:
+            - name
+          properties:
+            name:
+              type: string
+              description: Dataset name (required).
+            avatar:
+              type: string
+              description: Optional base64-encoded avatar image.
+            description:
+              type: string
+              description: Optional dataset description.
+            embedding_model:
+              type: string
+              description: Optional embedding model name; if omitted, the tenant's default embedding model is used.
+            permission:
+              type: string
+              enum: ['me', 'team']
+              description: Visibility of the dataset (private to me or shared with team).
+            chunk_method:
+              type: string
+              enum: ["naive", "book", "email", "laws", "manual", "one", "paper",
+                     "picture", "presentation", "qa", "table", "tag"]
+              description: Chunking method; if omitted, defaults to "naive".
+            parser_config:
+              type: object
+              description: Optional parser configuration; server-side defaults will be applied.
+    responses:
+      200:
+        description: Successful operation.
+        schema:
+          type: object
+          properties:
+            data:
+              type: object
+    """
+    # Field name transformations during model dump:
+    # | Original       | Dump Output  |
+    # |----------------|-------------|
+    # | embedding_model| embd_id     |
+    # | chunk_method   | parser_id   |
+
+    req, err = await validate_and_parse_json_request(request, CreateDatasetReq)
+    if err is not None:
+        return get_error_argument_result(err)
+    # Map auto_metadata_config (if provided) into parser_config structure
+    auto_meta = req.pop("auto_metadata_config", None)
+    if auto_meta:
+        parser_cfg = req.get("parser_config") or {}
+        fields = []
+        for f in auto_meta.get("fields", []):
+            fields.append(
+                {
+                    "name": f.get("name", ""),
+                    "type": f.get("type", ""),
+                    "description": f.get("description"),
+                    "examples": f.get("examples"),
+                    "restrict_values": f.get("restrict_values", False),
+                }
+            )
+        parser_cfg["metadata"] = fields
+        parser_cfg["enable_metadata"] = auto_meta.get("enabled", True)
+        req["parser_config"] = parser_cfg
+    e, req = KnowledgebaseService.create_with_name(name=req.pop("name", None), tenant_id=tenant_id, parser_id=req.pop("parser_id", None), **req)
+
+    if not e:
+        return req
+
+    # Insert embedding model(embd id)
+    ok, t = TenantService.get_by_id(tenant_id)
+    if not ok:
+        return get_error_permission_result(message="Tenant not found")
+    if not req.get("embd_id"):
+        req["embd_id"] = t.embd_id
+    else:
+        ok, err = verify_embedding_availability(req["embd_id"], tenant_id)
+        if not ok:
+            return err
+
+    try:
+        if not KnowledgebaseService.save(**req):
+            return get_error_data_result()
+        ok, k = KnowledgebaseService.get_by_id(req["id"])
+        if not ok:
+            return get_error_data_result(message="Dataset created failed")
+        response_data = remap_dictionary_keys(k.to_dict())
+        return get_result(data=response_data)
+    except Exception as e:
+        logging.exception(e)
+        return get_error_data_result(message="Database operation failed")
+
+
+@manager.route("/datasets", methods=["DELETE"])  # noqa: F821
+@token_required
+async def delete(tenant_id):
+    """
+    Delete datasets.
+    ---
+    tags:
+      - Datasets
+    security:
+      - ApiKeyAuth: []
+    parameters:
+      - in: header
+        name: Authorization
+        type: string
+        required: true
+        description: Bearer token for authentication.
+      - in: body
+        name: body
+        description: Dataset deletion parameters.
+        required: true
+        schema:
+          type: object
+          required:
+            - ids
+          properties:
+            ids:
+              type: array or null
+              items:
+                type: string
+              description: |
+                List of dataset IDs to delete.
+                If `null` or an empty array is provided, no datasets will be deleted
+                unless `delete_all` is set to `true`.
+            delete_all:
+              type: boolean
+              description: |
+                If `true` and `ids` is null or empty, delete all datasets owned by the current user.
+                Defaults to `false`.
+    responses:
+      200:
+        description: Successful operation.
+        schema:
+          type: object
+    """
+    req, err = await validate_and_parse_json_request(request, DeleteDatasetReq)
+    if err is not None:
+        return get_error_argument_result(err)
+
+    try:
+        kb_id_instance_pairs = []
+        if req["ids"] is None or len(req["ids"]) == 0:
+            if req.get("delete_all"):
+                req["ids"] = [kb.id for kb in KnowledgebaseService.query(tenant_id=tenant_id)]
+                if not req["ids"]:
+                    return get_result()
+            else:
+                return get_result()
+
+        error_kb_ids = []
+        for kb_id in req["ids"]:
+            kb = KnowledgebaseService.get_or_none(id=kb_id, tenant_id=tenant_id)
+            if kb is None:
+                error_kb_ids.append(kb_id)
+                continue
+            kb_id_instance_pairs.append((kb_id, kb))
+        if len(error_kb_ids) > 0:
+            return get_error_permission_result(message=f"""User '{tenant_id}' lacks permission for datasets: '{", ".join(error_kb_ids)}'""")
+
+        errors = []
+        success_count = 0
+        for kb_id, kb in kb_id_instance_pairs:
+            for doc in DocumentService.query(kb_id=kb_id):
+                if not DocumentService.remove_document(doc, tenant_id):
+                    errors.append(f"Remove document '{doc.id}' error for dataset '{kb_id}'")
+                    continue
+                f2d = File2DocumentService.get_by_document_id(doc.id)
+                FileService.filter_delete(
+                    [
+                        File.source_type == FileSource.KNOWLEDGEBASE,
+                        File.id == f2d[0].file_id,
+                    ]
+                )
+                File2DocumentService.delete_by_document_id(doc.id)
+            FileService.filter_delete([File.source_type == FileSource.KNOWLEDGEBASE, File.type == "folder", File.name == kb.name])
+
+            # Drop index for this dataset
+            try:
+                from rag.nlp import search
+
+                idxnm = search.index_name(kb.tenant_id)
+                settings.docStoreConn.delete_idx(idxnm, kb_id)
+            except Exception as e:
+                logging.warning(f"Failed to drop index for dataset {kb_id}: {e}")
+
+            if not KnowledgebaseService.delete_by_id(kb_id):
+                errors.append(f"Delete dataset error for {kb_id}")
+                continue
+            success_count += 1
+
+        if not errors:
+            return get_result()
+
+        error_message = f"Successfully deleted {success_count} datasets, {len(errors)} failed. Details: {'; '.join(errors)[:128]}..."
+        if success_count == 0:
+            return get_error_data_result(message=error_message)
+
+        return get_result(data={"success_count": success_count, "errors": errors[:5]}, message=error_message)
+    except OperationalError as e:
+        logging.exception(e)
+        return get_error_data_result(message="Database operation failed")
+
+
+@manager.route("/datasets/<dataset_id>", methods=["PUT"])  # noqa: F821
+@token_required
+async def update(tenant_id, dataset_id):
+    """
+    Update a dataset.
+    ---
+    tags:
+      - Datasets
+    security:
+      - ApiKeyAuth: []
+    parameters:
+      - in: path
+        name: dataset_id
+        type: string
+        required: true
+        description: ID of the dataset to update.
+      - in: header
+        name: Authorization
+        type: string
+        required: true
+        description: Bearer token for authentication.
+      - in: body
+        name: body
+        description: Dataset update parameters.
+        required: true
+        schema:
+          type: object
+          properties:
+            name:
+              type: string
+              description: New name of the dataset.
+            avatar:
+              type: string
+              description: Updated base64 encoding of the avatar.
+            description:
+              type: string
+              description: Updated description of the dataset.
+            embedding_model:
+              type: string
+              description: Updated embedding model Name.
+            permission:
+              type: string
+              enum: ['me', 'team']
+              description: Updated dataset permission.
+            chunk_method:
+              type: string
+              enum: ["naive", "book", "email", "laws", "manual", "one", "paper",
+                     "picture", "presentation", "qa", "table", "tag"
+                     ]
+              description: Updated chunking method.
+            pagerank:
+              type: integer
+              description: Updated page rank.
+            parser_config:
+              type: object
+              description: Updated parser configuration.
+    responses:
+      200:
+        description: Successful operation.
+        schema:
+          type: object
+    """
+    # Field name transformations during model dump:
+    # | Original       | Dump Output  |
+    # |----------------|-------------|
+    # | embedding_model| embd_id     |
+    # | chunk_method   | parser_id   |
+    extras = {"dataset_id": dataset_id}
+    req, err = await validate_and_parse_json_request(request, UpdateDatasetReq, extras=extras, exclude_unset=True)
+    if err is not None:
+        return get_error_argument_result(err)
+
+    if not req:
+        return get_error_argument_result(message="No properties were modified")
+
+    try:
+        kb = KnowledgebaseService.get_or_none(id=dataset_id, tenant_id=tenant_id)
+        if kb is None:
+            return get_error_permission_result(message=f"User '{tenant_id}' lacks permission for dataset '{dataset_id}'")
+
+        # Map auto_metadata_config into parser_config if present
+        auto_meta = req.pop("auto_metadata_config", None)
+        if auto_meta:
+            parser_cfg = req.get("parser_config") or {}
+            fields = []
+            for f in auto_meta.get("fields", []):
+                fields.append(
+                    {
+                        "name": f.get("name", ""),
+                        "type": f.get("type", ""),
+                        "description": f.get("description"),
+                        "examples": f.get("examples"),
+                        "restrict_values": f.get("restrict_values", False),
+                    }
+                )
+            parser_cfg["metadata"] = fields
+            parser_cfg["enable_metadata"] = auto_meta.get("enabled", True)
+            req["parser_config"] = parser_cfg
+
+        if req.get("parser_config"):
+            req["parser_config"] = deep_merge(kb.parser_config, req["parser_config"])
+
+        if (chunk_method := req.get("parser_id")) and chunk_method != kb.parser_id:
+            if not req.get("parser_config"):
+                req["parser_config"] = get_parser_config(chunk_method, None)
+        elif "parser_config" in req and not req["parser_config"]:
+            del req["parser_config"]
+
+        if "name" in req and req["name"].lower() != kb.name.lower():
+            exists = KnowledgebaseService.get_or_none(name=req["name"], tenant_id=tenant_id, status=StatusEnum.VALID.value)
+            if exists:
+                return get_error_data_result(message=f"Dataset name '{req['name']}' already exists")
+
+        if "embd_id" in req:
+            if not req["embd_id"]:
+                req["embd_id"] = kb.embd_id
+            if kb.chunk_num != 0 and req["embd_id"] != kb.embd_id:
+                return get_error_data_result(message=f"When chunk_num ({kb.chunk_num}) > 0, embedding_model must remain {kb.embd_id}")
+            ok, err = verify_embedding_availability(req["embd_id"], tenant_id)
+            if not ok:
+                return err
+
+        if "pagerank" in req and req["pagerank"] != kb.pagerank:
+            if os.environ.get("DOC_ENGINE", "elasticsearch") == "infinity":
+                return get_error_argument_result(message="'pagerank' can only be set when doc_engine is elasticsearch")
+
+            if req["pagerank"] > 0:
+                settings.docStoreConn.update({"kb_id": kb.id}, {PAGERANK_FLD: req["pagerank"]}, search.index_name(kb.tenant_id), kb.id)
+            else:
+                # Elasticsearch requires PAGERANK_FLD be non-zero!
+                settings.docStoreConn.update({"exists": PAGERANK_FLD}, {"remove": PAGERANK_FLD}, search.index_name(kb.tenant_id), kb.id)
+
+        if not KnowledgebaseService.update_by_id(kb.id, req):
+            return get_error_data_result(message="Update dataset error.(Database error)")
+
+        ok, k = KnowledgebaseService.get_by_id(kb.id)
+        if not ok:
+            return get_error_data_result(message="Dataset created failed")
+
+        response_data = remap_dictionary_keys(k.to_dict())
+        return get_result(data=response_data)
+    except OperationalError as e:
+        logging.exception(e)
+        return get_error_data_result(message="Database operation failed")
+
+
+@manager.route("/datasets", methods=["GET"])  # noqa: F821
+@token_required
+def list_datasets(tenant_id):
+    """
+    List datasets.
+    ---
+    tags:
+      - Datasets
+    security:
+      - ApiKeyAuth: []
+    parameters:
+      - in: query
+        name: id
+        type: string
+        required: false
+        description: Dataset ID to filter.
+      - in: query
+        name: name
+        type: string
+        required: false
+        description: Dataset name to filter.
+      - in: query
+        name: page
+        type: integer
+        required: false
+        default: 1
+        description: Page number.
+      - in: query
+        name: page_size
+        type: integer
+        required: false
+        default: 30
+        description: Number of items per page.
+      - in: query
+        name: orderby
+        type: string
+        required: false
+        default: "create_time"
+        description: Field to order by.
+      - in: query
+        name: desc
+        type: boolean
+        required: false
+        default: true
+        description: Order in descending.
+      - in: query
+        name: include_parsing_status
+        type: boolean
+        required: false
+        default: false
+        description: |
+          Whether to include document parsing status counts in the response.
+          When true, each dataset object will include: unstart_count, running_count,
+          cancel_count, done_count, and fail_count.
+      - in: header
+        name: Authorization
+        type: string
+        required: true
+        description: Bearer token for authentication.
+    responses:
+      200:
+        description: Successful operation.
+        schema:
+          type: array
+          items:
+            type: object
+    """
+    args, err = validate_and_parse_request_args(request, ListDatasetReq)
+    if err is not None:
+        return get_error_argument_result(err)
+
+    include_parsing_status = args.get("include_parsing_status", False)
+
+    try:
+        kb_id = request.args.get("id")
+        name = args.get("name")
+        # check whether user has permission for the dataset with specified id
+        if kb_id:
+            if not KnowledgebaseService.get_kb_by_id(kb_id, tenant_id):
+                return get_error_permission_result(message=f"User '{tenant_id}' lacks permission for dataset '{kb_id}'")
+        # check whether user has permission for the dataset with specified name
+        if name:
+            if not KnowledgebaseService.get_kb_by_name(name, tenant_id):
+                return get_error_permission_result(message=f"User '{tenant_id}' lacks permission for dataset '{name}'")
+
+        tenants = TenantService.get_joined_tenants_by_user_id(tenant_id)
+        kbs, total = KnowledgebaseService.get_list(
+            [m["tenant_id"] for m in tenants],
+            tenant_id,
+            args["page"],
+            args["page_size"],
+            args["orderby"],
+            args["desc"],
+            kb_id,
+            name,
+        )
+
+        parsing_status_map = {}
+        if include_parsing_status and kbs:
+            kb_ids = [kb["id"] for kb in kbs]
+            parsing_status_map = DocumentService.get_parsing_status_by_kb_ids(kb_ids)
+
+        response_data_list = []
+        for kb in kbs:
+            data = remap_dictionary_keys(kb)
+            if include_parsing_status:
+                data.update(parsing_status_map.get(kb["id"], {}))
+            response_data_list.append(data)
+        return get_result(data=response_data_list, total=total)
+    except OperationalError as e:
+        logging.exception(e)
+        return get_error_data_result(message="Database operation failed")
+
+
+@manager.route("/datasets/<dataset_id>/auto_metadata", methods=["GET"])  # noqa: F821
+@token_required
+def get_auto_metadata(tenant_id, dataset_id):
+    """
+    Get auto-metadata configuration for a dataset.
+    """
+    try:
+        kb = KnowledgebaseService.get_or_none(id=dataset_id, tenant_id=tenant_id)
+        if kb is None:
+            return get_error_permission_result(message=f"User '{tenant_id}' lacks permission for dataset '{dataset_id}'")
+
+        parser_cfg = kb.parser_config or {}
+        metadata = parser_cfg.get("metadata") or []
+        enabled = parser_cfg.get("enable_metadata", bool(metadata))
+        # Normalize to AutoMetadataConfig-like JSON
+        fields = []
+        for f in metadata:
+            if not isinstance(f, dict):
+                continue
+            fields.append(
+                {
+                    "name": f.get("name", ""),
+                    "type": f.get("type", ""),
+                    "description": f.get("description"),
+                    "examples": f.get("examples"),
+                    "restrict_values": f.get("restrict_values", False),
+                }
+            )
+        return get_result(data={"enabled": enabled, "fields": fields})
+    except OperationalError as e:
+        logging.exception(e)
+        return get_error_data_result(message="Database operation failed")
+
+
+@manager.route("/datasets/<dataset_id>/auto_metadata", methods=["PUT"])  # noqa: F821
+@token_required
+async def update_auto_metadata(tenant_id, dataset_id):
+    """
+    Update auto-metadata configuration for a dataset.
+    """
+    cfg, err = await validate_and_parse_json_request(request, AutoMetadataConfig)
+    if err is not None:
+        return get_error_argument_result(err)
+
+    try:
+        kb = KnowledgebaseService.get_or_none(id=dataset_id, tenant_id=tenant_id)
+        if kb is None:
+            return get_error_permission_result(message=f"User '{tenant_id}' lacks permission for dataset '{dataset_id}'")
+
+        parser_cfg = kb.parser_config or {}
+        fields = []
+        for f in cfg.get("fields", []):
+            fields.append(
+                {
+                    "name": f.get("name", ""),
+                    "type": f.get("type", ""),
+                    "description": f.get("description"),
+                    "examples": f.get("examples"),
+                    "restrict_values": f.get("restrict_values", False),
+                }
+            )
+        parser_cfg["metadata"] = fields
+        parser_cfg["enable_metadata"] = cfg.get("enabled", True)
+
+        if not KnowledgebaseService.update_by_id(kb.id, {"parser_config": parser_cfg}):
+            return get_error_data_result(message="Update auto-metadata error.(Database error)")
+
+        return get_result(data={"enabled": parser_cfg["enable_metadata"], "fields": fields})
+    except OperationalError as e:
+        logging.exception(e)
+        return get_error_data_result(message="Database operation failed")
+
+
+@manager.route("/datasets/<dataset_id>/knowledge_graph", methods=["GET"])  # noqa: F821
+@token_required
+async def knowledge_graph(tenant_id, dataset_id):
+    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
+        return get_result(data=False, message="No authorization.", code=RetCode.AUTHENTICATION_ERROR)
+    _, kb = KnowledgebaseService.get_by_id(dataset_id)
+    req = {"kb_id": [dataset_id], "knowledge_graph_kwd": ["graph"]}
+
+    obj = {"graph": {}, "mind_map": {}}
+    if not settings.docStoreConn.index_exist(search.index_name(kb.tenant_id), dataset_id):
+        return get_result(data=obj)
+    sres = await settings.retriever.search(req, search.index_name(kb.tenant_id), [dataset_id])
+    if not len(sres.ids):
+        return get_result(data=obj)
+
+    for id in sres.ids[:1]:
+        ty = sres.field[id]["knowledge_graph_kwd"]
+        try:
+            content_json = json.loads(sres.field[id]["content_with_weight"])
+        except Exception:
+            continue
+
+        obj[ty] = content_json
+
+    if "nodes" in obj["graph"]:
+        obj["graph"]["nodes"] = sorted(obj["graph"]["nodes"], key=lambda x: x.get("pagerank", 0), reverse=True)[:256]
+        if "edges" in obj["graph"]:
+            node_id_set = {o["id"] for o in obj["graph"]["nodes"]}
+            filtered_edges = [o for o in obj["graph"]["edges"] if o["source"] != o["target"] and o["source"] in node_id_set and o["target"] in node_id_set]
+            obj["graph"]["edges"] = sorted(filtered_edges, key=lambda x: x.get("weight", 0), reverse=True)[:128]
+    return get_result(data=obj)
+
+
+@manager.route("/datasets/<dataset_id>/knowledge_graph", methods=["DELETE"])  # noqa: F821
+@token_required
+def delete_knowledge_graph(tenant_id, dataset_id):
+    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
+        return get_result(data=False, message="No authorization.", code=RetCode.AUTHENTICATION_ERROR)
+    _, kb = KnowledgebaseService.get_by_id(dataset_id)
+    settings.docStoreConn.delete({"knowledge_graph_kwd": ["graph", "subgraph", "entity", "relation"]}, search.index_name(kb.tenant_id), dataset_id)
+
+    return get_result(data=True)
+
+
+@manager.route("/datasets/<dataset_id>/run_graphrag", methods=["POST"])  # noqa: F821
+@token_required
+def run_graphrag(tenant_id, dataset_id):
+    if not dataset_id:
+        return get_error_data_result(message='Lack of "Dataset ID"')
+    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
+        return get_result(data=False, message="No authorization.", code=RetCode.AUTHENTICATION_ERROR)
+
+    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
+    if not ok:
+        return get_error_data_result(message="Invalid Dataset ID")
+
+    task_id = kb.graphrag_task_id
+    if task_id:
+        ok, task = TaskService.get_by_id(task_id)
+        if not ok:
+            logging.warning(f"A valid GraphRAG task id is expected for Dataset {dataset_id}")
+
+        if task and task.progress not in [-1, 1]:
+            return get_error_data_result(message=f"Task {task_id} in progress with status {task.progress}. A Graph Task is already running.")
+
+    documents, _ = DocumentService.get_by_kb_id(
+        kb_id=dataset_id,
+        page_number=0,
+        items_per_page=0,
+        orderby="create_time",
+        desc=False,
+        keywords="",
+        run_status=[],
+        types=[],
+        suffix=[],
+    )
+    if not documents:
+        return get_error_data_result(message=f"No documents in Dataset {dataset_id}")
+
+    sample_document = documents[0]
+    document_ids = [document["id"] for document in documents]
+
+    task_id = queue_raptor_o_graphrag_tasks(sample_doc_id=sample_document, ty="graphrag", priority=0, fake_doc_id=GRAPH_RAPTOR_FAKE_DOC_ID, doc_ids=list(document_ids))
+
+    if not KnowledgebaseService.update_by_id(kb.id, {"graphrag_task_id": task_id}):
+        logging.warning(f"Cannot save graphrag_task_id for Dataset {dataset_id}")
+
+    return get_result(data={"graphrag_task_id": task_id})
+
+
+@manager.route("/datasets/<dataset_id>/trace_graphrag", methods=["GET"])  # noqa: F821
+@token_required
+def trace_graphrag(tenant_id, dataset_id):
+    if not dataset_id:
+        return get_error_data_result(message='Lack of "Dataset ID"')
+    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
+        return get_result(data=False, message="No authorization.", code=RetCode.AUTHENTICATION_ERROR)
+
+    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
+    if not ok:
+        return get_error_data_result(message="Invalid Dataset ID")
+
+    task_id = kb.graphrag_task_id
+    if not task_id:
+        return get_result(data={})
+
+    ok, task = TaskService.get_by_id(task_id)
+    if not ok:
+        return get_result(data={})
+
+    return get_result(data=task.to_dict())
+
+
+@manager.route("/datasets/<dataset_id>/run_raptor", methods=["POST"])  # noqa: F821
+@token_required
+def run_raptor(tenant_id, dataset_id):
+    if not dataset_id:
+        return get_error_data_result(message='Lack of "Dataset ID"')
+    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
+        return get_result(data=False, message="No authorization.", code=RetCode.AUTHENTICATION_ERROR)
+
+    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
+    if not ok:
+        return get_error_data_result(message="Invalid Dataset ID")
+
+    task_id = kb.raptor_task_id
+    if task_id:
+        ok, task = TaskService.get_by_id(task_id)
+        if not ok:
+            logging.warning(f"A valid RAPTOR task id is expected for Dataset {dataset_id}")
+
+        if task and task.progress not in [-1, 1]:
+            return get_error_data_result(message=f"Task {task_id} in progress with status {task.progress}. A RAPTOR Task is already running.")
+
+    documents, _ = DocumentService.get_by_kb_id(
+        kb_id=dataset_id,
+        page_number=0,
+        items_per_page=0,
+        orderby="create_time",
+        desc=False,
+        keywords="",
+        run_status=[],
+        types=[],
+        suffix=[],
+    )
+    if not documents:
+        return get_error_data_result(message=f"No documents in Dataset {dataset_id}")
+
+    sample_document = documents[0]
+    document_ids = [document["id"] for document in documents]
+
+    task_id = queue_raptor_o_graphrag_tasks(sample_doc_id=sample_document, ty="raptor", priority=0, fake_doc_id=GRAPH_RAPTOR_FAKE_DOC_ID, doc_ids=list(document_ids))
+
+    if not KnowledgebaseService.update_by_id(kb.id, {"raptor_task_id": task_id}):
+        logging.warning(f"Cannot save raptor_task_id for Dataset {dataset_id}")
+
+    return get_result(data={"raptor_task_id": task_id})
+
+
+@manager.route("/datasets/<dataset_id>/trace_raptor", methods=["GET"])  # noqa: F821
+@token_required
+def trace_raptor(tenant_id, dataset_id):
+    if not dataset_id:
+        return get_error_data_result(message='Lack of "Dataset ID"')
+
+    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
+        return get_result(
+            data=False,
+            message='No authorization.',
+            code=RetCode.AUTHENTICATION_ERROR
+        )
+    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
+    if not ok:
+        return get_error_data_result(message="Invalid Dataset ID")
+
+    task_id = kb.raptor_task_id
+    if not task_id:
+        return get_result(data={})
+
+    ok, task = TaskService.get_by_id(task_id)
+    if not ok:
+        return get_error_data_result(message="RAPTOR Task Not Found or Error Occurred")
+
+    return get_result(data=task.to_dict())
--- a/api/apps/services/dataset_api_service.py
+++ b/api/apps/services/dataset_api_service.py
@ -1,613 +0,0 @@
-#
-#  Copyright 2026 The InfiniFlow Authors. All Rights Reserved.
-#
-#  Licensed under the Apache License, Version 2.0 (the "License");
-#  you may not use this file except in compliance with the License.
-#  You may obtain a copy of the License at
-#
-#      http://www.apache.org/licenses/LICENSE-2.0
-#
-#  Unless required by applicable law or agreed to in writing, software
-#  distributed under the License is distributed on an "AS IS" BASIS,
-#  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-#  See the License for the specific language governing permissions and
-#  limitations under the License.
-#
-import logging
-import json
-import os
-from common.constants import PAGERANK_FLD
-from common import settings
-from api.db.db_models import File
-from api.db.services.document_service import DocumentService, queue_raptor_o_graphrag_tasks
-from api.db.services.file2document_service import File2DocumentService
-from api.db.services.file_service import FileService
-from api.db.services.knowledgebase_service import KnowledgebaseService
-from api.db.services.connector_service import Connector2KbService
-from api.db.services.task_service import GRAPH_RAPTOR_FAKE_DOC_ID, TaskService
-from api.db.services.user_service import TenantService, UserService
-from common.constants import FileSource, StatusEnum
-from api.utils.api_utils import deep_merge, get_parser_config, remap_dictionary_keys, verify_embedding_availability
-
-
-async def create_dataset(tenant_id: str, req: dict):
-    """
-    Create a new dataset.
-
-    :param tenant_id: tenant ID
-    :param req: dataset creation request
-    :return: (success, result) or (success, error_message)
-    """
-    # Extract ext field for additional parameters
-    ext_fields = req.pop("ext", {})
-
-    # Map auto_metadata_config (if provided) into parser_config structure
-    auto_meta = req.pop("auto_metadata_config", {})
-    if auto_meta:
-        parser_cfg = req.get("parser_config") or {}
-        fields = []
-        for f in auto_meta.get("fields", []):
-            fields.append(
-                {
-                    "name": f.get("name", ""),
-                    "type": f.get("type", ""),
-                    "description": f.get("description"),
-                    "examples": f.get("examples"),
-                    "restrict_values": f.get("restrict_values", False),
-                }
-            )
-        parser_cfg["metadata"] = fields
-        parser_cfg["enable_metadata"] = auto_meta.get("enabled", True)
-        req["parser_config"] = parser_cfg
-    req.update(ext_fields)
-
-    e, create_dict = KnowledgebaseService.create_with_name(
-        name=req.pop("name", None),
-        tenant_id=tenant_id,
-        parser_id=req.pop("parser_id", None),
-        **req
-    )
-
-    if not e:
-        return False, create_dict
-
-    # Insert embedding model(embd id)
-    ok, t = TenantService.get_by_id(tenant_id)
-    if not ok:
-        return False, "Tenant not found"
-    if not create_dict.get("embd_id"):
-        create_dict["embd_id"] = t.embd_id
-    else:
-        ok, err = verify_embedding_availability(create_dict["embd_id"], tenant_id)
-        if not ok:
-            return False, err
-
-    if not KnowledgebaseService.save(**create_dict):
-        return False, "Failed to save dataset"
-    ok, k = KnowledgebaseService.get_by_id(create_dict["id"])
-    if not ok:
-        return False, "Dataset created failed"
-    response_data = remap_dictionary_keys(k.to_dict())
-    return True, response_data
-
-
-async def delete_datasets(tenant_id: str, ids: list = None, delete_all: bool = False):
-    """
-    Delete datasets.
-
-    :param tenant_id: tenant ID
-    :param ids: list of dataset IDs
-    :param delete_all: whether to delete all datasets of the tenant (if ids is not provided)
-    :return: (success, result) or (success, error_message)
-    """
-    kb_id_instance_pairs = []
-    if not ids:
-        if not delete_all:
-            return True, {"success_count": 0}
-        else:
-            ids = [kb.id for kb in KnowledgebaseService.query(tenant_id=tenant_id)]
-
-    error_kb_ids = []
-    for kb_id in ids:
-        kb = KnowledgebaseService.get_or_none(id=kb_id, tenant_id=tenant_id)
-        if kb is None:
-            error_kb_ids.append(kb_id)
-            continue
-        kb_id_instance_pairs.append((kb_id, kb))
-    if len(error_kb_ids) > 0:
-        return False, f"""User '{tenant_id}' lacks permission for datasets: '{", ".join(error_kb_ids)}'"""
-
-    errors = []
-    success_count = 0
-    for kb_id, kb in kb_id_instance_pairs:
-        for doc in DocumentService.query(kb_id=kb_id):
-            if not DocumentService.remove_document(doc, tenant_id):
-                errors.append(f"Remove document '{doc.id}' error for dataset '{kb_id}'")
-                continue
-            f2d = File2DocumentService.get_by_document_id(doc.id)
-            FileService.filter_delete(
-                [
-                    File.source_type == FileSource.KNOWLEDGEBASE,
-                    File.id == f2d[0].file_id,
-                ]
-            )
-            File2DocumentService.delete_by_document_id(doc.id)
-        FileService.filter_delete(
-            [File.source_type == FileSource.KNOWLEDGEBASE, File.type == "folder", File.name == kb.name])
-
-        # Drop index for this dataset
-        try:
-            from rag.nlp import search
-            idxnm = search.index_name(kb.tenant_id)
-            settings.docStoreConn.delete_idx(idxnm, kb_id)
-        except Exception as e:
-            errors.append(f"Failed to drop index for dataset {kb_id}: {e}")
-
-        if not KnowledgebaseService.delete_by_id(kb_id):
-            errors.append(f"Delete dataset error for {kb_id}")
-            continue
-        success_count += 1
-
-    if not errors:
-        return True, {"success_count": success_count}
-
-    error_message = f"Successfully deleted {success_count} datasets, {len(errors)} failed. Details: {'; '.join(errors)[:128]}..."
-    if success_count == 0:
-        return False, error_message
-
-    return True, {"success_count": success_count, "errors": errors[:5]}
-
-
-async def update_dataset(tenant_id: str, dataset_id: str, req: dict):
-    """
-    Update a dataset.
-
-    :param tenant_id: tenant ID
-    :param dataset_id: dataset ID
-    :param req: dataset update request
-    :return: (success, result) or (success, error_message)
-    """
-    if not req:
-        return False, "No properties were modified"
-
-    kb = KnowledgebaseService.get_or_none(id=dataset_id, tenant_id=tenant_id)
-    if kb is None:
-        return False, f"User '{tenant_id}' lacks permission for dataset '{dataset_id}'"
-
-    # Extract ext field for additional parameters
-    ext_fields = req.pop("ext", {})
-
-    # Map auto_metadata_config into parser_config if present
-    auto_meta = req.pop("auto_metadata_config", {})
-    if auto_meta:
-        parser_cfg = req.get("parser_config") or {}
-        fields = []
-        for f in auto_meta.get("fields", []):
-            fields.append(
-                {
-                    "name": f.get("name", ""),
-                    "type": f.get("type", ""),
-                    "description": f.get("description"),
-                    "examples": f.get("examples"),
-                    "restrict_values": f.get("restrict_values", False),
-                }
-            )
-        parser_cfg["metadata"] = fields
-        parser_cfg["enable_metadata"] = auto_meta.get("enabled", True)
-        req["parser_config"] = parser_cfg
-    
-    # Merge ext fields with req
-    req.update(ext_fields)
-
-    # Extract connectors from request
-    connectors = []
-    if "connectors" in req:
-        connectors = req["connectors"]
-        del req["connectors"]
-
-    if req.get("parser_config"):
-        parser_config = req["parser_config"]
-        req_ext_fields = parser_config.pop("ext", {})
-        parser_config.update(req_ext_fields)
-        req["parser_config"] = deep_merge(kb.parser_config, parser_config)
-
-    if (chunk_method := req.get("parser_id")) and chunk_method != kb.parser_id:
-        if not req.get("parser_config"):
-            req["parser_config"] = get_parser_config(chunk_method, None)
-    elif "parser_config" in req and not req["parser_config"]:
-        del req["parser_config"]
-
-    if "name" in req and req["name"].lower() != kb.name.lower():
-        exists = KnowledgebaseService.get_or_none(name=req["name"], tenant_id=tenant_id,
-                                                  status=StatusEnum.VALID.value)
-        if exists:
-            return False, f"Dataset name '{req['name']}' already exists"
-
-    if "embd_id" in req:
-        if not req["embd_id"]:
-            req["embd_id"] = kb.embd_id
-        if kb.chunk_num != 0 and req["embd_id"] != kb.embd_id:
-            return False, f"When chunk_num ({kb.chunk_num}) > 0, embedding_model must remain {kb.embd_id}"
-        ok, err = verify_embedding_availability(req["embd_id"], tenant_id)
-        if not ok:
-            return False, err
-
-    if "pagerank" in req and req["pagerank"] != kb.pagerank:
-        if os.environ.get("DOC_ENGINE", "elasticsearch") == "infinity":
-            return False, "'pagerank' can only be set when doc_engine is elasticsearch"
-
-        if req["pagerank"] > 0:
-            from rag.nlp import search
-            settings.docStoreConn.update({"kb_id": kb.id}, {PAGERANK_FLD: req["pagerank"]},
-                                         search.index_name(kb.tenant_id), kb.id)
-        else:
-            # Elasticsearch requires PAGERANK_FLD be non-zero!
-            from rag.nlp import search
-            settings.docStoreConn.update({"exists": PAGERANK_FLD}, {"remove": PAGERANK_FLD},
-                                         search.index_name(kb.tenant_id), kb.id)
-
-    if not KnowledgebaseService.update_by_id(kb.id, req):
-        return False, "Update dataset error.(Database error)"
-
-    ok, k = KnowledgebaseService.get_by_id(kb.id)
-    if not ok:
-        return False, "Dataset updated failed"
-
-    # Link connectors to the dataset
-    errors = Connector2KbService.link_connectors(kb.id, [conn for conn in connectors], tenant_id)
-    if errors:
-        logging.error("Link KB errors: %s", errors)
-
-    response_data = remap_dictionary_keys(k.to_dict())
-    response_data["connectors"] = connectors
-    return True, response_data
-
-
-def list_datasets(tenant_id: str, args: dict):
-    """
-    List datasets.
-
-    :param tenant_id: tenant ID
-    :param args: query arguments
-    :return: (success, result) or (success, error_message)
-    """
-    kb_id = args.get("id")
-    name = args.get("name")
-    page = int(args.get("page", 1))
-    page_size = int(args.get("page_size", 30))
-    ext_fields = args.get("ext", {})
-    parser_id = ext_fields.get("parser_id")
-    keywords = ext_fields.get("keywords", "")
-    orderby = args.get("orderby", "create_time")
-    desc_arg = args.get("desc", "true")
-    if isinstance(desc_arg, str):
-        desc = desc_arg.lower() != "false"
-    elif isinstance(desc_arg, bool):
-        desc = desc_arg
-    else:
-        # unknown type, default to True
-        desc = True
-
-    if kb_id:
-        kbs = KnowledgebaseService.get_kb_by_id(kb_id, tenant_id)
-        if not kbs:
-            return False, f"User '{tenant_id}' lacks permission for dataset '{kb_id}'"
-    if name:
-        kbs = KnowledgebaseService.get_kb_by_name(name, tenant_id)
-        if not kbs:
-            return False, f"User '{tenant_id}' lacks permission for dataset '{name}'"
-    if ext_fields.get("owner_ids", []):
-        tenant_ids = ext_fields["owner_ids"]
-    else:
-        tenants = TenantService.get_joined_tenants_by_user_id(tenant_id)
-        tenant_ids = [m["tenant_id"] for m in tenants]
-    kbs, total = KnowledgebaseService.get_list(
-        tenant_ids,
-        tenant_id,
-        page,
-        page_size,
-        orderby,
-        desc,
-        kb_id,
-        name,
-        keywords,
-        parser_id
-    )
-    users = UserService.get_by_ids([m["tenant_id"] for m in kbs])
-    user_map = {m.id: m.to_dict() for m in users}
-    response_data_list = []
-    for kb in kbs:
-        user_dict = user_map.get(kb["tenant_id"], {})
-        kb.update({
-            "nickname": user_dict.get("nickname", ""),
-            "tenant_avatar": user_dict.get("avatar", "")
-        })
-        response_data_list.append(remap_dictionary_keys(kb))
-    return True, {"data": response_data_list, "total": total}
-
-
-async def get_knowledge_graph(dataset_id: str, tenant_id: str):
-    """
-    Get knowledge graph for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
-        return False, "No authorization."
-    _, kb = KnowledgebaseService.get_by_id(dataset_id)
-
-    req = {
-        "kb_id": [dataset_id],
-        "knowledge_graph_kwd": ["graph"]
-    }
-
-    obj = {"graph": {}, "mind_map": {}}
-    from rag.nlp import search
-    if not settings.docStoreConn.index_exist(search.index_name(kb.tenant_id), dataset_id):
-        return True, obj
-    sres = await settings.retriever.search(req, search.index_name(kb.tenant_id), [dataset_id])
-    if not len(sres.ids):
-        return True, obj
-
-    for id in sres.ids[:1]:
-        ty = sres.field[id]["knowledge_graph_kwd"]
-        try:
-            content_json = json.loads(sres.field[id]["content_with_weight"])
-        except Exception:
-            continue
-
-        obj[ty] = content_json
-
-    if "nodes" in obj["graph"]:
-        obj["graph"]["nodes"] = sorted(obj["graph"]["nodes"], key=lambda x: x.get("pagerank", 0), reverse=True)[:256]
-        if "edges" in obj["graph"]:
-            node_id_set = {o["id"] for o in obj["graph"]["nodes"]}
-            filtered_edges = [o for o in obj["graph"]["edges"] if
-                              o["source"] != o["target"] and o["source"] in node_id_set and o["target"] in node_id_set]
-            obj["graph"]["edges"] = sorted(filtered_edges, key=lambda x: x.get("weight", 0), reverse=True)[:128]
-    return True, obj
-
-
-def delete_knowledge_graph(dataset_id: str, tenant_id: str):
-    """
-    Delete knowledge graph for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
-        return False, "No authorization."
-    _, kb = KnowledgebaseService.get_by_id(dataset_id)
-    from rag.nlp import search
-    settings.docStoreConn.delete({"knowledge_graph_kwd": ["graph", "subgraph", "entity", "relation"]},
-                                 search.index_name(kb.tenant_id), dataset_id)
-
-    return True, True
-
-
-def run_graphrag(dataset_id: str, tenant_id: str):
-    """
-    Run GraphRAG for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    if not dataset_id:
-        return False, 'Lack of "Dataset ID"'
-    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
-        return False, "No authorization."
-
-    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
-    if not ok:
-        return False, "Invalid Dataset ID"
-
-    task_id = kb.graphrag_task_id
-    if task_id:
-        ok, task = TaskService.get_by_id(task_id)
-        if not ok:
-            logging.warning(f"A valid GraphRAG task id is expected for Dataset {dataset_id}")
-
-        if task and task.progress not in [-1, 1]:
-            return False, f"Task {task_id} in progress with status {task.progress}. A Graph Task is already running."
-
-    documents, _ = DocumentService.get_by_kb_id(
-        kb_id=dataset_id,
-        page_number=0,
-        items_per_page=0,
-        orderby="create_time",
-        desc=False,
-        keywords="",
-        run_status=[],
-        types=[],
-        suffix=[],
-    )
-    if not documents:
-        return False, f"No documents in Dataset {dataset_id}"
-
-    sample_document = documents[0]
-    document_ids = [document["id"] for document in documents]
-
-    task_id = queue_raptor_o_graphrag_tasks(sample_doc_id=sample_document, ty="graphrag", priority=0, fake_doc_id=GRAPH_RAPTOR_FAKE_DOC_ID, doc_ids=list(document_ids))
-
-    if not KnowledgebaseService.update_by_id(kb.id, {"graphrag_task_id": task_id}):
-        logging.warning(f"Cannot save graphrag_task_id for Dataset {dataset_id}")
-
-    return True, {"graphrag_task_id": task_id}
-
-
-def trace_graphrag(dataset_id: str, tenant_id: str):
-    """
-    Trace GraphRAG task for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    if not dataset_id:
-        return False, 'Lack of "Dataset ID"'
-    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
-        return False, "No authorization."
-
-    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
-    if not ok:
-        return False, "Invalid Dataset ID"
-
-    task_id = kb.graphrag_task_id
-    if not task_id:
-        return True, {}
-
-    ok, task = TaskService.get_by_id(task_id)
-    if not ok:
-        return True, {}
-
-    return True, task.to_dict()
-
-
-def run_raptor(dataset_id: str, tenant_id: str):
-    """
-    Run RAPTOR for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    if not dataset_id:
-        return False, 'Lack of "Dataset ID"'
-    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
-        return False, "No authorization."
-
-    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
-    if not ok:
-        return False, "Invalid Dataset ID"
-
-    task_id = kb.raptor_task_id
-    if task_id:
-        ok, task = TaskService.get_by_id(task_id)
-        if not ok:
-            logging.warning(f"A valid RAPTOR task id is expected for Dataset {dataset_id}")
-
-        if task and task.progress not in [-1, 1]:
-            return False, f"Task {task_id} in progress with status {task.progress}. A RAPTOR Task is already running."
-
-    documents, _ = DocumentService.get_by_kb_id(
-        kb_id=dataset_id,
-        page_number=0,
-        items_per_page=0,
-        orderby="create_time",
-        desc=False,
-        keywords="",
-        run_status=[],
-        types=[],
-        suffix=[],
-    )
-    if not documents:
-        return False, f"No documents in Dataset {dataset_id}"
-
-    sample_document = documents[0]
-    document_ids = [document["id"] for document in documents]
-
-    task_id = queue_raptor_o_graphrag_tasks(sample_doc_id=sample_document, ty="raptor", priority=0, fake_doc_id=GRAPH_RAPTOR_FAKE_DOC_ID, doc_ids=list(document_ids))
-
-    if not KnowledgebaseService.update_by_id(kb.id, {"raptor_task_id": task_id}):
-        logging.warning(f"Cannot save raptor_task_id for Dataset {dataset_id}")
-
-    return True, {"raptor_task_id": task_id}
-
-
-def trace_raptor(dataset_id: str, tenant_id: str):
-    """
-    Trace RAPTOR task for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    if not dataset_id:
-        return False, 'Lack of "Dataset ID"'
-
-    if not KnowledgebaseService.accessible(dataset_id, tenant_id):
-        return False, "No authorization."
-
-    ok, kb = KnowledgebaseService.get_by_id(dataset_id)
-    if not ok:
-        return False, "Invalid Dataset ID"
-
-    task_id = kb.raptor_task_id
-    if not task_id:
-        return True, {}
-
-    ok, task = TaskService.get_by_id(task_id)
-    if not ok:
-        return False, "RAPTOR Task Not Found or Error Occurred"
-
-    return True, task.to_dict()
-
-
-def get_auto_metadata(dataset_id: str, tenant_id: str):
-    """
-    Get auto-metadata configuration for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :return: (success, result) or (success, error_message)
-    """
-    kb = KnowledgebaseService.get_or_none(id=dataset_id, tenant_id=tenant_id)
-    if kb is None:
-        return False, f"User '{tenant_id}' lacks permission for dataset '{dataset_id}'"
-
-    parser_cfg = kb.parser_config or {}
-    metadata = parser_cfg.get("metadata") or []
-    enabled = parser_cfg.get("enable_metadata", bool(metadata))
-    # Normalize to AutoMetadataConfig-like JSON
-    fields = []
-    for f in metadata:
-        if not isinstance(f, dict):
-            continue
-        fields.append(
-            {
-                "name": f.get("name", ""),
-                "type": f.get("type", ""),
-                "description": f.get("description"),
-                "examples": f.get("examples"),
-                "restrict_values": f.get("restrict_values", False),
-            }
-        )
-    return True, {"enabled": enabled, "fields": fields}
-
-
-async def update_auto_metadata(dataset_id: str, tenant_id: str, cfg: dict):
-    """
-    Update auto-metadata configuration for a dataset.
-
-    :param dataset_id: dataset ID
-    :param tenant_id: tenant ID
-    :param cfg: auto-metadata configuration
-    :return: (success, result) or (success, error_message)
-    """
-    kb = KnowledgebaseService.get_or_none(id=dataset_id, tenant_id=tenant_id)
-    if kb is None:
-        return False, f"User '{tenant_id}' lacks permission for dataset '{dataset_id}'"
-
-    parser_cfg = kb.parser_config or {}
-    fields = []
-    for f in cfg.get("fields", []):
-        fields.append(
-            {
-                "name": f.get("name", ""),
-                "type": f.get("type", ""),
-                "description": f.get("description"),
-                "examples": f.get("examples"),
-                "restrict_values": f.get("restrict_values", False),
-            }
-        )
-    parser_cfg["metadata"] = fields
-    parser_cfg["enable_metadata"] = cfg.get("enabled", True)
-
-    if not KnowledgebaseService.update_by_id(kb.id, {"parser_config": parser_cfg}):
-        return False, "Update auto-metadata error.(Database error)"
-
-    return True, {"enabled": parser_cfg["enable_metadata"], "fields": fields}
--- a/api/apps/services/memory_api_service.py
+++ b/api/apps/services/memory_api_service.py
@ -1,5 +1,5 @@
 #
-#  Copyright 2026 The InfiniFlow Authors. All Rights Reserved.
+#  Copyright 2025 The InfiniFlow Authors. All Rights Reserved.
 #
 #  Licensed under the Apache License, Version 2.0 (the "License");
 #  you may not use this file except in compliance with the License.
--- a/api/db/services/knowledgebase_service.py
+++ b/api/db/services/knowledgebase_service.py
@ -433,7 +433,7 @@ class KnowledgebaseService(CommonService):
    @classmethod
    @DB.connection_context()
    def get_list(cls, joined_tenant_ids, user_id,
-                 page_number, items_per_page, orderby, desc, id, name, keywords, parser_id=None):
+                 page_number, items_per_page, orderby, desc, id, name):
        # Get list of knowledge bases with filtering and pagination
        # Args:
        #     joined_tenant_ids: List of tenant IDs
@ -444,8 +444,6 @@ class KnowledgebaseService(CommonService):
        #     desc: Boolean indicating descending order
        #     id: Optional ID filter
        #     name: Optional name filter
-        #     keywords: Optional keywords filter
-        #     parser_id: Optional parser ID filter
        # Returns:
        #     List of knowledge bases
        #     Total count of knowledge bases
@ -454,11 +452,6 @@ class KnowledgebaseService(CommonService):
            kbs = kbs.where(cls.model.id == id)
        if name:
            kbs = kbs.where(cls.model.name == name)
-        if keywords:
-            kbs = kbs.where(fn.LOWER(cls.model.name).contains(keywords.lower()))
-        if parser_id:
-            kbs = kbs.where(cls.model.parser_id == parser_id)
-
        kbs = kbs.where(
            ((cls.model.tenant_id.in_(joined_tenant_ids) & (cls.model.permission ==
                                                            TenantPermission.TEAM.value)) | (
--- a/api/utils/api_utils.py
+++ b/api/utils/api_utils.py
@ -28,6 +28,7 @@ from typing import Any

 import requests
 from quart import (
+    Response,
    jsonify,
    request,
    has_app_context,
@ -233,17 +234,6 @@ def active_required(func):
    return wrapper


-def add_tenant_id_to_kwargs(func):
-    @wraps(func)
-    async def wrapper(**kwargs):
-        from api.apps import current_user
-        kwargs["tenant_id"] = current_user.id
-        if inspect.iscoroutinefunction(func):
-            return await func(**kwargs)
-        return func(**kwargs)
-    return wrapper
-
-
 def get_json_result(code: RetCode = RetCode.SUCCESS, message="success", data=None):
    response = {"code": code, "message": message, "data": data}
    return _safe_jsonify(response)
@ -523,7 +513,7 @@ def check_duplicate_ids(ids, id_type="item"):
    return list(set(ids)), duplicate_messages


-def verify_embedding_availability(embd_id: str, tenant_id: str) -> tuple[bool, str | None]:
+def verify_embedding_availability(embd_id: str, tenant_id: str) -> tuple[bool, Response | None]:
    from api.db.services.llm_service import LLMService
    from api.db.services.tenant_llm_service import TenantLLMService

@ -569,16 +559,13 @@ def verify_embedding_availability(embd_id: str, tenant_id: str) -> tuple[bool, s

        is_builtin_model = llm_factory == "Builtin"
        if not (is_builtin_model or is_tenant_model or in_llm_service):
-            return False, f"Unsupported model: <{embd_id}>"
+            return False, get_error_argument_result(f"Unsupported model: <{embd_id}>")

        if not (is_builtin_model or is_tenant_model):
-            return False, f"Unauthorized model: <{embd_id}>"
+            return False, get_error_argument_result(f"Unauthorized model: <{embd_id}>")
    except OperationalError as e:
        logging.exception(e)
-        return False, "Database operation failed"
-    except Exception as e:
-        logging.exception(e)
-        return False, "Internal server error"
+        return False, get_error_data_result(message="Database operation failed")

    return True, None

--- a/api/utils/validation_utils.py
+++ b/api/utils/validation_utils.py
@ -27,7 +27,6 @@ from pydantic import (
    ValidationError,
    field_validator,
    model_validator,
-    ValidationInfo
 )
 from pydantic_core import PydanticCustomError
 from werkzeug.exceptions import BadRequest, UnsupportedMediaType
@ -163,15 +162,6 @@ def validate_and_parse_request_args(request: Request, validator: type[BaseModel]
        - Preserves type conversion from Pydantic validation
    """
    args = request.args.to_dict(flat=True)
-
-    # Handle ext parameter: parse JSON string to dict if it's a string
-    if 'ext' in args and isinstance(args['ext'], str):
-        import json
-        try:
-            args['ext'] = json.loads(args['ext'])
-        except json.JSONDecodeError:
-            pass  # Keep the string and let validation handle the error
-
    try:
        if extras is not None:
            args.update(extras)
@ -346,7 +336,6 @@ class RaptorConfig(Base):
    max_cluster: Annotated[int, Field(default=64, ge=1, le=1024)]
    random_seed: Annotated[int, Field(default=0, ge=0)]
    auto_disable_for_structured_data: Annotated[bool, Field(default=True)]
-    ext: Annotated[dict, Field(default={})]


 class GraphragConfig(Base):
@ -388,7 +377,6 @@ class ParserConfig(Base):
    filename_embd_weight: Annotated[float | None, Field(default=0.1, ge=0.0, le=1.0)]
    task_page_size: Annotated[int | None, Field(default=None, ge=1)]
    pages: Annotated[list[list[int]] | None, Field(default=None)]
-    ext: Annotated[dict, Field(default={})]


 class CreateDatasetReq(Base):
@ -402,25 +390,6 @@ class CreateDatasetReq(Base):
    pipeline_id: Annotated[str | None, Field(default=None, min_length=32, max_length=32, serialization_alias="pipeline_id")]
    parser_config: Annotated[ParserConfig | None, Field(default=None)]
    auto_metadata_config: Annotated[AutoMetadataConfig | None, Field(default=None)]
-    ext: Annotated[dict, Field(default={})]
-
-    @field_validator("pipeline_id", mode="before")
-    @classmethod
-    def handle_pipeline_id(cls, v: str | None, info: ValidationInfo):
-        if v is None:
-            return v
-        if info.data.get("chunk_method") is not None and isinstance(v, str):
-            v = None
-        return v
-
-    @field_validator("parse_type", mode="before")
-    @classmethod
-    def handle_parse_type(cls, v: int | None, info: ValidationInfo):
-        if v is None:
-            return v
-        if info.data.get("chunk_method") is not None and isinstance(v, int):
-            v = None
-        return v

    @field_validator("avatar", mode="after")
    @classmethod
@ -778,4 +747,3 @@ class BaseListReq(BaseModel):

 class ListDatasetReq(BaseListReq):
    include_parsing_status: Annotated[bool, Field(default=False)]
-    ext: Annotated[dict, Field(default={})]
--- a/sdk/python/ragflow_sdk/modules/dataset.py
+++ b/sdk/python/ragflow_sdk/modules/dataset.py
@ -13,7 +13,7 @@
 #  See the License for the specific language governing permissions and
 #  limitations under the License.
 #
-from typing import Any
+
 from .base import Base
 from .document import Document

@ -151,23 +151,3 @@ class DataSet(Base):
        res = res.json()
        if res.get("code") != 0:
            raise Exception(res.get("message"))
-
-    def get_auto_metadata(self) -> dict[str, Any]:
-        """
-        Retrieve auto-metadata configuration for a dataset via SDK.
-        """
-        res = self.get(f"/datasets/{self.id}/auto_metadata")
-        res = res.json()
-        if res.get("code") == 0:
-            return res["data"]
-        raise Exception(res["message"])
-
-    def update_auto_metadata(self, **config: Any) -> dict[str, Any]:
-        """
-        Update auto-metadata configuration for a dataset via SDK.
-        """
-        res = self.put(f"/datasets/{self.id}/auto_metadata", config)
-        res = res.json()
-        if res.get("code") == 0:
-            return res["data"]
-        raise Exception(res["message"])
--- a/sdk/python/ragflow_sdk/ragflow.py
+++ b/sdk/python/ragflow_sdk/ragflow.py
@ -111,6 +111,26 @@ class RAGFlow:
            return result_list
        raise Exception(res["message"])

+    def get_auto_metadata(self, dataset_id: str) -> dict[str, Any]:
+        """
+        Retrieve auto-metadata configuration for a dataset via SDK.
+        """
+        res = self.get(f"/datasets/{dataset_id}/auto_metadata")
+        res = res.json()
+        if res.get("code") == 0:
+            return res["data"]
+        raise Exception(res["message"])
+
+    def update_auto_metadata(self, dataset_id: str, **config: Any) -> dict[str, Any]:
+        """
+        Update auto-metadata configuration for a dataset via SDK.
+        """
+        res = self.put(f"/datasets/{dataset_id}/auto_metadata", config)
+        res = res.json()
+        if res.get("code") == 0:
+            return res["data"]
+        raise Exception(res["message"])
+
    def create_chat(self, name: str, avatar: str = "", dataset_ids=None, llm: Chat.LLM | None = None, prompt: Chat.Prompt | None = None) -> Chat:
        if dataset_ids is None:
            dataset_ids = []
--- a/test/testcases/test_http_api/test_dataset_management/test_create_dataset.py
+++ b/test/testcases/test_http_api/test_dataset_management/test_create_dataset.py
@ -23,7 +23,7 @@ from utils import encode_avatar
 from utils.file_utils import create_image_file
 from utils.hypothesis_utils import valid_names

-from test_http_api.common import create_dataset
+from common import create_dataset


@pytest.mark.usefixtures("clear_datasets")
@ -32,11 +32,11 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_code, expected_message",
        [
-            (None, 401, "<Unauthorized '401: Unauthorized'>"),
+            (None, 0, "`Authorization` can't be empty"),
            (
                RAGFlowHttpApiAuth(INVALID_API_TOKEN),
-                401,
-                "<Unauthorized '401: Unauthorized'>",
+                109,
+                "Authentication error: API key is invalid!",
            ),
        ],
        ids=["empty_auth", "invalid_api_token"],
@ -250,7 +250,7 @@ class TestDatasetCreate:
    def test_embedding_model_invalid(self, HttpApiAuth, name, embedding_model):
        payload = {"name": name, "embedding_model": embedding_model}
        res = create_dataset(HttpApiAuth, payload)
-        assert res["code"] == 102, res
+        assert res["code"] == 101, res
        if "tenant_no_auth" in name:
            assert res["message"] == f"Unauthorized model: <{embedding_model}>", res
        else:
--- a/test/testcases/test_http_api/test_dataset_management/test_delete_datasets.py
+++ b/test/testcases/test_http_api/test_dataset_management/test_delete_datasets.py
@ -31,11 +31,11 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_code, expected_message",
        [
-            (None, 401, "<Unauthorized '401: Unauthorized'>"),
+            (None, 0, "`Authorization` can't be empty"),
            (
                RAGFlowHttpApiAuth(INVALID_API_TOKEN),
-                401,
-                "<Unauthorized '401: Unauthorized'>",
+                109,
+                "Authentication error: API key is invalid!",
            ),
        ],
    )
@ -160,7 +160,7 @@ class TestDatasetsDelete:
    def test_id_wrong_uuid(self, HttpApiAuth):
        payload = {"ids": ["d94a8dc02c9711f0930f7fbc369eab6d"]}
        res = delete_datasets(HttpApiAuth, payload)
-        assert res["code"] == 102, res
+        assert res["code"] == 108, res
        assert "lacks permission for dataset" in res["message"], res

        res = list_datasets(HttpApiAuth)
@ -180,7 +180,7 @@ class TestDatasetsDelete:
        if callable(func):
            payload = func(dataset_ids)
        res = delete_datasets(HttpApiAuth, payload)
-        assert res["code"] == 102, res
+        assert res["code"] == 108, res
        assert "lacks permission for dataset" in res["message"], res

        res = list_datasets(HttpApiAuth)
@ -205,7 +205,7 @@ class TestDatasetsDelete:
        assert res["code"] == 0, res

        res = delete_datasets(HttpApiAuth, payload)
-        assert res["code"] == 102, res
+        assert res["code"] == 108, res
        assert "lacks permission for dataset" in res["message"], res

    @pytest.mark.p3
--- a/test/testcases/test_http_api/test_dataset_management/test_knowledge_graph.py
+++ b/test/testcases/test_http_api/test_dataset_management/test_knowledge_graph.py
@ -24,8 +24,8 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_code, expected_message",
        [
-            (None, 401, "<Unauthorized '401: Unauthorized'>"),
-            (RAGFlowHttpApiAuth(INVALID_API_TOKEN), 401, "<Unauthorized '401: Unauthorized'>"),
+            (None, 0, "Authorization"),
+            (RAGFlowHttpApiAuth(INVALID_API_TOKEN), 109, "API key is invalid"),
        ],
    )
    def test_invalid_auth(self, invalid_auth, expected_code, expected_message):
--- a/test/testcases/test_http_api/test_dataset_management/test_list_datasets.py
+++ b/test/testcases/test_http_api/test_dataset_management/test_list_datasets.py
@ -28,11 +28,11 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_code, expected_message",
        [
-            (None, 401, "<Unauthorized '401: Unauthorized'>"),
+            (None, 0, "`Authorization` can't be empty"),
            (
                RAGFlowHttpApiAuth(INVALID_API_TOKEN),
-                401,
-                "<Unauthorized '401: Unauthorized'>",
+                109,
+                "Authentication error: API key is invalid!",
            ),
        ],
    )
@ -237,7 +237,7 @@ class TestDatasetsList:
    def test_name_wrong(self, HttpApiAuth):
        params = {"name": "wrong name"}
        res = list_datasets(HttpApiAuth, params)
-        assert res["code"] == 102, res
+        assert res["code"] == 108, res
        assert "lacks permission for dataset" in res["message"], res

    @pytest.mark.p2
@ -281,7 +281,7 @@ class TestDatasetsList:
    def test_id_wrong_uuid(self, HttpApiAuth):
        params = {"id": "d94a8dc02c9711f0930f7fbc369eab6d"}
        res = list_datasets(HttpApiAuth, params)
-        assert res["code"] == 102, res
+        assert res["code"] == 108, res
        assert "lacks permission for dataset" in res["message"], res

    @pytest.mark.p2
--- a/test/testcases/test_http_api/test_dataset_management/test_update_dataset.py
+++ b/test/testcases/test_http_api/test_dataset_management/test_update_dataset.py
@ -33,11 +33,11 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_code, expected_message",
        [
-            (None, 401, "<Unauthorized '401: Unauthorized'>"),
+            (None, 0, "`Authorization` can't be empty"),
            (
                RAGFlowHttpApiAuth(INVALID_API_TOKEN),
-                401,
-                "<Unauthorized '401: Unauthorized'>",
+                109,
+                "Authentication error: API key is invalid!",
            ),
        ],
        ids=["empty_auth", "invalid_api_token"],
@ -76,7 +76,7 @@ class TestRquest:
    def test_payload_empty(self, HttpApiAuth, add_dataset_func):
        dataset_id = add_dataset_func
        res = update_dataset(HttpApiAuth, dataset_id, {})
-        assert res["code"] == 102, res
+        assert res["code"] == 101, res
        assert res["message"] == "No properties were modified", res

    @pytest.mark.p3
@ -313,7 +313,7 @@ class TestDatasetUpdate:
        dataset_id = add_dataset_func
        payload = {"name": name, "embedding_model": embedding_model}
        res = update_dataset(HttpApiAuth, dataset_id, payload)
-        assert res["code"] == 102, res
+        assert res["code"] == 101, res
        if "tenant_no_auth" in name:
            assert res["message"] == f"Unauthorized model: <{embedding_model}>", res
        else:
@ -494,7 +494,7 @@ class TestDatasetUpdate:
        dataset_id = add_dataset_func
        payload = {"pagerank": 50}
        res = update_dataset(HttpApiAuth, dataset_id, payload)
-        assert res["code"] == 102, res
+        assert res["code"] == 101, res
        assert res["message"] == "'pagerank' can only be set when doc_engine is elasticsearch", res

    @pytest.mark.p2
--- a/test/testcases/test_sdk_api/test_dataset_mangement/test_auto_metadata.py
+++ b/test/testcases/test_sdk_api/test_dataset_mangement/test_auto_metadata.py
@ -44,7 +44,7 @@ class TestAutoMetadataOnCreate:
        dataset = client.create_dataset(**payload)
        # The SDK should expose parser_config via internal properties or metadata;
        # we rely on the HTTP API for verification via get_auto_metadata.
-        cfg = dataset.get_auto_metadata()
+        cfg = client.get_auto_metadata(dataset_id=dataset.id)
        assert cfg["enabled"] is True
        assert len(cfg["fields"]) == 2
        names = {f["name"] for f in cfg["fields"]}
@ -74,7 +74,7 @@ class TestAutoMetadataOnUpdate:
        }
        dataset.update(payload)

-        cfg = dataset.get_auto_metadata()
+        cfg = client.get_auto_metadata(dataset_id=dataset.id)
        assert cfg["enabled"] is True
        assert len(cfg["fields"]) == 1
        assert cfg["fields"][0]["name"] == "tags"
@ -93,9 +93,9 @@ class TestAutoMetadataOnUpdate:
                }
            ],
        }
-        dataset.update_auto_metadata(**update_cfg)
+        client.update_auto_metadata(dataset_id=dataset.id, **update_cfg)

-        cfg2 = dataset.get_auto_metadata()
+        cfg2 = client.get_auto_metadata(dataset_id=dataset.id)
        assert cfg2["enabled"] is False
        assert len(cfg2["fields"]) == 1
        assert cfg2["fields"][0]["name"] == "year"
--- a/test/testcases/test_sdk_api/test_dataset_mangement/test_create_dataset.py
+++ b/test/testcases/test_sdk_api/test_dataset_mangement/test_create_dataset.py
@ -31,8 +31,8 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_message",
        [
-            (None, "<Unauthorized '401: Unauthorized'>"),
-            (INVALID_API_TOKEN, "<Unauthorized '401: Unauthorized'>"),
+            (None, "Authentication error: API key is invalid!"),
+            (INVALID_API_TOKEN, "Authentication error: API key is invalid!"),
        ],
        ids=["empty_auth", "invalid_api_token"],
    )
--- a/test/testcases/test_sdk_api/test_dataset_mangement/test_delete_datasets.py
+++ b/test/testcases/test_sdk_api/test_dataset_mangement/test_delete_datasets.py
@ -27,8 +27,8 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_message",
        [
-            (None, "<Unauthorized '401: Unauthorized'>"),
-            (INVALID_API_TOKEN, "<Unauthorized '401: Unauthorized'>"),
+            (None, "Authentication error: API key is invalid!"),
+            (INVALID_API_TOKEN, "Authentication error: API key is invalid!"),
        ],
    )
    def test_auth_invalid(self, invalid_auth, expected_message):
--- a/test/testcases/test_sdk_api/test_dataset_mangement/test_list_datasets.py
+++ b/test/testcases/test_sdk_api/test_dataset_mangement/test_list_datasets.py
@ -26,8 +26,8 @@ class TestAuthorization:
    @pytest.mark.parametrize(
        "invalid_auth, expected_message",
        [
-            (None, "<Unauthorized '401: Unauthorized'>"),
-            (INVALID_API_TOKEN, "<Unauthorized '401: Unauthorized'>"),
+            (None, "Authentication error: API key is invalid!"),
+            (INVALID_API_TOKEN, "Authentication error: API key is invalid!"),
        ],
    )
    def test_auth_invalid(self, invalid_auth, expected_message):
--- a/test/testcases/test_web_api/common.py
+++ b/test/testcases/test_web_api/common.py
@ -27,7 +27,6 @@ from utils.file_utils import create_txt_file
 HEADERS = {"Content-Type": "application/json"}

 KB_APP_URL = f"/{VERSION}/kb"
-DATASETS_URL = f"/api/{VERSION}/datasets"
 DOCUMENT_APP_URL = f"/{VERSION}/document"
 CHUNK_API_URL = f"/{VERSION}/chunk"
 DIALOG_APP_URL = f"/{VERSION}/dialog"
@ -169,28 +168,25 @@ def search_rm(auth, payload=None, *, headers=HEADERS, data=None):


 # KB APP
-def create_dataset(auth, payload=None, *, headers=HEADERS, data=None):
-    res = requests.post(url=f"{HOST_ADDRESS}{DATASETS_URL}", headers=headers, auth=auth, json=payload, data=data)
+def create_kb(auth, payload=None, *, headers=HEADERS, data=None):
+    res = requests.post(url=f"{HOST_ADDRESS}{KB_APP_URL}/create", headers=headers, auth=auth, json=payload, data=data)
    return res.json()


-def list_datasets(auth, params=None, *, headers=HEADERS):
-    res = requests.get(url=f"{HOST_ADDRESS}{DATASETS_URL}", headers=headers, auth=auth, params=params)
+def list_kbs(auth, params=None, payload=None, *, headers=HEADERS, data=None):
+    if payload is None:
+        payload = {}
+    res = requests.post(url=f"{HOST_ADDRESS}{KB_APP_URL}/list", headers=headers, auth=auth, params=params, json=payload, data=data)
    return res.json()


-def update_dataset(auth, dataset_id, payload=None, *, headers=HEADERS, data=None):
-    res = requests.put(url=f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}", headers=headers, auth=auth, json=payload, data=data)
+def update_kb(auth, payload=None, *, headers=HEADERS, data=None):
+    res = requests.post(url=f"{HOST_ADDRESS}{KB_APP_URL}/update", headers=headers, auth=auth, json=payload, data=data)
    return res.json()


-def delete_datasets(auth, payload=None, *, headers=HEADERS, data=None):
-    """
-    Delete datasets.
-    The endpoint is DELETE /api/{VERSION}/datasets with payload {"ids": [...]}
-    This is the standard SDK REST API endpoint for dataset deletion.
-    """
-    res = requests.delete(url=f"{HOST_ADDRESS}{DATASETS_URL}", headers=headers, auth=auth, json=payload, data=data)
+def rm_kb(auth, payload=None, *, headers=HEADERS, data=None):
+    res = requests.post(url=f"{HOST_ADDRESS}{KB_APP_URL}/rm", headers=headers, auth=auth, json=payload, data=data)
    return res.json()


@ -240,43 +236,23 @@ def kb_pipeline_log_detail(auth, params=None, *, headers=HEADERS):
    return res.json()


-# DATASET GRAPH AND TASKS
-def knowledge_graph(auth, dataset_id, params=None):
-    url = f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}/knowledge_graph"
-    res = requests.get(url=url, headers=HEADERS, auth=auth, params=params)
+def kb_run_graphrag(auth, payload=None, *, headers=HEADERS, data=None):
+    res = requests.post(url=f"{HOST_ADDRESS}{KB_APP_URL}/run_graphrag", headers=headers, auth=auth, json=payload, data=data)
    return res.json()


-def delete_knowledge_graph(auth, dataset_id, payload=None):
-    url = f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}/knowledge_graph"
-    if payload is None:
-        res = requests.delete(url=url, headers=HEADERS, auth=auth)
-    else:
-        res = requests.delete(url=url, headers=HEADERS, auth=auth, json=payload)
+def kb_trace_graphrag(auth, params=None, *, headers=HEADERS):
+    res = requests.get(url=f"{HOST_ADDRESS}{KB_APP_URL}/trace_graphrag", headers=headers, auth=auth, params=params)
    return res.json()


-def run_graphrag(auth, dataset_id, payload=None):
-    url = f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}/run_graphrag"
-    res = requests.post(url=url, headers=HEADERS, auth=auth, json=payload)
+def kb_run_raptor(auth, payload=None, *, headers=HEADERS, data=None):
+    res = requests.post(url=f"{HOST_ADDRESS}{KB_APP_URL}/run_raptor", headers=headers, auth=auth, json=payload, data=data)
    return res.json()


-def trace_graphrag(auth, dataset_id, params=None):
-    url = f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}/trace_graphrag"
-    res = requests.get(url=url, headers=HEADERS, auth=auth, params=params)
-    return res.json()
-
-
-def run_raptor(auth, dataset_id, payload=None):
-    url = f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}/run_raptor"
-    res = requests.post(url=url, headers=HEADERS, auth=auth, json=payload)
-    return res.json()
-
-
-def trace_raptor(auth, dataset_id, params=None):
-    url = f"{HOST_ADDRESS}{DATASETS_URL}/{dataset_id}/trace_raptor"
-    res = requests.get(url=url, headers=HEADERS, auth=auth, params=params)
+def kb_trace_raptor(auth, params=None, *, headers=HEADERS):
+    res = requests.get(url=f"{HOST_ADDRESS}{KB_APP_URL}/trace_raptor", headers=headers, auth=auth, params=params)
    return res.json()


@ -310,11 +286,21 @@ def rename_tags(auth, dataset_id, payload=None, *, headers=HEADERS, data=None):
    return res.json()


+def knowledge_graph(auth, dataset_id, params=None, *, headers=HEADERS):
+    res = requests.get(url=f"{HOST_ADDRESS}{KB_APP_URL}/{dataset_id}/knowledge_graph", headers=headers, auth=auth, params=params)
+    return res.json()
+
+
+def delete_knowledge_graph(auth, dataset_id, payload=None, *, headers=HEADERS, data=None):
+    res = requests.delete(url=f"{HOST_ADDRESS}{KB_APP_URL}/{dataset_id}/knowledge_graph", headers=headers, auth=auth, json=payload, data=data)
+    return res.json()
+
+
 def batch_create_datasets(auth, num):
    ids = []
    for i in range(num):
-        res = create_dataset(auth, {"name": f"kb_{i}"})
-        ids.append(res["data"]["id"])
+        res = create_kb(auth, {"name": f"kb_{i}"})
+        ids.append(res["data"]["kb_id"])
    return ids


--- a/test/testcases/test_web_api/conftest.py
+++ b/test/testcases/test_web_api/conftest.py
@ -26,9 +26,9 @@ from common import (
    delete_dialogs,
    list_chunks,
    list_documents,
-    list_datasets,
+    list_kbs,
    parse_documents,
-    delete_datasets,
+    rm_kb,
 )
 from libs.auth import RAGFlowWebApiAuth
 from pytest import FixtureRequest
@ -104,9 +104,9 @@ def require_env_flag():
@pytest.fixture(scope="function")
 def clear_datasets(request: FixtureRequest, WebApiAuth: RAGFlowWebApiAuth):
    def cleanup():
-        res = list_datasets(WebApiAuth, params={"page_size": 1000})
-        kb_ids = [kb["id"] for kb in res["data"]]
-        delete_datasets(WebApiAuth, {"ids": kb_ids})
+        res = list_kbs(WebApiAuth, params={"page_size": 1000})
+        for kb in res["data"]["kbs"]:
+            rm_kb(WebApiAuth, {"kb_id": kb["id"]})

    request.addfinalizer(cleanup)

@ -122,9 +122,9 @@ def clear_dialogs(request, WebApiAuth):
@pytest.fixture(scope="class")
 def add_dataset(request: FixtureRequest, WebApiAuth: RAGFlowWebApiAuth) -> str:
    def cleanup():
-        res = list_datasets(WebApiAuth, params={"page_size": 1000})
-        kb_ids = [kb["id"] for kb in res["data"]]
-        delete_datasets(WebApiAuth, {"ids": kb_ids})
+        res = list_kbs(WebApiAuth, params={"page_size": 1000})
+        for kb in res["data"]["kbs"]:
+            rm_kb(WebApiAuth, {"kb_id": kb["id"]})

    request.addfinalizer(cleanup)
    return batch_create_datasets(WebApiAuth, 1)[0]
@ -133,9 +133,9 @@ def add_dataset(request: FixtureRequest, WebApiAuth: RAGFlowWebApiAuth) -> str:
@pytest.fixture(scope="function")
 def add_dataset_func(request: FixtureRequest, WebApiAuth: RAGFlowWebApiAuth) -> str:
    def cleanup():
-        res = list_datasets(WebApiAuth, params={"page_size": 1000})
-        kb_ids = [kb["id"] for kb in res["data"]]
-        delete_datasets(WebApiAuth, {"ids": kb_ids})
+        res = list_kbs(WebApiAuth, params={"page_size": 1000})
+        for kb in res["data"]["kbs"]:
+            rm_kb(WebApiAuth, {"kb_id": kb["id"]})

    request.addfinalizer(cleanup)
    return batch_create_datasets(WebApiAuth, 1)[0]
--- a/test/testcases/test_web_api/test_dataset_management/test_dataset_sdk_routes_unit.py
+++ b/test/testcases/test_web_api/test_dataset_management/test_dataset_sdk_routes_unit.py
@ -409,7 +409,7 @@ def _load_dataset_module(monkeypatch):
    rag_nlp_pkg.search = search_mod

    module_name = "test_dataset_sdk_routes_unit_module"
-    module_path = repo_root / "api" / "apps" / "restful_apis" / "dataset_api.py"
+    module_path = repo_root / "api" / "apps" / "sdk" / "dataset.py"
    spec = importlib.util.spec_from_file_location(module_name, module_path)
    module = importlib.util.module_from_spec(spec)
    module.manager = _DummyManager()
@ -418,7 +418,7 @@ def _load_dataset_module(monkeypatch):
    return module


-@pytest.mark.p3
+@pytest.mark.p2
 def test_create_route_error_matrix_unit(monkeypatch):
    module = _load_dataset_module(monkeypatch)
    req_state = {"name": "kb"}
@ -448,7 +448,7 @@ def test_create_route_error_matrix_unit(monkeypatch):
    assert res["message"] == "Database operation failed", res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_delete_route_error_summary_matrix_unit(monkeypatch):
    module = _load_dataset_module(monkeypatch)
    req_state = {"ids": ["kb-1"]}
@ -476,7 +476,7 @@ def test_delete_route_error_summary_matrix_unit(monkeypatch):
    assert res["code"] == module.RetCode.SUCCESS, res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_update_route_branch_matrix_unit(monkeypatch):
    module = _load_dataset_module(monkeypatch)
    req_state = {"name": "new"}
@ -556,7 +556,7 @@ def test_update_route_branch_matrix_unit(monkeypatch):
    assert res["message"] == "Database operation failed", res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_list_knowledge_graph_delete_kg_matrix_unit(monkeypatch):
    module = _load_dataset_module(monkeypatch)

@ -629,7 +629,7 @@ def test_list_knowledge_graph_delete_kg_matrix_unit(monkeypatch):
    assert res["code"] == module.RetCode.AUTHENTICATION_ERROR, res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_run_trace_graphrag_matrix_unit(monkeypatch):
    module = _load_dataset_module(monkeypatch)

@ -705,7 +705,7 @@ def test_run_trace_graphrag_matrix_unit(monkeypatch):
    assert res["data"]["id"] == "task-1", res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_run_trace_raptor_matrix_unit(monkeypatch):
    module = _load_dataset_module(monkeypatch)

--- a/test/testcases/test_web_api/test_document_app/test_create_document.py
+++ b/test/testcases/test_web_api/test_document_app/test_create_document.py
@ -19,7 +19,7 @@ from types import SimpleNamespace
 from concurrent.futures import ThreadPoolExecutor, as_completed

 import pytest
-from test_web_api.common import create_document, list_datasets
+from common import create_document, list_kbs
 from configs import DOCUMENT_NAME_LIMIT, INVALID_API_TOKEN
 from libs.auth import RAGFlowWebApiAuth
 from utils.file_utils import create_txt_file
@ -91,8 +91,8 @@ class TestDocumentCreate:
        assert len(responses) == count, responses
        assert all(future.result()["code"] == 0 for future in futures), responses

-        res = list_datasets(WebApiAuth, {"id": kb_id})
-        assert res["data"][0]["document_count"] == count, res
+        res = list_kbs(WebApiAuth, {"id": kb_id})
+        assert res["data"]["kbs"][0]["doc_num"] == count, res


 def _run(coro):
--- a/test/testcases/test_web_api/test_document_app/test_upload_documents.py
+++ b/test/testcases/test_web_api/test_document_app/test_upload_documents.py
@ -20,7 +20,7 @@ from types import ModuleType, SimpleNamespace
 from concurrent.futures import ThreadPoolExecutor, as_completed

 import pytest
-from common import list_datasets, upload_documents
+from common import list_kbs, upload_documents
 from configs import DOCUMENT_NAME_LIMIT, INVALID_API_TOKEN
 from libs.auth import RAGFlowWebApiAuth
 from utils.file_utils import create_txt_file
@ -172,8 +172,8 @@ class TestDocumentsUpload:
        res = upload_documents(WebApiAuth, {"kb_id": kb_id}, fps)
        assert res["code"] == 0, res

-        res = list_datasets(WebApiAuth)
-        assert res["data"][0]["document_count"] == expected_document_count, res
+        res = list_kbs(WebApiAuth)
+        assert res["data"]["kbs"][0]["doc_num"] == expected_document_count, res

    @pytest.mark.p3
    def test_concurrent_upload(self, WebApiAuth, add_dataset_func, tmp_path):
@ -191,8 +191,8 @@ class TestDocumentsUpload:
        assert len(responses) == count, responses
        assert all(future.result()["code"] == 0 for future in futures), responses

-        res = list_datasets(WebApiAuth)
-        assert res["data"][0]["document_count"] == count, res
+        res = list_kbs(WebApiAuth)
+        assert res["data"]["kbs"][0]["doc_num"] == count, res


 class _AwaitableValue:
--- a/test/testcases/test_web_api/test_kb_app/conftest.py
+++ b/test/testcases/test_web_api/test_kb_app/conftest.py
@ -14,7 +14,7 @@
 #  limitations under the License.
 #
 import pytest
-from common import batch_create_datasets, list_datasets, delete_datasets
+from common import batch_create_datasets, list_kbs, rm_kb
 from libs.auth import RAGFlowWebApiAuth
 from pytest import FixtureRequest
 from ragflow_sdk import RAGFlow
@ -26,10 +26,11 @@ def add_datasets(request: FixtureRequest, client: RAGFlow, WebApiAuth: RAGFlowWe

    def cleanup():
        # Web KB cleanup cannot call SDK dataset bulk delete with empty ids; deletion must stay explicit.
-        res = list_datasets(WebApiAuth, params={"page_size": 1000})
-        existing_ids = {kb["id"] for kb in res["data"]}
-        ids_to_delete = list({dataset_id for dataset_id in dataset_ids if dataset_id in existing_ids})
-        delete_datasets(WebApiAuth, {"ids": ids_to_delete})
+        res = list_kbs(WebApiAuth, params={"page_size": 1000})
+        existing_ids = {kb["id"] for kb in res["data"]["kbs"]}
+        for dataset_id in dataset_ids:
+            if dataset_id in existing_ids:
+                rm_kb(WebApiAuth, {"kb_id": dataset_id})

    request.addfinalizer(cleanup)
    return dataset_ids
@ -41,10 +42,11 @@ def add_datasets_func(request: FixtureRequest, client: RAGFlow, WebApiAuth: RAGF

    def cleanup():
        # Web KB cleanup cannot call SDK dataset bulk delete with empty ids; deletion must stay explicit.
-        res = list_datasets(WebApiAuth, params={"page_size": 1000})
-        existing_ids = {kb["id"] for kb in res["data"]}
-        ids_to_delete = list({dataset_id for dataset_id in dataset_ids if dataset_id in existing_ids})
-        delete_datasets(WebApiAuth, {"ids": ids_to_delete})
+        res = list_kbs(WebApiAuth, params={"page_size": 1000})
+        existing_ids = {kb["id"] for kb in res["data"]["kbs"]}
+        for dataset_id in dataset_ids:
+            if dataset_id in existing_ids:
+                rm_kb(WebApiAuth, {"kb_id": dataset_id})

    request.addfinalizer(cleanup)
    return dataset_ids
--- a/test/testcases/test_web_api/test_kb_app/test_create_kb.py
+++ b/test/testcases/test_web_api/test_kb_app/test_create_kb.py
@ -16,7 +16,7 @@
 from concurrent.futures import ThreadPoolExecutor, as_completed

 import pytest
-from common import create_dataset
+from common import create_kb
 from configs import DATASET_NAME_LIMIT, INVALID_API_TOKEN
 from hypothesis import example, given, settings
 from libs.auth import RAGFlowWebApiAuth
@ -35,7 +35,7 @@ class TestAuthorization:
        ids=["empty_auth", "invalid_api_token"],
    )
    def test_auth_invalid(self, invalid_auth, expected_code, expected_message):
-        res = create_dataset(invalid_auth, {"name": "auth_test"})
+        res = create_kb(invalid_auth, {"name": "auth_test"})
        assert res["code"] == expected_code, res
        assert res["message"] == expected_message, res

@ -46,14 +46,14 @@ class TestCapability:
    def test_create_kb_1k(self, WebApiAuth):
        for i in range(1_000):
            payload = {"name": f"dataset_{i}"}
-            res = create_dataset(WebApiAuth, payload)
+            res = create_kb(WebApiAuth, payload)
            assert res["code"] == 0, f"Failed to create dataset {i}"

    @pytest.mark.p3
    def test_create_kb_concurrent(self, WebApiAuth):
        count = 100
        with ThreadPoolExecutor(max_workers=5) as executor:
-            futures = [executor.submit(create_dataset, WebApiAuth, {"name": f"dataset_{i}"}) for i in range(count)]
+            futures = [executor.submit(create_kb, WebApiAuth, {"name": f"dataset_{i}"}) for i in range(count)]
        responses = list(as_completed(futures))
        assert len(responses) == count, responses
        assert all(future.result()["code"] == 0 for future in futures)
@ -66,44 +66,44 @@ class TestDatasetCreate:
    @example("a" * 128)
    @settings(max_examples=20)
    def test_name(self, WebApiAuth, name):
-        res = create_dataset(WebApiAuth, {"name": name})
+        res = create_kb(WebApiAuth, {"name": name})
        assert res["code"] == 0, res

    @pytest.mark.p2
    @pytest.mark.parametrize(
        "name, expected_message",
        [
-            ("", "Field: <name> - Message: <String should have at least 1 character>"),
-            (" ", "Field: <name> - Message: <String should have at least 1 character>"),
-            ("a" * (DATASET_NAME_LIMIT + 1), "Field: <name> - Message: <String should have at most 128 characters>"),
-            (0, "Field: <name> - Message: <Input should be a valid string>"),
-            (None, "Field: <name> - Message: <Input should be a valid string>"),
+            ("", "Dataset name can't be empty."),
+            (" ", "Dataset name can't be empty."),
+            ("a" * (DATASET_NAME_LIMIT + 1), "Dataset name length is 129 which is large than 128"),
+            (0, "Dataset name must be string."),
+            (None, "Dataset name must be string."),
        ],
        ids=["empty_name", "space_name", "too_long_name", "invalid_name", "None_name"],
    )
    def test_name_invalid(self, WebApiAuth, name, expected_message):
        payload = {"name": name}
-        res = create_dataset(WebApiAuth, payload)
-        assert res["code"] == 101, res
+        res = create_kb(WebApiAuth, payload)
+        assert res["code"] == 102, res
        assert expected_message in res["message"], res

    @pytest.mark.p3
    def test_name_duplicated(self, WebApiAuth):
        name = "duplicated_name"
        payload = {"name": name}
-        res = create_dataset(WebApiAuth, payload)
+        res = create_kb(WebApiAuth, payload)
        assert res["code"] == 0, res

-        res = create_dataset(WebApiAuth, payload)
+        res = create_kb(WebApiAuth, payload)
        assert res["code"] == 0, res

    @pytest.mark.p3
    def test_name_case_insensitive(self, WebApiAuth):
        name = "CaseInsensitive"
        payload = {"name": name.upper()}
-        res = create_dataset(WebApiAuth, payload)
+        res = create_kb(WebApiAuth, payload)
        assert res["code"] == 0, res

        payload = {"name": name.lower()}
-        res = create_dataset(WebApiAuth, payload)
+        res = create_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
--- a/test/testcases/test_web_api/test_kb_app/test_kb_pipeline_tasks.py
+++ b/test/testcases/test_web_api/test_kb_app/test_kb_pipeline_tasks.py
@ -14,17 +14,17 @@
 #  limitations under the License.
 #
 import pytest
-from test_web_api.common import (
+from common import (
    kb_delete_pipeline_logs,
    kb_list_pipeline_dataset_logs,
    kb_list_pipeline_logs,
    kb_pipeline_log_detail,
-    run_graphrag,
-    trace_graphrag,
-    run_raptor,
-    trace_raptor,
+    kb_run_graphrag,
    kb_run_mindmap,
+    kb_run_raptor,
+    kb_trace_graphrag,
    kb_trace_mindmap,
+    kb_trace_raptor,
    list_documents,
    parse_documents,
 )
@ -101,13 +101,13 @@ class TestKbPipelineTasks:
    @pytest.mark.p3
    def test_graphrag_run_and_trace(self, WebApiAuth, add_chunks):
        kb_id, _, _ = add_chunks
-        run_res = run_graphrag(WebApiAuth, kb_id)
+        run_res = kb_run_graphrag(WebApiAuth, {"kb_id": kb_id})
        assert run_res["code"] == 0, run_res
        task_id = run_res["data"]["graphrag_task_id"]
        assert task_id, run_res

-        _wait_for_task(trace_graphrag, WebApiAuth, kb_id, task_id)
-        trace_res = trace_graphrag(WebApiAuth, kb_id)
+        _wait_for_task(kb_trace_graphrag, WebApiAuth, kb_id, task_id)
+        trace_res = kb_trace_graphrag(WebApiAuth, {"kb_id": kb_id})
        assert trace_res["code"] == 0, trace_res
        task = _find_task(trace_res["data"], task_id)
        assert task, trace_res
@ -118,13 +118,13 @@ class TestKbPipelineTasks:
    @pytest.mark.p3
    def test_raptor_run_and_trace(self, WebApiAuth, add_chunks):
        kb_id, _, _ = add_chunks
-        run_res = run_raptor(WebApiAuth, kb_id)
+        run_res = kb_run_raptor(WebApiAuth, {"kb_id": kb_id})
        assert run_res["code"] == 0, run_res
        task_id = run_res["data"]["raptor_task_id"]
        assert task_id, run_res

-        _wait_for_task(trace_raptor, WebApiAuth, kb_id, task_id)
-        trace_res = trace_raptor(WebApiAuth, kb_id)
+        _wait_for_task(kb_trace_raptor, WebApiAuth, kb_id, task_id)
+        trace_res = kb_trace_raptor(WebApiAuth, {"kb_id": kb_id})
        assert trace_res["code"] == 0, trace_res
        task = _find_task(trace_res["data"], task_id)
        assert task, trace_res
--- a/test/testcases/test_web_api/test_kb_app/test_kb_routes_unit.py
+++ b/test/testcases/test_web_api/test_kb_app/test_kb_routes_unit.py
@ -181,7 +181,7 @@ def set_tenant_info():
    return None


-@pytest.mark.p3
+@pytest.mark.p2
 def test_create_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -211,7 +211,7 @@ def test_create_branches(monkeypatch):
    assert "save boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_update_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)
    update_route = _unwrap_route(module.update)
@ -326,7 +326,7 @@ def test_update_branches(monkeypatch):
    assert "update boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_update_metadata_setting_not_found(monkeypatch):
    module = _load_kb_module(monkeypatch)
    _set_request_json(monkeypatch, module, {"kb_id": "missing-kb", "metadata": {}})
@ -336,7 +336,7 @@ def test_update_metadata_setting_not_found(monkeypatch):
    assert "Database error" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_detail_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -380,7 +380,7 @@ def test_detail_branches(monkeypatch):
    assert "detail boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_list_kbs_owner_ids_and_desc(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -414,7 +414,7 @@ def test_list_kbs_owner_ids_and_desc(monkeypatch):
    assert "list boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_rm_and_rm_sync_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -491,7 +491,7 @@ def test_rm_and_rm_sync_branches(monkeypatch):
    assert "rm boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_tags_and_meta_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -560,7 +560,7 @@ def test_tags_and_meta_branches(monkeypatch):
    assert res["data"]["finished"] == 1, res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_knowledge_graph_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -636,7 +636,7 @@ def test_knowledge_graph_branches(monkeypatch):
    assert res["data"] is True, res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_list_pipeline_logs_validation_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -681,7 +681,7 @@ def test_list_pipeline_logs_validation_branches(monkeypatch):
    assert "Create data filter is abnormal." in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_list_pipeline_logs_filter_and_exception_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -718,7 +718,7 @@ def test_list_pipeline_logs_filter_and_exception_branches(monkeypatch):
    assert "logs boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_list_pipeline_dataset_logs_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -792,7 +792,7 @@ def test_list_pipeline_dataset_logs_branches(monkeypatch):
    assert "dataset logs boom" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_pipeline_log_detail_and_delete_routes_branches(monkeypatch):
    module = _load_kb_module(monkeypatch)

@ -841,7 +841,7 @@ def test_pipeline_log_detail_and_delete_routes_branches(monkeypatch):
    assert res["data"]["id"] == "log-1", res


-@pytest.mark.p3
+@pytest.mark.p2
@pytest.mark.parametrize(
    "route_name,task_attr,response_key,task_type",
    [
@ -914,7 +914,7 @@ def test_run_pipeline_task_routes_branch_matrix(monkeypatch, route_name, task_at
    assert queue_calls["doc_ids"] == ["doc-1", "doc-2"], queue_calls


-@pytest.mark.p3
+@pytest.mark.p2
@pytest.mark.parametrize(
    "route_name,task_attr,empty_on_missing_task,error_text",
    [
@ -970,7 +970,7 @@ def test_trace_pipeline_task_routes_branch_matrix(monkeypatch, route_name, task_
    assert res["data"]["id"] == "task-1", res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_unbind_task_branch_matrix(monkeypatch):
    module = _load_kb_module(monkeypatch)
    route = inspect.unwrap(module.delete_kb_task)
@ -1060,7 +1060,7 @@ def test_unbind_task_branch_matrix(monkeypatch):
    assert "cannot delete task" in res["message"], res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_check_embedding_similarity_threshold_matrix_unit(monkeypatch):
    module = _load_kb_module(monkeypatch)
    route = inspect.unwrap(module.check_embedding)
@ -1229,7 +1229,7 @@ def test_check_embedding_similarity_threshold_matrix_unit(monkeypatch):
    assert res["data"]["summary"]["avg_cos_sim"] > 0.9, res


-@pytest.mark.p3
+@pytest.mark.p2
 def test_check_embedding_error_and_empty_sample_paths_unit(monkeypatch):
    module = _load_kb_module(monkeypatch)
    route = inspect.unwrap(module.check_embedding)
--- a/test/testcases/test_web_api/test_kb_app/test_kb_tags_meta.py
+++ b/test/testcases/test_web_api/test_kb_app/test_kb_tags_meta.py
@ -16,7 +16,7 @@
 import uuid

 import pytest
-from test_web_api.common import (
+from common import (
    delete_knowledge_graph,
    kb_basic_info,
    kb_get_meta,
--- a/test/testcases/test_web_api/test_kb_app/test_list_kbs.py
+++ b/test/testcases/test_web_api/test_kb_app/test_list_kbs.py
@ -13,11 +13,10 @@
 #  See the License for the specific language governing permissions and
 #  limitations under the License.
 #
-import json
 from concurrent.futures import ThreadPoolExecutor, as_completed

 import pytest
-from common import list_datasets
+from common import list_kbs
 from configs import INVALID_API_TOKEN
 from libs.auth import RAGFlowWebApiAuth
 from utils import is_sorted
@ -33,7 +32,7 @@ class TestAuthorization:
        ],
    )
    def test_auth_invalid(self, invalid_auth, expected_code, expected_message):
-        res = list_datasets(invalid_auth)
+        res = list_kbs(invalid_auth)
        assert res["code"] == expected_code, res
        assert res["message"] == expected_message, res

@ -43,7 +42,7 @@ class TestCapability:
    def test_concurrent_list(self, WebApiAuth):
        count = 100
        with ThreadPoolExecutor(max_workers=5) as executor:
-            futures = [executor.submit(list_datasets, WebApiAuth) for i in range(count)]
+            futures = [executor.submit(list_kbs, WebApiAuth) for i in range(count)]
        responses = list(as_completed(futures))
        assert len(responses) == count, responses
        assert all(future.result()["code"] == 0 for future in futures)
@ -53,15 +52,15 @@ class TestCapability:
 class TestDatasetsList:
    @pytest.mark.p2
    def test_params_unset(self, WebApiAuth):
-        res = list_datasets(WebApiAuth, None)
+        res = list_kbs(WebApiAuth, None)
        assert res["code"] == 0, res
-        assert len(res["data"]) == 5, res
+        assert len(res["data"]["kbs"]) == 5, res

    @pytest.mark.p2
    def test_params_empty(self, WebApiAuth):
-        res = list_datasets(WebApiAuth, {})
+        res = list_kbs(WebApiAuth, {})
        assert res["code"] == 0, res
-        assert len(res["data"]) == 5, res
+        assert len(res["data"]["kbs"]) == 5, res

    @pytest.mark.p1
    @pytest.mark.parametrize(
@ -76,9 +75,9 @@ class TestDatasetsList:
        ids=["normal_middle_page", "normal_last_partial_page", "beyond_max_page", "string_page_number", "full_data_single_page"],
    )
    def test_page(self, WebApiAuth, params, expected_page_size):
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == 0, res
-        assert len(res["data"]) == expected_page_size, res
+        assert len(res["data"]["kbs"]) == expected_page_size, res

    @pytest.mark.skip
    @pytest.mark.p2
@ -91,16 +90,16 @@ class TestDatasetsList:
        ids=["page_0", "page_a"],
    )
    def test_page_invalid(self, WebApiAuth, params, expected_code, expected_message):
-        res = list_datasets(WebApiAuth, params=params)
+        res = list_kbs(WebApiAuth, params=params)
        assert res["code"] == expected_code, res
        assert expected_message in res["message"], res

    @pytest.mark.p2
    def test_page_none(self, WebApiAuth):
        params = {"page": None}
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == 0, res
-        assert len(res["data"]) == 5, res
+        assert len(res["data"]["kbs"]) == 5, res

    @pytest.mark.p1
    @pytest.mark.parametrize(
@ -115,9 +114,9 @@ class TestDatasetsList:
        ids=["min_valid_page_size", "medium_page_size", "page_size_equals_total", "page_size_exceeds_total", "string_type_page_size"],
    )
    def test_page_size(self, WebApiAuth, params, expected_page_size):
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == 0, res
-        assert len(res["data"]) == expected_page_size, res
+        assert len(res["data"]["kbs"]) == expected_page_size, res

    @pytest.mark.skip
    @pytest.mark.p2
@ -129,27 +128,27 @@ class TestDatasetsList:
        ],
    )
    def test_page_size_invalid(self, WebApiAuth, params, expected_code, expected_message):
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == expected_code, res
        assert expected_message in res["message"], res

    @pytest.mark.p2
    def test_page_size_none(self, WebApiAuth):
        params = {"page_size": None}
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == 0, res
-        assert len(res["data"]) == 5, res
+        assert len(res["data"]["kbs"]) == 5, res

    @pytest.mark.p3
    @pytest.mark.parametrize(
        "params, assertions",
        [
-            ({"orderby": "update_time"}, lambda r: (is_sorted(r["data"], "update_time", True))),
+            ({"orderby": "update_time"}, lambda r: (is_sorted(r["data"]["kbs"], "update_time", True))),
        ],
        ids=["orderby_update_time"],
    )
    def test_orderby(self, WebApiAuth, params, assertions):
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == 0, res
        if callable(assertions):
            assert assertions(res), res
@ -158,13 +157,13 @@ class TestDatasetsList:
    @pytest.mark.parametrize(
        "params, assertions",
        [
-            ({"desc": "True"}, lambda r: (is_sorted(r["data"], "update_time", True))),
-            ({"desc": "False"}, lambda r: (is_sorted(r["data"], "update_time", False))),
+            ({"desc": "True"}, lambda r: (is_sorted(r["data"]["kbs"], "update_time", True))),
+            ({"desc": "False"}, lambda r: (is_sorted(r["data"]["kbs"], "update_time", False))),
        ],
        ids=["desc=True", "desc=False"],
    )
    def test_desc(self, WebApiAuth, params, assertions):
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)

        assert res["code"] == 0, res
        if callable(assertions):
@ -174,28 +173,29 @@ class TestDatasetsList:
    @pytest.mark.parametrize(
        "params, expected_page_size",
        [
-            ({"ext": json.dumps({"parser_id": "naive"})}, 5),
-            ({"ext": json.dumps({"parser_id": "qa"})}, 0),
+            ({"parser_id": "naive"}, 5),
+            ({"parser_id": "qa"}, 0),
        ],
        ids=["naive", "dqa"],
    )
    def test_parser_id(self, WebApiAuth, params, expected_page_size):
-        res = list_datasets(WebApiAuth, params)
+        res = list_kbs(WebApiAuth, params)
        assert res["code"] == 0, res
-        assert len(res["data"]) == expected_page_size, res
+        assert len(res["data"]["kbs"]) == expected_page_size, res

    @pytest.mark.p2
    def test_owner_ids_payload_mode(self, WebApiAuth):
-        base_res = list_datasets(WebApiAuth, {"page_size": 10})
+        base_res = list_kbs(WebApiAuth, {"page_size": 10})
        assert base_res["code"] == 0, base_res
-        assert base_res["data"], base_res
-        owner_id = base_res["data"][0]["tenant_id"]
+        assert base_res["data"]["kbs"], base_res
+        owner_id = base_res["data"]["kbs"][0]["tenant_id"]

-        res = list_datasets(
+        res = list_kbs(
            WebApiAuth,
-            params={"page": 1, "page_size": 2, "desc": "false", "ext": json.dumps({"owner_ids": [owner_id]})},
+            params={"page": 1, "page_size": 2, "desc": "false"},
+            payload={"owner_ids": [owner_id]},
        )
        assert res["code"] == 0, res
-        assert res["total_datasets"] >= len(res["data"]), res
-        assert len(res["data"]) <= 2, res
-        assert all(kb["tenant_id"] == owner_id for kb in res["data"]), res
+        assert res["data"]["total"] >= len(res["data"]["kbs"]), res
+        assert len(res["data"]["kbs"]) <= 2, res
+        assert all(kb["tenant_id"] == owner_id for kb in res["data"]["kbs"]), res
--- a/test/testcases/test_web_api/test_kb_app/test_rm_kb.py
+++ b/test/testcases/test_web_api/test_kb_app/test_rm_kb.py
@ -16,8 +16,8 @@

 import pytest
 from common import (
-    list_datasets,
-    delete_datasets,
+    list_kbs,
+    rm_kb,
 )
 from configs import INVALID_API_TOKEN
 from libs.auth import RAGFlowWebApiAuth
@ -33,7 +33,7 @@ class TestAuthorization:
        ],
    )
    def test_auth_invalid(self, invalid_auth, expected_code, expected_message):
-        res = delete_datasets(invalid_auth)
+        res = rm_kb(invalid_auth)
        assert res["code"] == expected_code, res
        assert res["message"] == expected_message, res

@ -42,20 +42,20 @@ class TestDatasetsDelete:
    @pytest.mark.p1
    def test_kb_id(self, WebApiAuth, add_datasets_func):
        kb_ids = add_datasets_func
-        payload = {"ids": [kb_ids[0]]}
-        res = delete_datasets(WebApiAuth, payload)
+        payload = {"kb_id": kb_ids[0]}
+        res = rm_kb(WebApiAuth, payload)
        assert res["code"] == 0, res

-        res = list_datasets(WebApiAuth)
-        assert len(res["data"]) == 2, res
+        res = list_kbs(WebApiAuth)
+        assert len(res["data"]["kbs"]) == 2, res

    @pytest.mark.p2
    @pytest.mark.usefixtures("add_dataset_func")
    def test_id_wrong_uuid(self, WebApiAuth):
-        payload = {"ids": ["d94a8dc02c9711f0930f7fbc369eab6d"]}
-        res = delete_datasets(WebApiAuth, payload)
-        assert res["code"] == 102, res
-        assert "lacks permission" in res["message"], res
+        payload = {"kb_id": "d94a8dc02c9711f0930f7fbc369eab6d"}
+        res = rm_kb(WebApiAuth, payload)
+        assert res["code"] == 109, res
+        assert "No authorization." in res["message"], res

-        res = list_datasets(WebApiAuth)
-        assert len(res["data"]) == 1, res
+        res = list_kbs(WebApiAuth)
+        assert len(res["data"]["kbs"]) == 1, res
--- a/test/testcases/test_web_api/test_kb_app/test_update_kb.py
+++ b/test/testcases/test_web_api/test_kb_app/test_update_kb.py
@ -17,7 +17,7 @@ import os
 from concurrent.futures import ThreadPoolExecutor, as_completed

 import pytest
-from test_web_api.common import update_dataset
+from common import update_kb
 from configs import DATASET_NAME_LIMIT, INVALID_API_TOKEN
 from hypothesis import HealthCheck, example, given, settings
 from libs.auth import RAGFlowWebApiAuth
@ -37,7 +37,7 @@ class TestAuthorization:
        ids=["empty_auth", "invalid_api_token"],
    )
    def test_auth_invalid(self, invalid_auth, expected_code, expected_message):
-        res = update_dataset(invalid_auth, "dataset_id")
+        res = update_kb(invalid_auth, "dataset_id")
        assert res["code"] == expected_code, res
        assert res["message"] == expected_message, res

@ -50,13 +50,13 @@ class TestCapability:
        with ThreadPoolExecutor(max_workers=5) as executor:
            futures = [
                executor.submit(
-                    update_dataset,
+                    update_kb,
                    WebApiAuth,
-                    dataset_id,
                    {
+                        "kb_id": dataset_id,
                        "name": f"dataset_{i}",
                        "description": "",
-                        "chunk_method": "naive",
+                        "parser_id": "naive",
                    },
                )
                for i in range(count)
@ -69,8 +69,8 @@ class TestCapability:
 class TestDatasetUpdate:
    @pytest.mark.p3
    def test_dataset_id_not_uuid(self, WebApiAuth):
-        payload = {"name": "not uuid", "description": "", "chunk_method": "naive"}
-        res = update_dataset(WebApiAuth, "not_uuid", payload)
+        payload = {"name": "not uuid", "description": "", "parser_id": "naive", "kb_id": "not_uuid"}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 109, res
        assert "No authorization." in res["message"], res

@ -81,8 +81,8 @@ class TestDatasetUpdate:
    @settings(max_examples=20, suppress_health_check=[HealthCheck.function_scoped_fixture], deadline=None)
    def test_name(self, WebApiAuth, add_dataset_func, name):
        dataset_id = add_dataset_func
-        payload = {"name": name, "description": "", "chunk_method": "naive"}
-        res = update_dataset(WebApiAuth, dataset_id, payload)
+        payload = {"name": name, "description": "", "parser_id": "naive", "kb_id": dataset_id}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["name"] == name, res

@ -90,27 +90,27 @@ class TestDatasetUpdate:
    @pytest.mark.parametrize(
        "name, expected_message",
        [
-            ("", "Field: <name> - Message: <String should have at least 1 character>"),
-            (" ", "Field: <name> - Message: <String should have at least 1 character>"),
-            ("a" * (DATASET_NAME_LIMIT + 1), "Field: <name> - Message: <String should have at most 128 characters>"),
-            (0, "Field: <name> - Message: <Input should be a valid string>"),
-            (None, "Field: <name> - Message: <Input should be a valid string>"),
+            ("", "Dataset name can't be empty."),
+            (" ", "Dataset name can't be empty."),
+            ("a" * (DATASET_NAME_LIMIT + 1), "Dataset name length is 129 which is large than 128"),
+            (0, "Dataset name must be string."),
+            (None, "Dataset name must be string."),
        ],
        ids=["empty_name", "space_name", "too_long_name", "invalid_name", "None_name"],
    )
    def test_name_invalid(self, WebApiAuth, add_dataset_func, name, expected_message):
        kb_id = add_dataset_func
-        payload = {"name": name, "description": "", "chunk_method": "naive"}
-        res = update_dataset(WebApiAuth, kb_id, payload)
-        assert res["code"] == 101, res
+        payload = {"name": name, "description": "", "parser_id": "naive", "kb_id": kb_id}
+        res = update_kb(WebApiAuth, payload)
+        assert res["code"] == 102, res
        assert expected_message in res["message"], res

    @pytest.mark.p3
    def test_name_duplicated(self, WebApiAuth, add_datasets_func):
        kb_id = add_datasets_func[0]
        name = "kb_1"
-        payload = {"name": name, "description": "", "chunk_method": "naive"}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": name, "description": "", "parser_id": "naive", "kb_id": kb_id}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 102, res
        assert res["message"] == "Duplicated dataset name.", res

@ -118,8 +118,8 @@ class TestDatasetUpdate:
    def test_name_case_insensitive(self, WebApiAuth, add_datasets_func):
        kb_id = add_datasets_func[0]
        name = "KB_1"
-        payload = {"name": name, "description": "", "chunk_method": "naive"}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": name, "description": "", "parser_id": "naive", "kb_id": kb_id}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 102, res
        assert res["message"] == "Duplicated dataset name.", res

@ -130,18 +130,19 @@ class TestDatasetUpdate:
        payload = {
            "name": "avatar",
            "description": "",
-            "chunk_method": "naive",
+            "parser_id": "naive",
+            "kb_id": kb_id,
            "avatar": f"data:image/png;base64,{encode_avatar(fn)}",
        }
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["avatar"] == f"data:image/png;base64,{encode_avatar(fn)}", res

    @pytest.mark.p2
    def test_description(self, WebApiAuth, add_dataset_func):
        kb_id = add_dataset_func
-        payload = {"name": "description", "description": "description", "chunk_method": "naive"}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "description", "description": "description", "parser_id": "naive", "kb_id": kb_id}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["description"] == "description", res

@ -156,10 +157,10 @@ class TestDatasetUpdate:
    )
    def test_embedding_model(self, WebApiAuth, add_dataset_func, embedding_model):
        kb_id = add_dataset_func
-        payload = {"name": "embedding_model", "description": "", "chunk_method": "naive", "embedding_model": embedding_model}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "embedding_model", "description": "", "parser_id": "naive", "kb_id": kb_id, "embd_id": embedding_model}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
-        assert res["data"]["embedding_model"] == embedding_model, res
+        assert res["data"]["embd_id"] == embedding_model, res

    @pytest.mark.p2
    @pytest.mark.parametrize(
@ -172,8 +173,8 @@ class TestDatasetUpdate:
    )
    def test_permission(self, WebApiAuth, add_dataset_func, permission):
        kb_id = add_dataset_func
-        payload = {"name": "permission", "description": "", "chunk_method": "naive", "permission": permission}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "permission", "description": "", "parser_id": "naive", "kb_id": kb_id, "permission": permission}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["permission"] == permission.lower().strip(), res

@ -198,17 +199,17 @@ class TestDatasetUpdate:
    )
    def test_chunk_method(self, WebApiAuth, add_dataset_func, chunk_method):
        kb_id = add_dataset_func
-        payload = {"name": "chunk_method", "description": "", "chunk_method": chunk_method}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "chunk_method", "description": "", "parser_id": chunk_method, "kb_id": kb_id}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
-        assert res["data"]["chunk_method"] == chunk_method, res
+        assert res["data"]["parser_id"] == chunk_method, res

    @pytest.mark.p1
    @pytest.mark.skipif(os.getenv("DOC_ENGINE") != "infinity", reason="Infinity does not support parser_id=tag")
    def test_chunk_method_tag_with_infinity(self, WebApiAuth, add_dataset_func):
        kb_id = add_dataset_func
-        payload = {"name": "chunk_method", "description": "", "chunk_method": "tag"}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "chunk_method", "description": "", "parser_id": "tag", "kb_id": kb_id}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 103, res
        assert res["message"] == "The chunking method Tag has not been supported by Infinity yet.", res

@ -217,8 +218,8 @@ class TestDatasetUpdate:
    @pytest.mark.parametrize("pagerank", [0, 50, 100], ids=["min", "mid", "max"])
    def test_pagerank(self, WebApiAuth, add_dataset_func, pagerank):
        kb_id = add_dataset_func
-        payload = {"name": "pagerank", "description": "", "chunk_method": "naive", "pagerank": pagerank}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "pagerank", "description": "", "parser_id": "naive", "kb_id": kb_id, "pagerank": pagerank}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["pagerank"] == pagerank, res

@ -226,13 +227,13 @@ class TestDatasetUpdate:
    @pytest.mark.p2
    def test_pagerank_set_to_0(self, WebApiAuth, add_dataset_func):
        kb_id = add_dataset_func
-        payload = {"name": "pagerank", "description": "", "chunk_method": "naive", "pagerank": 50}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "pagerank", "description": "", "parser_id": "naive", "kb_id": kb_id, "pagerank": 50}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["pagerank"] == 50, res

-        payload = {"name": "pagerank", "description": "", "chunk_method": "naive", "pagerank": 0}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "pagerank", "description": "", "parser_id": "naive", "kb_id": kb_id, "pagerank": 0}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
        assert res["data"]["pagerank"] == 0, res

@ -240,8 +241,8 @@ class TestDatasetUpdate:
    @pytest.mark.p2
    def test_pagerank_infinity(self, WebApiAuth, add_dataset_func):
        kb_id = add_dataset_func
-        payload = {"name": "pagerank", "description": "", "chunk_method": "naive", "pagerank": 50}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "pagerank", "description": "", "parser_id": "naive", "kb_id": kb_id, "pagerank": 50}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 102, res
        assert res["message"] == "'pagerank' can only be set when doc_engine is elasticsearch", res

@ -351,15 +352,10 @@ class TestDatasetUpdate:
    )
    def test_parser_config(self, WebApiAuth, add_dataset_func, parser_config):
        kb_id = add_dataset_func
-        payload = {"name": "parser_config", "description": "", "chunk_method": "naive", "parser_config": parser_config}
-        res = update_dataset(WebApiAuth, kb_id, payload)
+        payload = {"name": "parser_config", "description": "", "parser_id": "naive", "kb_id": kb_id, "parser_config": parser_config}
+        res = update_kb(WebApiAuth, payload)
        assert res["code"] == 0, res
-        for key, value in parser_config.items():
-            if not isinstance(value, dict):
-                assert res["data"]["parser_config"].get(key) == value, res
-            else:
-                for sub_key, sub_value in value.items():
-                    assert res["data"]["parser_config"].get(key, {}).get(sub_key) == sub_value, res
+        assert res["data"]["parser_config"] == parser_config, res

    @pytest.mark.p2
    @pytest.mark.parametrize(
@ -376,7 +372,7 @@ class TestDatasetUpdate:
    )
    def test_field_unsupported(self, WebApiAuth, add_dataset_func, payload):
        kb_id = add_dataset_func
-        full_payload = {"name": "field_unsupported", "description": "", "chunk_method": "naive", **payload}
-        res = update_dataset(WebApiAuth, kb_id, full_payload)
+        full_payload = {"name": "field_unsupported", "description": "", "parser_id": "naive", "kb_id": kb_id, **payload}
+        res = update_kb(WebApiAuth, full_payload)
        assert res["code"] == 101, res
-        assert "are not permitted" in res["message"], res
+        assert "isn't allowed" in res["message"], res
--- a/web/src/components/chunk-method-dialog/index.tsx
+++ b/web/src/components/chunk-method-dialog/index.tsx
@ -181,7 +181,7 @@ export function ChunkMethodDialog({
  });

  const selectedTag = useWatch({
-    name: 'chunk_method',
+    name: 'parser_id',
    control: form.control,
  });
  const isMineruSelected =
--- a/web/src/components/knowledge-base-item.tsx
+++ b/web/src/components/knowledge-base-item.tsx
@ -23,7 +23,7 @@ export function useDisableDifferenceEmbeddingDataset() {

  useEffect(() => {
    const datasetListMap = datasetListOrigin
-      .filter((x) => x.chunk_method !== DocumentParserType.Tag)
+      .filter((x) => x.parser_id !== DocumentParserType.Tag)
      .map((item: IKnowledge) => {
        return {
          label: item.name,
@ -36,12 +36,12 @@ export function useDisableDifferenceEmbeddingDataset() {
          ),
          suffix: (
            <div className="text-xs px-4 p-1 bg-bg-card text-text-secondary rounded-lg border border-bg-card">
-              {item.embedding_model}
+              {item.embd_id}
            </div>
          ),
          value: item.id,
          disabled:
-            item.embedding_model !== datasetSelectEmbedId &&
+            item.embd_id !== datasetSelectEmbedId &&
            datasetSelectEmbedId !== '',
        };
      });
@ -54,7 +54,7 @@ export function useDisableDifferenceEmbeddingDataset() {
  ) => {
    if (value.length) {
      const data = datasetListOrigin?.find((item) => item.id === value[0]);
-      setDatasetSelectEmbedId(data?.embedding_model ?? '');
+      setDatasetSelectEmbedId(data?.embd_id ?? '');
    } else {
      setDatasetSelectEmbedId('');
    }
--- a/web/src/components/ui/multi-select.tsx
+++ b/web/src/components/ui/multi-select.tsx
@ -242,9 +242,7 @@ export const MultiSelect = React.forwardRef<

    const disabledValueSet = React.useMemo(() => {
      return new Set(
-        flatOptions
-          .filter((option) => option.disabled)
-          .map((option) => option.value),
+        flatOptions.filter((option) => option.disabled).map((option) => option.value),
      );
    }, [flatOptions]);

--- a/web/src/hooks/use-knowledge-request.ts
+++ b/web/src/hooks/use-knowledge-request.ts
@ -18,7 +18,6 @@ import kbService, {
  listTag,
  removeTag,
  renameTag,
-  updateKb,
 } from '@/services/knowledge-service';
 import {
  useIsMutating,
@ -138,20 +137,22 @@ export const useFetchNextKnowledgeListByPage = () => {
    ],
    initialData: {
      kbs: [],
-      total_datasets: 0,
+      total: 0,
    },
    gcTime: 0,
    queryFn: async () => {
-      const { data } = await listDataset({
-        page_size: pagination.pageSize,
-        page: pagination.current,
-        ext: {
+      const { data } = await listDataset(
+        {
          keywords: debouncedSearchString,
+          page_size: pagination.pageSize,
+          page: pagination.current,
+        },
+        {
          owner_ids: filterValue.owner,
        },
-      });
+      );

-      return { kbs: data?.data, total_datasets: data?.total_datasets };
+      return data?.data;
    },
  });

@ -167,7 +168,7 @@ export const useFetchNextKnowledgeListByPage = () => {
    ...data,
    searchString,
    handleInputChange: onInputChange,
-    pagination: { ...pagination, total: data?.total_datasets },
+    pagination: { ...pagination, total: data?.total },
    setPagination,
    loading,
    filterValue,
@ -183,18 +184,7 @@ export const useCreateKnowledge = () => {
    mutateAsync,
  } = useMutation({
    mutationKey: [KnowledgeApiAction.CreateKnowledge],
-    mutationFn: async (params: {
-      id?: string;
-      name: string;
-      embedding_model?: string;
-      chunk_method?: string;
-      parseType?: number;
-      pipeline_id?: string | null;
-      ext?: {
-        language?: string;
-        [key: string]: any;
-      };
-    }) => {
+    mutationFn: async (params: { id?: string; name: string }) => {
      const { data = {} } = await kbService.createKb(params);
      if (data.code === 0) {
        message.success(
@ -218,7 +208,7 @@ export const useDeleteKnowledge = () => {
  } = useMutation({
    mutationKey: [KnowledgeApiAction.DeleteKnowledge],
    mutationFn: async (id: string) => {
-      const { data } = await kbService.rmKb({ ids: [id] });
+      const { data } = await kbService.rmKb({ kb_id: id });
      if (data.code === 0) {
        message.success(i18n.t(`message.deleted`));
        queryClient.invalidateQueries({
@ -235,119 +225,17 @@ export const useDeleteKnowledge = () => {
 export const useUpdateKnowledge = (shouldFetchList = false) => {
  const knowledgeBaseId = useKnowledgeBaseId();
  const queryClient = useQueryClient();
-
-  const extractRaptorConfigExt = (
-    raptorConfig: Record<string, any> | undefined,
-  ) => {
-    if (!raptorConfig) return raptorConfig;
-    const {
-      use_raptor,
-      prompt,
-      max_token,
-      threshold,
-      max_cluster,
-      random_seed,
-      auto_disable_for_structured_data,
-      ext,
-      ...raptorExt
-    } = raptorConfig;
-    return {
-      use_raptor,
-      prompt,
-      max_token,
-      threshold,
-      max_cluster,
-      random_seed,
-      auto_disable_for_structured_data,
-      ext: { ...ext, ...raptorExt },
-    };
-  };
-
-  const extractParserConfigExt = (
-    parserConfig: Record<string, any> | undefined,
-  ) => {
-    if (!parserConfig) return parserConfig;
-    const {
-      auto_keywords,
-      auto_questions,
-      chunk_token_num,
-      delimiter,
-      graphrag,
-      html4excel,
-      layout_recognize,
-      raptor,
-      tag_kb_ids,
-      topn_tags,
-      filename_embd_weight,
-      task_page_size,
-      pages,
-      ext,
-      ...parserExt
-    } = parserConfig;
-    return {
-      auto_keywords,
-      auto_questions,
-      chunk_token_num,
-      delimiter,
-      graphrag,
-      html4excel,
-      layout_recognize,
-      raptor: extractRaptorConfigExt(raptor),
-      tag_kb_ids,
-      topn_tags,
-      filename_embd_weight,
-      task_page_size,
-      pages,
-      ext: { ...ext, ...parserExt },
-    };
-  };
-
  const {
    data,
    isPending: loading,
    mutateAsync,
  } = useMutation({
    mutationKey: [KnowledgeApiAction.SaveKnowledge],
-    mutationFn: async (params: {
-      kb_id?: string;
-      name?: string;
-      embedding_model?: string;
-      chunk_method?: string;
-      pipeline_id?: string | null;
-      avatar?: string | null;
-      description?: string;
-      permission?: string;
-      pagerank?: number;
-      parser_config?: Record<string, any>;
-      [key: string]: any;
-    }) => {
-      const kbId = params?.kb_id || knowledgeBaseId;
-      const {
-        kb_id,
-        name,
-        embedding_model,
-        chunk_method,
-        pipeline_id,
-        avatar,
-        description,
-        permission,
-        pagerank,
-        parser_config,
-        ...ext
-      } = params;
-      const requestBody: Record<string, any> = {
-        name,
-        embedding_model,
-        chunk_method,
-        pipeline_id,
-        avatar,
-        description,
-        permission,
-        pagerank,
-        parser_config: extractParserConfigExt(parser_config),
-        ext,
-      };
-      const { data = {} } = await updateKb(kbId, requestBody);
+    mutationFn: async (params: Record<string, any>) => {
+      const { data = {} } = await kbService.updateKb({
+        kb_id: params?.kb_id ? params?.kb_id : knowledgeBaseId,
+        ...params,
+      });
      if (data.code === 0) {
        message.success(i18n.t(`message.updated`));
        if (shouldFetchList) {
@ -471,9 +359,9 @@ export const useFetchKnowledgeList = (
    gcTime: 0, // https://tanstack.com/query/latest/docs/framework/react/guides/caching?from=reactQueryV3
    queryFn: async () => {
      const { data } = await listDataset();
-      const list = data?.data ?? [];
+      const list = data?.data?.kbs ?? [];
      return shouldFilterListWithoutDocument
-        ? list.filter((x: IKnowledge) => x.chunk_count > 0)
+        ? list.filter((x: IKnowledge) => x.chunk_num > 0)
        : list;
    },
  });
--- a/web/src/interfaces/database/knowledge.ts
+++ b/web/src/interfaces/database/knowledge.ts
@ -11,16 +11,16 @@ export interface IConnector {
 // knowledge base
 export interface IKnowledge {
  avatar?: any;
-  chunk_count: number;
+  chunk_num: number;
  create_date: string;
  create_time: number;
  created_by: string;
  description: string;
-  document_count: number;
+  doc_num: number;
  id: string;
  name: string;
  parser_config: ParserConfig;
-  chunk_method: string;
+  parser_id: string;
  pipeline_id: string;
  pipeline_name: string;
  pipeline_avatar: string;
@ -32,7 +32,7 @@ export interface IKnowledge {
  update_date: string;
  update_time: number;
  vector_similarity_weight: number;
-  embedding_model: string;
+  embd_id: string;
  nickname: string;
  operator_permission: number;
  size: number;
@ -47,7 +47,7 @@ export interface IKnowledge {

 export interface IKnowledgeResult {
  kbs: IKnowledge[];
-  total_datasets: number;
+  total: number;
 }

 export interface Raptor {
--- a/web/src/interfaces/request/knowledge.ts
+++ b/web/src/interfaces/request/knowledge.ts
@ -24,14 +24,10 @@ export interface IFetchKnowledgeListRequestBody {
 }

 export interface IFetchKnowledgeListRequestParams {
-  id?: string;
+  kb_id?: string;
+  keywords?: string;
  page?: number;
  page_size?: number;
-  ext?: {
-    keywords?: string;
-    owner_ids?: string[];
-    parser_id?: string;
-  };
 }

 export interface IFetchDocumentListRequestBody {
--- a/web/src/pages/dataset/dataset-setting/chunk-method-form.tsx
+++ b/web/src/pages/dataset/dataset-setting/chunk-method-form.tsx
@ -45,7 +45,7 @@ export function ChunkMethodForm() {

  const finalParserId: DocumentParserType = useWatch({
    control: form.control,
-    name: 'chunk_method',
+    name: 'parser_id',
  });

  const ConfigurationComponent = useMemo(() => {
--- a/web/src/pages/dataset/dataset-setting/configuration/common-item.tsx
+++ b/web/src/pages/dataset/dataset-setting/configuration/common-item.tsx
@ -69,7 +69,7 @@ export function ChunkMethodItem(props: IProps) {
  return (
    <FormField
      control={form.control}
-      name={'chunk_method'}
+      name={'parser_id'}
      render={({ field }) => (
        <FormItem className=" items-center space-y-1">
          <div className={line === 1 ? 'flex items-center' : ''}>
@ -121,7 +121,7 @@ export const EmbeddingSelect = ({
  const { handleChange } = useHandleKbEmbedding();

  const oldValue = useMemo(() => {
-    const embdStr = form.getValues(name || 'embedding_model');
+    const embdStr = form.getValues(name || 'embd_id');
    return embdStr || '';
  }, [form]);
  const [loading, setLoading] = useState(false);
@ -165,7 +165,7 @@ export function EmbeddingModelItem({ line = 1, isEdit }: IProps) {
    <>
      <FormField
        control={form.control}
-        name={'embedding_model'}
+        name={'embd_id'}
        render={({ field }) => (
          <FormItem className={cn(' items-center space-y-0 ')}>
            <div
--- a/web/src/pages/dataset/dataset-setting/form-schema.ts
+++ b/web/src/pages/dataset/dataset-setting/form-schema.ts
@ -12,11 +12,11 @@ export const formSchema = z
    avatar: z.any().nullish(),
    permission: z.string().optional(),
    language: z.string().optional(),
-    chunk_method: z.string(),
+    parser_id: z.string(),
    pipeline_id: z.string().optional(),
    pipeline_name: z.string().optional(),
    pipeline_avatar: z.string().optional(),
-    embedding_model: z.string(),
+    embd_id: z.string(),
    parser_config: z
      .object({
        layout_recognize: z.string(),
--- a/web/src/pages/dataset/dataset-setting/hooks.ts
+++ b/web/src/pages/dataset/dataset-setting/hooks.ts
@ -31,7 +31,7 @@ export function useHasParsedDocument(isEdit?: boolean) {
  const { data: knowledgeDetails } = useFetchKnowledgeBaseConfiguration({
    isEdit,
  });
-  return knowledgeDetails.chunk_count > 0;
+  return knowledgeDetails.chunk_num > 0;
 }

 export const useFetchKnowledgeConfigurationOnMount = (
@ -60,14 +60,14 @@ export const useFetchKnowledgeConfigurationOnMount = (
        'description',
        'name',
        'permission',
+        'embd_id',
+        'parser_id',
        'language',
        'parser_config',
        'connectors',
        'pagerank',
        'avatar',
      ]),
-      embedding_model: knowledgeDetails.embd_id,
-      chunk_method: knowledgeDetails.parser_id,
    } as z.infer<typeof formSchema>;
    form.reset(formValues);
  }, [form, knowledgeDetails]);
--- a/web/src/pages/dataset/dataset-setting/index.tsx
+++ b/web/src/pages/dataset/dataset-setting/index.tsx
@ -219,7 +219,7 @@ export default function DatasetSettings() {
    defaultValue: knowledgeDetails.pipeline_id ? 2 : 1,
  });
  const selectedTag = useWatch({
-    name: 'chunk_method',
+    name: 'parser_id',
    control: form.control,
  });
  useEffect(() => {
--- a/web/src/pages/dataset/dataset-setting/saving-button.tsx
+++ b/web/src/pages/dataset/dataset-setting/saving-button.tsx
@ -16,7 +16,7 @@ export function GeneralSavingButton() {
    () => form.formState.defaultValues ?? {},
    [form.formState.defaultValues],
  );
-  const chunk_method = defaultValues['chunk_method'];
+  const parser_id = defaultValues['parser_id'];

  return (
    <ButtonLoading
@ -31,7 +31,7 @@ export function GeneralSavingButton() {
          if (isValidate) {
            saveKnowledgeConfiguration({
              kb_id,
-              chunk_method,
+              parser_id,
              name,
              description,
              avatar,
--- a/web/src/pages/dataset/dataset/generate-button/hook.ts
+++ b/web/src/pages/dataset/dataset/generate-button/hook.ts
@ -1,12 +1,6 @@
 import message from '@/components/ui/message';
 import agentService from '@/services/agent-service';
-import {
-  deletePipelineTask,
-  runGraphRag,
-  runRaptor,
-  traceGraphRag,
-  traceRaptor,
-} from '@/services/knowledge-service';
+import kbService, { deletePipelineTask } from '@/services/knowledge-service';
 import { useMutation, useQuery, useQueryClient } from '@tanstack/react-query';
 import { t } from 'i18next';
 import { useEffect, useState } from 'react';
@ -59,7 +53,9 @@ export const useTraceGenerate = ({ open }: { open: boolean }) => {
      retryDelay: 1000,
      enabled: open,
      queryFn: async () => {
-        const { data } = await traceGraphRag(id);
+        const { data } = await kbService.traceGraphRag({
+          kb_id: id,
+        });
        return data?.data || {};
      },
    });
@ -74,7 +70,9 @@ export const useTraceGenerate = ({ open }: { open: boolean }) => {
      retryDelay: 1000,
      enabled: open,
      queryFn: async () => {
-        const { data } = await traceRaptor(id);
+        const { data } = await kbService.traceRaptor({
+          kb_id: id,
+        });
        return data?.data || {};
      },
    });
@ -135,8 +133,12 @@ export const useDatasetGenerate = () => {
    mutationKey: [DatasetKey.generate],
    mutationFn: async ({ type }: { type: GenerateType }) => {
      const func =
-        type === GenerateType.KnowledgeGraph ? runGraphRag : runRaptor;
-      const { data } = await func(id);
+        type === GenerateType.KnowledgeGraph
+          ? kbService.runGraphRag
+          : kbService.runRaptor;
+      const { data } = await func({
+        kb_id: id,
+      });
      if (data.code === 0) {
        message.success(t('message.operated'));
        queryClient.invalidateQueries({
--- a/web/src/pages/datasets/dataset-card.tsx
+++ b/web/src/pages/datasets/dataset-card.tsx
@ -23,7 +23,7 @@ export function DatasetCard({
    <HomeCard
      data={{
        ...dataset,
-        description: `${dataset.document_count} ${t('knowledgeDetails.files')}`,
+        description: `${dataset.doc_num} ${t('knowledgeDetails.files')}`,
      }}
      moreDropdown={
        <DatasetDropdown
--- a/web/src/pages/datasets/dataset-creating-dialog.tsx
+++ b/web/src/pages/datasets/dataset-creating-dialog.tsx
@ -46,20 +46,20 @@ export function InputForm({ onOk }: IModalProps<any>) {
        })
        .trim(),
      parseType: z.number().optional(),
-      embedding_model: z
+      embd_id: z
        .string()
        .min(1, {
          message: t('knowledgeConfiguration.embeddingModelPlaceholder'),
        })
        .trim(),
-      chunk_method: z.string().optional(),
+      parser_id: z.string().optional(),
      pipeline_id: z.string().optional(),
    })
    .superRefine((data, ctx) => {
-      // When parseType === 1, chunk_method is required
+      // When parseType === 1, parser_id is required
      if (
        data.parseType === 1 &&
-        (!data.chunk_method || data.chunk_method.trim() === '')
+        (!data.parser_id || data.parser_id.trim() === '')
      ) {
        ctx.addIssue({
          code: z.ZodIssueCode.custom,
@ -82,8 +82,8 @@ export function InputForm({ onOk }: IModalProps<any>) {
    defaultValues: {
      name: '',
      parseType: 1,
-      chunk_method: '',
-      embedding_model: tenantInfo?.embd_id,
+      parser_id: '',
+      embd_id: tenantInfo?.embd_id,
    },
  });

--- a/web/src/pages/datasets/hooks.ts
+++ b/web/src/pages/datasets/hooks.ts
@ -16,14 +16,8 @@ export const useSearchKnowledge = () => {

 export interface Iknowledge {
  name: string;
-  embedding_model?: string;
-  chunk_method?: string;
-  parseType?: number;
-  pipeline_id?: string | null;
-  ext?: {
-    language?: string;
-    [key: string]: any;
-  };
+  embd_id: string;
+  parser_id: string;
 }
 export const useSaveKnowledge = () => {
  const { visible: visible, hideModal, showModal } = useSetModalState();
@ -36,7 +30,7 @@ export const useSaveKnowledge = () => {

      if (ret?.code === 0) {
        hideModal();
-        navigateToDataset(ret.data.id)();
+        navigateToDataset(ret.data.kb_id)();
      }
    },
    [createKnowledge, hideModal, navigateToDataset],
--- a/web/src/pages/datasets/index.tsx
+++ b/web/src/pages/datasets/index.tsx
@ -30,7 +30,7 @@ export default function Datasets() {

  const {
    kbs,
-    total_datasets,
+    total,
    pagination,
    setPagination,
    handleInputChange,
@ -107,7 +107,7 @@ export default function Datasets() {
              <footer className="mt-4 px-5 pb-5">
                <RAGFlowPagination
                  {...pick(pagination, 'current', 'pageSize')}
-                  total={total_datasets}
+                  total={total}
                  onChange={handlePageChange}
                />
              </footer>
--- a/web/src/services/knowledge-service.ts
+++ b/web/src/services/knowledge-service.ts
@ -1,6 +1,7 @@
 import { IRenameTag } from '@/interfaces/database/knowledge';
 import {
  IFetchDocumentListRequestBody,
+  IFetchKnowledgeListRequestBody,
  IFetchKnowledgeListRequestParams,
 } from '@/interfaces/request/knowledge';
 import { ProcessingType } from '@/pages/dataset/dataset-overview/dataset-common';
@ -10,6 +11,7 @@ import request, { post } from '@/utils/request';

 const {
  create_kb,
+  update_kb,
  rm_kb,
  get_kb_detail,
  kb_list,
@ -40,6 +42,10 @@ const {
  getKnowledgeBasicInfo,
  fetchDataPipelineLog,
  fetchPipelineDatasetLogs,
+  runGraphRag,
+  traceGraphRag,
+  runRaptor,
+  traceRaptor,
  check_embedding,
  kbUpdateMetaData,
  documentUpdateMetaData,
@ -50,9 +56,13 @@ const methods = {
    url: create_kb,
    method: 'post',
  },
+  updateKb: {
+    url: update_kb,
+    method: 'post',
+  },
  rmKb: {
    url: rm_kb,
-    method: 'delete',
+    method: 'post',
  },
  get_kb_detail: {
    url: get_kb_detail,
@ -60,7 +70,7 @@ const methods = {
  },
  getList: {
    url: kb_list,
-    method: 'get',
+    method: 'post',
  },
  // document manager
  get_document_list: {
@ -181,6 +191,22 @@ const methods = {
    method: 'get',
  },

+  runGraphRag: {
+    url: runGraphRag,
+    method: 'post',
+  },
+  traceGraphRag: {
+    url: traceGraphRag,
+    method: 'get',
+  },
+  runRaptor: {
+    url: runRaptor,
+    method: 'post',
+  },
+  traceRaptor: {
+    url: traceRaptor,
+    method: 'get',
+  },
  pipelineRerun: {
    url: api.pipelineRerun,
    method: 'post',
@ -225,23 +251,10 @@ export function deleteKnowledgeGraph(knowledgeId: string) {
  return request.delete(api.getKnowledgeGraph(knowledgeId));
 }

-export const listDataset = (params?: IFetchKnowledgeListRequestParams) =>
-  request.get(api.kb_list, { params });
-
-export const updateKb = (datasetId: string, data: Record<string, any>) =>
-  request.put(api.update_kb(datasetId), { data });
-
-export const runGraphRag = (datasetId: string) =>
-  request.post(api.runGraphRag(datasetId));
-
-export const traceGraphRag = (datasetId: string) =>
-  request.get(api.traceGraphRag(datasetId));
-
-export const runRaptor = (datasetId: string) =>
-  request.post(api.runRaptor(datasetId));
-
-export const traceRaptor = (datasetId: string) =>
-  request.get(api.traceRaptor(datasetId));
+export const listDataset = (
+  params?: IFetchKnowledgeListRequestParams,
+  body?: IFetchKnowledgeListRequestBody,
+) => request.post(api.kb_list, { data: body || {}, params });

 export const listDocument = (
  params?: IFetchKnowledgeListRequestParams,
--- a/web/src/utils/api.ts
+++ b/web/src/utils/api.ts
@ -57,30 +57,23 @@ export default {
  // knowledge base

  check_embedding: `${api_host}/kb/check_embedding`,
-  kb_list: `${ExternalApi}${api_host}/datasets`,
-  create_kb: `${ExternalApi}${api_host}/datasets`,
-  update_kb: (datasetId: string) =>
-    `${ExternalApi}${api_host}/datasets/${datasetId}`,
-  rm_kb: `${ExternalApi}${api_host}/datasets`,
+  kb_list: `${api_host}/kb/list`,
+  create_kb: `${api_host}/kb/create`,
+  update_kb: `${api_host}/kb/update`,
+  rm_kb: `${api_host}/kb/rm`,
  get_kb_detail: `${api_host}/kb/detail`,
  getKnowledgeGraph: (knowledgeId: string) =>
-    `${ExternalApi}${api_host}/datasets/${knowledgeId}/knowledge_graph`,
-  deleteKnowledgeGraph: (knowledgeId: string) =>
-    `${ExternalApi}${api_host}/datasets/${knowledgeId}/knowledge_graph`,
+    `${api_host}/kb/${knowledgeId}/knowledge_graph`,
  getMeta: `${api_host}/kb/get_meta`,
  getKnowledgeBasicInfo: `${api_host}/kb/basic_info`,
  // data pipeline log
  fetchDataPipelineLog: `${api_host}/kb/list_pipeline_logs`,
  get_pipeline_detail: `${api_host}/kb/pipeline_log_detail`,
  fetchPipelineDatasetLogs: `${api_host}/kb/list_pipeline_dataset_logs`,
-  runGraphRag: (datasetId: string) =>
-    `${ExternalApi}${api_host}/datasets/${datasetId}/run_graphrag`,
-  traceGraphRag: (datasetId: string) =>
-    `${ExternalApi}${api_host}/datasets/${datasetId}/trace_graphrag`,
-  runRaptor: (datasetId: string) =>
-    `${ExternalApi}${api_host}/datasets/${datasetId}/run_raptor`,
-  traceRaptor: (datasetId: string) =>
-    `${ExternalApi}${api_host}/datasets/${datasetId}/trace_raptor`,
+  runGraphRag: `${api_host}/kb/run_graphrag`,
+  traceGraphRag: `${api_host}/kb/trace_graphrag`,
+  runRaptor: `${api_host}/kb/run_raptor`,
+  traceRaptor: `${api_host}/kb/trace_raptor`,
  unbindPipelineTask: ({ kb_id, type }: { kb_id: string; type: string }) =>
    `${api_host}/kb/unbind_task?kb_id=${kb_id}&pipeline_task_type=${type}`,
  pipelineRerun: `${api_host}/canvas/rerun`,