refactor: decouple database operations from knowledge retrieval nodes (#31981)

Co-authored-by: autofix-ci[bot] <114827586+autofix-ci[bot]@users.noreply.github.com>
2026-05-04 17:38:04 +08:00 · 2026-02-09 13:56:55 +08:00
parent 0428ac5f3a
commit 3348b89436
12 changed files with 2453 additions and 551 deletions
--- a/api/core/workflow/nodes/knowledge_retrieval/exc.py
+++ b/api/core/workflow/nodes/knowledge_retrieval/exc.py
@ -20,3 +20,7 @@ class ModelQuotaExceededError(KnowledgeRetrievalNodeError):

 class InvalidModelTypeError(KnowledgeRetrievalNodeError):
    """Raised when the model is not a Large Language Model."""
+
+
+class RateLimitExceededError(KnowledgeRetrievalNodeError):
+    """Raised when the rate limit is exceeded."""
--- a/api/core/workflow/nodes/knowledge_retrieval/knowledge_retrieval_node.py
+++ b/api/core/workflow/nodes/knowledge_retrieval/knowledge_retrieval_node.py
@ -1,29 +1,10 @@
-import json
 import logging
-import re
-import time
-from collections import defaultdict
 from collections.abc import Mapping, Sequence
-from typing import TYPE_CHECKING, Any, cast
-
-from sqlalchemy import and_, func, or_, select
-from sqlalchemy.orm import sessionmaker
+from typing import TYPE_CHECKING, Any, Literal

 from core.app.app_config.entities import DatasetRetrieveConfigEntity
-from core.app.entities.app_invoke_entities import ModelConfigWithCredentialsEntity
-from core.entities.agent_entities import PlanningStrategy
-from core.entities.model_entities import ModelStatus
-from core.model_manager import ModelInstance, ModelManager
 from core.model_runtime.entities.llm_entities import LLMUsage
-from core.model_runtime.entities.message_entities import PromptMessageRole
-from core.model_runtime.entities.model_entities import ModelFeature, ModelType
-from core.model_runtime.model_providers.__base.large_language_model import LargeLanguageModel
 from core.model_runtime.utils.encoders import jsonable_encoder
-from core.prompt.simple_prompt_transform import ModelMode
-from core.rag.datasource.retrieval_service import RetrievalService
-from core.rag.entities.metadata_entities import Condition, MetadataCondition
-from core.rag.retrieval.dataset_retrieval import DatasetRetrieval
-from core.rag.retrieval.retrieval_methods import RetrievalMethod
 from core.variables import (
    ArrayFileSegment,
    FileSegment,
@ -36,35 +17,16 @@ from core.workflow.enums import (
    WorkflowNodeExecutionMetadataKey,
    WorkflowNodeExecutionStatus,
 )
-from core.workflow.node_events import ModelInvokeCompletedEvent, NodeRunResult
+from core.workflow.node_events import NodeRunResult
 from core.workflow.nodes.base import LLMUsageTrackingMixin
 from core.workflow.nodes.base.node import Node
-from core.workflow.nodes.knowledge_retrieval.template_prompts import (
-    METADATA_FILTER_ASSISTANT_PROMPT_1,
-    METADATA_FILTER_ASSISTANT_PROMPT_2,
-    METADATA_FILTER_COMPLETION_PROMPT,
-    METADATA_FILTER_SYSTEM_PROMPT,
-    METADATA_FILTER_USER_PROMPT_1,
-    METADATA_FILTER_USER_PROMPT_2,
-    METADATA_FILTER_USER_PROMPT_3,
-)
-from core.workflow.nodes.llm.entities import LLMNodeChatModelMessage, LLMNodeCompletionModelPromptTemplate, ModelConfig
 from core.workflow.nodes.llm.file_saver import FileSaverImpl, LLMFileSaver
-from core.workflow.nodes.llm.node import LLMNode
-from extensions.ext_database import db
-from extensions.ext_redis import redis_client
-from libs.json_in_md_parser import parse_and_check_json_markdown
-from models.dataset import Dataset, DatasetMetadata, Document, RateLimitLog
-from services.feature_service import FeatureService
+from core.workflow.repositories.rag_retrieval_protocol import KnowledgeRetrievalRequest, RAGRetrievalProtocol, Source

 from .entities import KnowledgeRetrievalNodeData
 from .exc import (
-    InvalidModelTypeError,
    KnowledgeRetrievalNodeError,
-    ModelCredentialsNotInitializedError,
-    ModelNotExistError,
-    ModelNotSupportedError,
-    ModelQuotaExceededError,
+    RateLimitExceededError,
 )

 if TYPE_CHECKING:
@ -73,14 +35,6 @@ if TYPE_CHECKING:

 logger = logging.getLogger(__name__)

-default_retrieval_model = {
-    "search_method": RetrievalMethod.SEMANTIC_SEARCH,
-    "reranking_enable": False,
-    "reranking_model": {"reranking_provider_name": "", "reranking_model_name": ""},
-    "top_k": 4,
-    "score_threshold_enabled": False,
-}
-

 class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeData]):
    node_type = NodeType.KNOWLEDGE_RETRIEVAL
@ -97,6 +51,7 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
        config: Mapping[str, Any],
        graph_init_params: "GraphInitParams",
        graph_runtime_state: "GraphRuntimeState",
+        rag_retrieval: RAGRetrievalProtocol,
        *,
        llm_file_saver: LLMFileSaver | None = None,
    ):
@ -108,6 +63,7 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
        )
        # LLM file outputs, used for MultiModal outputs.
        self._file_outputs = []
+        self._rag_retrieval = rag_retrieval

        if llm_file_saver is None:
            llm_file_saver = FileSaverImpl(
@ -121,6 +77,7 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
        return "1"

    def _run(self) -> NodeRunResult:
+        usage = LLMUsage.empty_usage()
        if not self._node_data.query_variable_selector and not self._node_data.query_attachment_selector:
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.SUCCEEDED,
@ -128,7 +85,7 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
                process_data={},
                outputs={},
                metadata={},
-                llm_usage=LLMUsage.empty_usage(),
+                llm_usage=usage,
            )
        variables: dict[str, Any] = {}
        # extract variables
@ -156,36 +113,9 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
            else:
                variables["attachments"] = [variable.value]

-        # TODO(-LAN-): Move this check outside.
-        # check rate limit
-        knowledge_rate_limit = FeatureService.get_knowledge_rate_limit(self.tenant_id)
-        if knowledge_rate_limit.enabled:
-            current_time = int(time.time() * 1000)
-            key = f"rate_limit_{self.tenant_id}"
-            redis_client.zadd(key, {current_time: current_time})
-            redis_client.zremrangebyscore(key, 0, current_time - 60000)
-            request_count = redis_client.zcard(key)
-            if request_count > knowledge_rate_limit.limit:
-                with sessionmaker(db.engine).begin() as session:
-                    # add ratelimit record
-                    rate_limit_log = RateLimitLog(
-                        tenant_id=self.tenant_id,
-                        subscription_plan=knowledge_rate_limit.subscription_plan,
-                        operation="knowledge",
-                    )
-                    session.add(rate_limit_log)
-                return NodeRunResult(
-                    status=WorkflowNodeExecutionStatus.FAILED,
-                    inputs=variables,
-                    error="Sorry, you have reached the knowledge base request rate limit of your subscription.",
-                    error_type="RateLimitExceeded",
-                )
-
-        # retrieve knowledge
-        usage = LLMUsage.empty_usage()
        try:
            results, usage = self._fetch_dataset_retriever(node_data=self._node_data, variables=variables)
-            outputs = {"result": ArrayObjectSegment(value=results)}
+            outputs = {"result": ArrayObjectSegment(value=[item.model_dump() for item in results])}
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.SUCCEEDED,
                inputs=variables,
@ -198,9 +128,17 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
                },
                llm_usage=usage,
            )
-
+        except RateLimitExceededError as e:
+            logger.warning(e, exc_info=True)
+            return NodeRunResult(
+                status=WorkflowNodeExecutionStatus.FAILED,
+                inputs=variables,
+                error=str(e),
+                error_type=type(e).__name__,
+                llm_usage=usage,
+            )
        except KnowledgeRetrievalNodeError as e:
-            logger.warning("Error when running knowledge retrieval node")
+            logger.warning("Error when running knowledge retrieval node", exc_info=True)
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.FAILED,
                inputs=variables,
@ -210,6 +148,7 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
            )
        # Temporary handle all exceptions from DatasetRetrieval class here.
        except Exception as e:
+            logger.warning(e, exc_info=True)
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.FAILED,
                inputs=variables,
@ -217,92 +156,47 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
                error_type=type(e).__name__,
                llm_usage=usage,
            )
-        finally:
-            db.session.close()

    def _fetch_dataset_retriever(
        self, node_data: KnowledgeRetrievalNodeData, variables: dict[str, Any]
-    ) -> tuple[list[dict[str, Any]], LLMUsage]:
-        usage = LLMUsage.empty_usage()
-        available_datasets = []
+    ) -> tuple[list[Source], LLMUsage]:
        dataset_ids = node_data.dataset_ids
        query = variables.get("query")
        attachments = variables.get("attachments")
-        metadata_filter_document_ids = None
-        metadata_condition = None
-        metadata_usage = LLMUsage.empty_usage()
-        # Subquery: Count the number of available documents for each dataset
-        subquery = (
-            db.session.query(Document.dataset_id, func.count(Document.id).label("available_document_count"))
-            .where(
-                Document.indexing_status == "completed",
-                Document.enabled == True,
-                Document.archived == False,
-                Document.dataset_id.in_(dataset_ids),
-            )
-            .group_by(Document.dataset_id)
-            .having(func.count(Document.id) > 0)
-            .subquery()
-        )
+        retrieval_resource_list = []

-        results = (
-            db.session.query(Dataset)
-            .outerjoin(subquery, Dataset.id == subquery.c.dataset_id)
-            .where(Dataset.tenant_id == self.tenant_id, Dataset.id.in_(dataset_ids))
-            .where((subquery.c.available_document_count > 0) | (Dataset.provider == "external"))
-            .all()
-        )
+        metadata_filtering_mode: Literal["disabled", "automatic", "manual"] = "disabled"
+        if node_data.metadata_filtering_mode is not None:
+            metadata_filtering_mode = node_data.metadata_filtering_mode

-        # avoid blocking at retrieval
-        db.session.close()
-
-        for dataset in results:
-            # pass if dataset is not available
-            if not dataset:
-                continue
-            available_datasets.append(dataset)
-        if query:
-            metadata_filter_document_ids, metadata_condition, metadata_usage = self._get_metadata_filter_condition(
-                [dataset.id for dataset in available_datasets], query, node_data
-            )
-            usage = self._merge_usage(usage, metadata_usage)
-        all_documents = []
-        dataset_retrieval = DatasetRetrieval()
        if str(node_data.retrieval_mode) == DatasetRetrieveConfigEntity.RetrieveStrategy.SINGLE and query:
            # fetch model config
            if node_data.single_retrieval_config is None:
-                raise ValueError("single_retrieval_config is required")
-            model_instance, model_config = self.get_model_config(node_data.single_retrieval_config.model)
-            # check model is support tool calling
-            model_type_instance = model_config.provider_model_bundle.model_type_instance
-            model_type_instance = cast(LargeLanguageModel, model_type_instance)
-            # get model schema
-            model_schema = model_type_instance.get_model_schema(
-                model=model_config.model, credentials=model_config.credentials
-            )
-
-            if model_schema:
-                planning_strategy = PlanningStrategy.REACT_ROUTER
-                features = model_schema.features
-                if features:
-                    if ModelFeature.TOOL_CALL in features or ModelFeature.MULTI_TOOL_CALL in features:
-                        planning_strategy = PlanningStrategy.ROUTER
-                all_documents = dataset_retrieval.single_retrieve(
-                    available_datasets=available_datasets,
+                raise ValueError("single_retrieval_config is required for single retrieval mode")
+            model = node_data.single_retrieval_config.model
+            retrieval_resource_list = self._rag_retrieval.knowledge_retrieval(
+                request=KnowledgeRetrievalRequest(
                    tenant_id=self.tenant_id,
                    user_id=self.user_id,
                    app_id=self.app_id,
                    user_from=self.user_from.value,
+                    dataset_ids=dataset_ids,
+                    retrieval_mode=DatasetRetrieveConfigEntity.RetrieveStrategy.SINGLE.value,
+                    completion_params=model.completion_params,
+                    model_provider=model.provider,
+                    model_mode=model.mode,
+                    model_name=model.name,
+                    metadata_model_config=node_data.metadata_model_config,
+                    metadata_filtering_conditions=node_data.metadata_filtering_conditions,
+                    metadata_filtering_mode=metadata_filtering_mode,
                    query=query,
-                    model_config=model_config,
-                    model_instance=model_instance,
-                    planning_strategy=planning_strategy,
-                    metadata_filter_document_ids=metadata_filter_document_ids,
-                    metadata_condition=metadata_condition,
                )
+            )
        elif str(node_data.retrieval_mode) == DatasetRetrieveConfigEntity.RetrieveStrategy.MULTIPLE:
            if node_data.multiple_retrieval_config is None:
                raise ValueError("multiple_retrieval_config is required")
+            reranking_model = None
+            weights = None
            match node_data.multiple_retrieval_config.reranking_mode:
                case "reranking_model":
                    if node_data.multiple_retrieval_config.reranking_model:
@ -329,284 +223,36 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
                        },
                    }
                case _:
+                    # Handle any other reranking_mode values
                    reranking_model = None
                    weights = None
-            all_documents = dataset_retrieval.multiple_retrieve(
-                app_id=self.app_id,
-                tenant_id=self.tenant_id,
-                user_id=self.user_id,
-                user_from=self.user_from.value,
-                available_datasets=available_datasets,
-                query=query,
-                top_k=node_data.multiple_retrieval_config.top_k,
-                score_threshold=node_data.multiple_retrieval_config.score_threshold
-                if node_data.multiple_retrieval_config.score_threshold is not None
-                else 0.0,
-                reranking_mode=node_data.multiple_retrieval_config.reranking_mode,
-                reranking_model=reranking_model,
-                weights=weights,
-                reranking_enable=node_data.multiple_retrieval_config.reranking_enable,
-                metadata_filter_document_ids=metadata_filter_document_ids,
-                metadata_condition=metadata_condition,
-                attachment_ids=[attachment.related_id for attachment in attachments] if attachments else None,
-            )
-        usage = self._merge_usage(usage, dataset_retrieval.llm_usage)

-        dify_documents = [item for item in all_documents if item.provider == "dify"]
-        external_documents = [item for item in all_documents if item.provider == "external"]
-        retrieval_resource_list = []
-        # deal with external documents
-        for item in external_documents:
-            source: dict[str, dict[str, str | Any | dict[Any, Any] | None] | Any | str | None] = {
-                "metadata": {
-                    "_source": "knowledge",
-                    "dataset_id": item.metadata.get("dataset_id"),
-                    "dataset_name": item.metadata.get("dataset_name"),
-                    "document_id": item.metadata.get("document_id") or item.metadata.get("title"),
-                    "document_name": item.metadata.get("title"),
-                    "data_source_type": "external",
-                    "retriever_from": "workflow",
-                    "score": item.metadata.get("score"),
-                    "doc_metadata": item.metadata,
-                },
-                "title": item.metadata.get("title"),
-                "content": item.page_content,
-            }
-            retrieval_resource_list.append(source)
-        # deal with dify documents
-        if dify_documents:
-            records = RetrievalService.format_retrieval_documents(dify_documents)
-            if records:
-                for record in records:
-                    segment = record.segment
-                    dataset = db.session.query(Dataset).filter_by(id=segment.dataset_id).first()  # type: ignore
-                    stmt = select(Document).where(
-                        Document.id == segment.document_id,
-                        Document.enabled == True,
-                        Document.archived == False,
-                    )
-                    document = db.session.scalar(stmt)
-                    if dataset and document:
-                        source = {
-                            "metadata": {
-                                "_source": "knowledge",
-                                "dataset_id": dataset.id,
-                                "dataset_name": dataset.name,
-                                "document_id": document.id,
-                                "document_name": document.name,
-                                "data_source_type": document.data_source_type,
-                                "segment_id": segment.id,
-                                "retriever_from": "workflow",
-                                "score": record.score or 0.0,
-                                "child_chunks": [
-                                    {
-                                        "id": str(getattr(chunk, "id", "")),
-                                        "content": str(getattr(chunk, "content", "")),
-                                        "position": int(getattr(chunk, "position", 0)),
-                                        "score": float(getattr(chunk, "score", 0.0)),
-                                    }
-                                    for chunk in (record.child_chunks or [])
-                                ],
-                                "segment_hit_count": segment.hit_count,
-                                "segment_word_count": segment.word_count,
-                                "segment_position": segment.position,
-                                "segment_index_node_hash": segment.index_node_hash,
-                                "doc_metadata": document.doc_metadata,
-                            },
-                            "title": document.name,
-                            "files": list(record.files) if record.files else None,
-                        }
-                        if segment.answer:
-                            source["content"] = f"question:{segment.get_sign_content()} \nanswer:{segment.answer}"
-                        else:
-                            source["content"] = segment.get_sign_content()
-                        # Add summary if available
-                        if record.summary:
-                            source["summary"] = record.summary
-                        retrieval_resource_list.append(source)
-        if retrieval_resource_list:
-            retrieval_resource_list = sorted(
-                retrieval_resource_list,
-                key=self._score,  # type: ignore[arg-type, return-value]
-                reverse=True,
-            )
-            for position, item in enumerate(retrieval_resource_list, start=1):
-                item["metadata"]["position"] = position  # type: ignore[index]
-        return retrieval_resource_list, usage
-
-    def _score(self, item: dict[str, Any]) -> float:
-        meta = item.get("metadata")
-        if isinstance(meta, dict):
-            s = meta.get("score")
-            if isinstance(s, (int, float)):
-                return float(s)
-        return 0.0
-
-    def _get_metadata_filter_condition(
-        self, dataset_ids: list, query: str, node_data: KnowledgeRetrievalNodeData
-    ) -> tuple[dict[str, list[str]] | None, MetadataCondition | None, LLMUsage]:
-        usage = LLMUsage.empty_usage()
-        document_query = db.session.query(Document).where(
-            Document.dataset_id.in_(dataset_ids),
-            Document.indexing_status == "completed",
-            Document.enabled == True,
-            Document.archived == False,
-        )
-        filters: list[Any] = []
-        metadata_condition = None
-        match node_data.metadata_filtering_mode:
-            case "disabled":
-                return None, None, usage
-            case "automatic":
-                automatic_metadata_filters, automatic_usage = self._automatic_metadata_filter_func(
-                    dataset_ids, query, node_data
+            retrieval_resource_list = self._rag_retrieval.knowledge_retrieval(
+                request=KnowledgeRetrievalRequest(
+                    app_id=self.app_id,
+                    tenant_id=self.tenant_id,
+                    user_id=self.user_id,
+                    user_from=self.user_from.value,
+                    dataset_ids=dataset_ids,
+                    query=query,
+                    retrieval_mode=DatasetRetrieveConfigEntity.RetrieveStrategy.MULTIPLE.value,
+                    top_k=node_data.multiple_retrieval_config.top_k,
+                    score_threshold=node_data.multiple_retrieval_config.score_threshold
+                    if node_data.multiple_retrieval_config.score_threshold is not None
+                    else 0.0,
+                    reranking_mode=node_data.multiple_retrieval_config.reranking_mode,
+                    reranking_model=reranking_model,
+                    weights=weights,
+                    reranking_enable=node_data.multiple_retrieval_config.reranking_enable,
+                    metadata_model_config=node_data.metadata_model_config,
+                    metadata_filtering_conditions=node_data.metadata_filtering_conditions,
+                    metadata_filtering_mode=metadata_filtering_mode,
+                    attachment_ids=[attachment.related_id for attachment in attachments] if attachments else None,
                )
-                usage = self._merge_usage(usage, automatic_usage)
-                if automatic_metadata_filters:
-                    conditions = []
-                    for sequence, filter in enumerate(automatic_metadata_filters):
-                        DatasetRetrieval.process_metadata_filter_func(
-                            sequence,
-                            filter.get("condition", ""),
-                            filter.get("metadata_name", ""),
-                            filter.get("value"),
-                            filters,
-                        )
-                        conditions.append(
-                            Condition(
-                                name=filter.get("metadata_name"),  # type: ignore
-                                comparison_operator=filter.get("condition"),  # type: ignore
-                                value=filter.get("value"),
-                            )
-                        )
-                    metadata_condition = MetadataCondition(
-                        logical_operator=node_data.metadata_filtering_conditions.logical_operator
-                        if node_data.metadata_filtering_conditions
-                        else "or",
-                        conditions=conditions,
-                    )
-            case "manual":
-                if node_data.metadata_filtering_conditions:
-                    conditions = []
-                    for sequence, condition in enumerate(node_data.metadata_filtering_conditions.conditions):  # type: ignore
-                        metadata_name = condition.name
-                        expected_value = condition.value
-                        if expected_value is not None and condition.comparison_operator not in ("empty", "not empty"):
-                            if isinstance(expected_value, str):
-                                expected_value = self.graph_runtime_state.variable_pool.convert_template(
-                                    expected_value
-                                ).value[0]
-                                if expected_value.value_type in {"number", "integer", "float"}:
-                                    expected_value = expected_value.value
-                                elif expected_value.value_type == "string":
-                                    expected_value = re.sub(r"[\r\n\t]+", " ", expected_value.text).strip()
-                                else:
-                                    raise ValueError("Invalid expected metadata value type")
-                        conditions.append(
-                            Condition(
-                                name=metadata_name,
-                                comparison_operator=condition.comparison_operator,
-                                value=expected_value,
-                            )
-                        )
-                        filters = DatasetRetrieval.process_metadata_filter_func(
-                            sequence,
-                            condition.comparison_operator,
-                            metadata_name,
-                            expected_value,
-                            filters,
-                        )
-                    metadata_condition = MetadataCondition(
-                        logical_operator=node_data.metadata_filtering_conditions.logical_operator,
-                        conditions=conditions,
-                    )
-            case _:
-                raise ValueError("Invalid metadata filtering mode")
-        if filters:
-            if (
-                node_data.metadata_filtering_conditions
-                and node_data.metadata_filtering_conditions.logical_operator == "and"
-            ):
-                document_query = document_query.where(and_(*filters))
-            else:
-                document_query = document_query.where(or_(*filters))
-        documents = document_query.all()
-        # group by dataset_id
-        metadata_filter_document_ids = defaultdict(list) if documents else None  # type: ignore
-        for document in documents:
-            metadata_filter_document_ids[document.dataset_id].append(document.id)  # type: ignore
-        return metadata_filter_document_ids, metadata_condition, usage
-
-    def _automatic_metadata_filter_func(
-        self, dataset_ids: list, query: str, node_data: KnowledgeRetrievalNodeData
-    ) -> tuple[list[dict[str, Any]], LLMUsage]:
-        usage = LLMUsage.empty_usage()
-        # get all metadata field
-        stmt = select(DatasetMetadata).where(DatasetMetadata.dataset_id.in_(dataset_ids))
-        metadata_fields = db.session.scalars(stmt).all()
-        all_metadata_fields = [metadata_field.name for metadata_field in metadata_fields]
-        if node_data.metadata_model_config is None:
-            raise ValueError("metadata_model_config is required")
-        # get metadata model instance and fetch model config
-        model_instance, model_config = self.get_model_config(node_data.metadata_model_config)
-        # fetch prompt messages
-        prompt_template = self._get_prompt_template(
-            node_data=node_data,
-            metadata_fields=all_metadata_fields,
-            query=query or "",
-        )
-        prompt_messages, stop = LLMNode.fetch_prompt_messages(
-            prompt_template=prompt_template,
-            sys_query=query,
-            memory=None,
-            model_config=model_config,
-            sys_files=[],
-            vision_enabled=node_data.vision.enabled,
-            vision_detail=node_data.vision.configs.detail,
-            variable_pool=self.graph_runtime_state.variable_pool,
-            jinja2_variables=[],
-            tenant_id=self.tenant_id,
-        )
-
-        result_text = ""
-        try:
-            # handle invoke result
-            generator = LLMNode.invoke_llm(
-                node_data_model=node_data.metadata_model_config,
-                model_instance=model_instance,
-                prompt_messages=prompt_messages,
-                stop=stop,
-                user_id=self.user_id,
-                structured_output_enabled=self.node_data.structured_output_enabled,
-                structured_output=None,
-                file_saver=self._llm_file_saver,
-                file_outputs=self._file_outputs,
-                node_id=self._node_id,
-                node_type=self.node_type,
            )

-            for event in generator:
-                if isinstance(event, ModelInvokeCompletedEvent):
-                    result_text = event.text
-                    usage = self._merge_usage(usage, event.usage)
-                    break
-
-            result_text_json = parse_and_check_json_markdown(result_text, [])
-            automatic_metadata_filters = []
-            if "metadata_map" in result_text_json:
-                metadata_map = result_text_json["metadata_map"]
-                for item in metadata_map:
-                    if item.get("metadata_field_name") in all_metadata_fields:
-                        automatic_metadata_filters.append(
-                            {
-                                "metadata_name": item.get("metadata_field_name"),
-                                "value": item.get("metadata_field_value"),
-                                "condition": item.get("comparison_operator"),
-                            }
-                        )
-        except Exception:
-            return [], usage
-        return automatic_metadata_filters, usage
+        usage = self._rag_retrieval.llm_usage
+        return retrieval_resource_list, usage

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
@ -626,107 +272,3 @@ class KnowledgeRetrievalNode(LLMUsageTrackingMixin, Node[KnowledgeRetrievalNodeD
        if typed_node_data.query_attachment_selector:
            variable_mapping[node_id + ".queryAttachment"] = typed_node_data.query_attachment_selector
        return variable_mapping
-
-    def get_model_config(self, model: ModelConfig) -> tuple[ModelInstance, ModelConfigWithCredentialsEntity]:
-        model_name = model.name
-        provider_name = model.provider
-
-        model_manager = ModelManager()
-        model_instance = model_manager.get_model_instance(
-            tenant_id=self.tenant_id, model_type=ModelType.LLM, provider=provider_name, model=model_name
-        )
-
-        provider_model_bundle = model_instance.provider_model_bundle
-        model_type_instance = model_instance.model_type_instance
-        model_type_instance = cast(LargeLanguageModel, model_type_instance)
-
-        model_credentials = model_instance.credentials
-
-        # check model
-        provider_model = provider_model_bundle.configuration.get_provider_model(
-            model=model_name, model_type=ModelType.LLM
-        )
-
-        if provider_model is None:
-            raise ModelNotExistError(f"Model {model_name} not exist.")
-
-        if provider_model.status == ModelStatus.NO_CONFIGURE:
-            raise ModelCredentialsNotInitializedError(f"Model {model_name} credentials is not initialized.")
-        elif provider_model.status == ModelStatus.NO_PERMISSION:
-            raise ModelNotSupportedError(f"Dify Hosted OpenAI {model_name} currently not support.")
-        elif provider_model.status == ModelStatus.QUOTA_EXCEEDED:
-            raise ModelQuotaExceededError(f"Model provider {provider_name} quota exceeded.")
-
-        # model config
-        completion_params = model.completion_params
-        stop = []
-        if "stop" in completion_params:
-            stop = completion_params["stop"]
-            del completion_params["stop"]
-
-        # get model mode
-        model_mode = model.mode
-        if not model_mode:
-            raise ModelNotExistError("LLM mode is required.")
-
-        model_schema = model_type_instance.get_model_schema(model_name, model_credentials)
-
-        if not model_schema:
-            raise ModelNotExistError(f"Model {model_name} not exist.")
-
-        return model_instance, ModelConfigWithCredentialsEntity(
-            provider=provider_name,
-            model=model_name,
-            model_schema=model_schema,
-            mode=model_mode,
-            provider_model_bundle=provider_model_bundle,
-            credentials=model_credentials,
-            parameters=completion_params,
-            stop=stop,
-        )
-
-    def _get_prompt_template(self, node_data: KnowledgeRetrievalNodeData, metadata_fields: list, query: str):
-        model_mode = ModelMode(node_data.metadata_model_config.mode)  # type: ignore
-        input_text = query
-
-        prompt_messages: list[LLMNodeChatModelMessage] = []
-        if model_mode == ModelMode.CHAT:
-            system_prompt_messages = LLMNodeChatModelMessage(
-                role=PromptMessageRole.SYSTEM, text=METADATA_FILTER_SYSTEM_PROMPT
-            )
-            prompt_messages.append(system_prompt_messages)
-            user_prompt_message_1 = LLMNodeChatModelMessage(
-                role=PromptMessageRole.USER, text=METADATA_FILTER_USER_PROMPT_1
-            )
-            prompt_messages.append(user_prompt_message_1)
-            assistant_prompt_message_1 = LLMNodeChatModelMessage(
-                role=PromptMessageRole.ASSISTANT, text=METADATA_FILTER_ASSISTANT_PROMPT_1
-            )
-            prompt_messages.append(assistant_prompt_message_1)
-            user_prompt_message_2 = LLMNodeChatModelMessage(
-                role=PromptMessageRole.USER, text=METADATA_FILTER_USER_PROMPT_2
-            )
-            prompt_messages.append(user_prompt_message_2)
-            assistant_prompt_message_2 = LLMNodeChatModelMessage(
-                role=PromptMessageRole.ASSISTANT, text=METADATA_FILTER_ASSISTANT_PROMPT_2
-            )
-            prompt_messages.append(assistant_prompt_message_2)
-            user_prompt_message_3 = LLMNodeChatModelMessage(
-                role=PromptMessageRole.USER,
-                text=METADATA_FILTER_USER_PROMPT_3.format(
-                    input_text=input_text,
-                    metadata_fields=json.dumps(metadata_fields, ensure_ascii=False),
-                ),
-            )
-            prompt_messages.append(user_prompt_message_3)
-            return prompt_messages
-        elif model_mode == ModelMode.COMPLETION:
-            return LLMNodeCompletionModelPromptTemplate(
-                text=METADATA_FILTER_COMPLETION_PROMPT.format(
-                    input_text=input_text,
-                    metadata_fields=json.dumps(metadata_fields, ensure_ascii=False),
-                )
-            )
-
-        else:
-            raise InvalidModelTypeError(f"Model mode {model_mode} not support.")