merge main

2026-05-04 01:18:05 +08:00 · 2024-10-28 10:51:02 +08:00
parent c777d55a1c aa11141660
commit 765eb282f3
858 changed files with 16206 additions and 17932 deletions
--- a/api/core/workflow/nodes/init.py
+++ b/api/core/workflow/nodes/init.py
@ -0,0 +1,3 @@
+from .enums import NodeType
+
+__all__ = ["NodeType"]
--- a/api/core/workflow/nodes/answer/init.py
+++ b/api/core/workflow/nodes/answer/init.py
@ -0,0 +1,4 @@
+from .answer_node import AnswerNode
+from .entities import AnswerStreamGenerateRoute
+
+__all__ = ["AnswerStreamGenerateRoute", "AnswerNode"]
--- a/api/core/workflow/nodes/answer/answer_node.py
+++ b/api/core/workflow/nodes/answer/answer_node.py
@ -1,7 +1,8 @@
 from collections.abc import Mapping, Sequence
 from typing import Any, cast

-from core.workflow.entities.node_entities import NodeRunResult, NodeType
+from core.variables import ArrayFileSegment, FileSegment
+from core.workflow.entities.node_entities import NodeRunResult
 from core.workflow.nodes.answer.answer_stream_generate_router import AnswerStreamGeneratorRouter
 from core.workflow.nodes.answer.entities import (
    AnswerNodeData,
@ -9,12 +10,13 @@ from core.workflow.nodes.answer.entities import (
    TextGenerateRouteChunk,
    VarGenerateRouteChunk,
 )
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.utils.variable_template_parser import VariableTemplateParser
 from models.workflow import WorkflowNodeExecutionStatus


-class AnswerNode(BaseNode):
+class AnswerNode(BaseNode[AnswerNodeData]):
    _node_data_cls = AnswerNodeData
    _node_type: NodeType = NodeType.ANSWER

@ -23,30 +25,35 @@ class AnswerNode(BaseNode):
        Run node
        :return:
        """
-        node_data = self.node_data
-        node_data = cast(AnswerNodeData, node_data)
-
        # generate routes
-        generate_routes = AnswerStreamGeneratorRouter.extract_generate_route_from_node_data(node_data)
+        generate_routes = AnswerStreamGeneratorRouter.extract_generate_route_from_node_data(self.node_data)

        answer = ""
+        files = []
        for part in generate_routes:
            if part.type == GenerateRouteChunk.ChunkType.VAR:
                part = cast(VarGenerateRouteChunk, part)
                value_selector = part.value_selector
-                value = self.graph_runtime_state.variable_pool.get(value_selector)
-
-                if value:
-                    answer += value.markdown
+                variable = self.graph_runtime_state.variable_pool.get(value_selector)
+                if variable:
+                    if isinstance(variable, FileSegment):
+                        files.append(variable.value)
+                    elif isinstance(variable, ArrayFileSegment):
+                        files.extend(variable.value)
+                    answer += variable.markdown
            else:
                part = cast(TextGenerateRouteChunk, part)
                answer += part.text

-        return NodeRunResult(status=WorkflowNodeExecutionStatus.SUCCEEDED, outputs={"answer": answer})
+        return NodeRunResult(status=WorkflowNodeExecutionStatus.SUCCEEDED, outputs={"answer": answer, "files": files})

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: AnswerNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: AnswerNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
@ -55,9 +62,6 @@ class AnswerNode(BaseNode):
        :param node_data: node data
        :return:
        """
-        node_data = node_data
-        node_data = cast(AnswerNodeData, node_data)
-
        variable_template_parser = VariableTemplateParser(template=node_data.answer)
        variable_selectors = variable_template_parser.extract_variable_selectors()

--- a/api/core/workflow/nodes/answer/answer_stream_generate_router.py
+++ b/api/core/workflow/nodes/answer/answer_stream_generate_router.py
@ -1,5 +1,4 @@
 from core.prompt.utils.prompt_template_parser import PromptTemplateParser
-from core.workflow.entities.node_entities import NodeType
 from core.workflow.nodes.answer.entities import (
    AnswerNodeData,
    AnswerStreamGenerateRoute,
@ -7,6 +6,7 @@ from core.workflow.nodes.answer.entities import (
    TextGenerateRouteChunk,
    VarGenerateRouteChunk,
 )
+from core.workflow.nodes.enums import NodeType
 from core.workflow.utils.variable_template_parser import VariableTemplateParser


@ -149,10 +149,10 @@ class AnswerStreamGeneratorRouter:
            source_node_id = edge.source_node_id
            source_node_type = node_id_config_mapping[source_node_id].get("data", {}).get("type")
            if source_node_type in {
-                NodeType.ANSWER.value,
-                NodeType.IF_ELSE.value,
-                NodeType.QUESTION_CLASSIFIER.value,
-                NodeType.ITERATION.value,
+                NodeType.ANSWER,
+                NodeType.IF_ELSE,
+                NodeType.QUESTION_CLASSIFIER,
+                NodeType.ITERATION,
            }:
                answer_dependencies[answer_node_id].append(source_node_id)
            else:
--- a/api/core/workflow/nodes/answer/answer_stream_processor.py
+++ b/api/core/workflow/nodes/answer/answer_stream_processor.py
@ -1,8 +1,8 @@
 import logging
 from collections.abc import Generator
-from typing import Optional, cast
+from typing import cast

-from core.file.file_obj import FileVar
+from core.file import FILE_MODEL_IDENTITY, File
 from core.workflow.entities.variable_pool import VariablePool
 from core.workflow.graph_engine.entities.event import (
    GraphEngineEvent,
@ -22,7 +22,7 @@ class AnswerStreamProcessor(StreamProcessor):
        super().__init__(graph, variable_pool)
        self.generate_routes = graph.answer_stream_generate_routes
        self.route_position = {}
-        for answer_node_id, route_chunks in self.generate_routes.answer_generate_route.items():
+        for answer_node_id in self.generate_routes.answer_generate_route:
            self.route_position[answer_node_id] = 0
        self.current_stream_chunk_generating_node_ids: dict[str, list[str]] = {}

@ -203,7 +203,7 @@ class AnswerStreamProcessor(StreamProcessor):
        return files

    @classmethod
-    def _get_file_var_from_value(cls, value: dict | list) -> Optional[dict]:
+    def _get_file_var_from_value(cls, value: dict | list):
        """
        Get file var from value
        :param value: variable value
@ -213,9 +213,9 @@ class AnswerStreamProcessor(StreamProcessor):
            return None

        if isinstance(value, dict):
-            if "__variant" in value and value["__variant"] == FileVar.__name__:
+            if "dify_model_identity" in value and value["dify_model_identity"] == FILE_MODEL_IDENTITY:
                return value
-        elif isinstance(value, FileVar):
+        elif isinstance(value, File):
            return value.to_dict()

        return None
--- a/api/core/workflow/nodes/answer/entities.py
+++ b/api/core/workflow/nodes/answer/entities.py
@ -1,8 +1,9 @@
+from collections.abc import Sequence
 from enum import Enum

 from pydantic import BaseModel, Field

-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData


 class AnswerNodeData(BaseNodeData):
@ -32,7 +33,7 @@ class VarGenerateRouteChunk(GenerateRouteChunk):

    type: GenerateRouteChunk.ChunkType = GenerateRouteChunk.ChunkType.VAR
    """generate route chunk type"""
-    value_selector: list[str] = Field(..., description="value selector")
+    value_selector: Sequence[str] = Field(..., description="value selector")


 class TextGenerateRouteChunk(GenerateRouteChunk):
--- a/api/core/workflow/nodes/base_node.py
+++ b/api/core/workflow/nodes/base_node.py
@ -1,117 +0,0 @@
-from abc import ABC, abstractmethod
-from collections.abc import Generator, Mapping, Sequence
-from typing import Any, Optional
-
-from core.workflow.entities.base_node_data_entities import BaseNodeData
-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.graph_engine.entities.event import InNodeEvent
-from core.workflow.graph_engine.entities.graph import Graph
-from core.workflow.graph_engine.entities.graph_init_params import GraphInitParams
-from core.workflow.graph_engine.entities.graph_runtime_state import GraphRuntimeState
-from core.workflow.nodes.event import RunCompletedEvent, RunEvent
-
-
-class BaseNode(ABC):
-    _node_data_cls: type[BaseNodeData]
-    _node_type: NodeType
-
-    def __init__(
-        self,
-        id: str,
-        config: Mapping[str, Any],
-        graph_init_params: GraphInitParams,
-        graph: Graph,
-        graph_runtime_state: GraphRuntimeState,
-        previous_node_id: Optional[str] = None,
-        thread_pool_id: Optional[str] = None,
-    ) -> None:
-        self.id = id
-        self.tenant_id = graph_init_params.tenant_id
-        self.app_id = graph_init_params.app_id
-        self.workflow_type = graph_init_params.workflow_type
-        self.workflow_id = graph_init_params.workflow_id
-        self.graph_config = graph_init_params.graph_config
-        self.user_id = graph_init_params.user_id
-        self.user_from = graph_init_params.user_from
-        self.invoke_from = graph_init_params.invoke_from
-        self.workflow_call_depth = graph_init_params.call_depth
-        self.graph = graph
-        self.graph_runtime_state = graph_runtime_state
-        self.previous_node_id = previous_node_id
-        self.thread_pool_id = thread_pool_id
-
-        node_id = config.get("id")
-        if not node_id:
-            raise ValueError("Node ID is required.")
-
-        self.node_id = node_id
-        self.node_data = self._node_data_cls(**config.get("data", {}))
-
-    @abstractmethod
-    def _run(self) -> NodeRunResult | Generator[RunEvent | InNodeEvent, None, None]:
-        """
-        Run node
-        :return:
-        """
-        raise NotImplementedError
-
-    def run(self) -> Generator[RunEvent | InNodeEvent, None, None]:
-        """
-        Run node entry
-        :return:
-        """
-        result = self._run()
-
-        if isinstance(result, NodeRunResult):
-            yield RunCompletedEvent(run_result=result)
-        else:
-            yield from result
-
-    @classmethod
-    def extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], config: dict
-    ) -> Mapping[str, Sequence[str]]:
-        """
-        Extract variable selector to variable mapping
-        :param graph_config: graph config
-        :param config: node config
-        :return:
-        """
-        node_id = config.get("id")
-        if not node_id:
-            raise ValueError("Node ID is required when extracting variable selector to variable mapping.")
-
-        node_data = cls._node_data_cls(**config.get("data", {}))
-        return cls._extract_variable_selector_to_variable_mapping(
-            graph_config=graph_config, node_id=node_id, node_data=node_data
-        )
-
-    @classmethod
-    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: BaseNodeData
-    ) -> Mapping[str, Sequence[str]]:
-        """
-        Extract variable selector to variable mapping
-        :param graph_config: graph config
-        :param node_id: node id
-        :param node_data: node data
-        :return:
-        """
-        return {}
-
-    @classmethod
-    def get_default_config(cls, filters: Optional[dict] = None) -> dict:
-        """
-        Get default config of node.
-        :param filters: filter by node config parameters.
-        :return:
-        """
-        return {}
-
-    @property
-    def node_type(self) -> NodeType:
-        """
-        Get node type
-        :return:
-        """
-        return self._node_type
--- a/api/core/workflow/nodes/code/init.py
+++ b/api/core/workflow/nodes/code/init.py
@ -0,0 +1,3 @@
+from .code_node import CodeNode
+
+__all__ = ["CodeNode"]
--- a/api/core/workflow/nodes/code/code_node.py
+++ b/api/core/workflow/nodes/code/code_node.py
@ -1,18 +1,19 @@
 from collections.abc import Mapping, Sequence
-from typing import Any, Optional, Union, cast
+from typing import Any, Optional, Union

 from configs import dify_config
 from core.helper.code_executor.code_executor import CodeExecutionError, CodeExecutor, CodeLanguage
 from core.helper.code_executor.code_node_provider import CodeNodeProvider
 from core.helper.code_executor.javascript.javascript_code_provider import JavascriptCodeProvider
 from core.helper.code_executor.python3.python3_code_provider import Python3CodeProvider
-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
 from core.workflow.nodes.code.entities import CodeNodeData
+from core.workflow.nodes.enums import NodeType
 from models.workflow import WorkflowNodeExecutionStatus


-class CodeNode(BaseNode):
+class CodeNode(BaseNode[CodeNodeData]):
    _node_data_cls = CodeNodeData
    _node_type = NodeType.CODE

@ -33,24 +34,22 @@ class CodeNode(BaseNode):
        return code_provider.get_default_config()

    def _run(self) -> NodeRunResult:
-        """
-        Run code
-        :return:
-        """
-        node_data = self.node_data
-        node_data = cast(CodeNodeData, node_data)
-
        # Get code language
-        code_language = node_data.code_language
-        code = node_data.code
+        code_language = self.node_data.code_language
+        code = self.node_data.code

        # Get variables
        variables = {}
-        for variable_selector in node_data.variables:
-            variable = variable_selector.variable
-            value = self.graph_runtime_state.variable_pool.get_any(variable_selector.value_selector)
-
-            variables[variable] = value
+        for variable_selector in self.node_data.variables:
+            variable_name = variable_selector.variable
+            variable = self.graph_runtime_state.variable_pool.get(variable_selector.value_selector)
+            if variable is None:
+                return NodeRunResult(
+                    status=WorkflowNodeExecutionStatus.FAILED,
+                    inputs=variables,
+                    error=f"Variable `{variable_selector.value_selector}` not found",
+                )
+            variables[variable_name] = variable.to_object()
        # Run code
        try:
            result = CodeExecutor.execute_workflow_code_template(
@ -60,7 +59,7 @@ class CodeNode(BaseNode):
            )

            # Transform result
-            result = self._transform_result(result, node_data.outputs)
+            result = self._transform_result(result, self.node_data.outputs)
        except (CodeExecutionError, ValueError) as e:
            return NodeRunResult(status=WorkflowNodeExecutionStatus.FAILED, inputs=variables, error=str(e))

@ -316,7 +315,11 @@ class CodeNode(BaseNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: CodeNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: CodeNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
--- a/api/core/workflow/nodes/code/entities.py
+++ b/api/core/workflow/nodes/code/entities.py
@ -3,8 +3,8 @@ from typing import Literal, Optional
 from pydantic import BaseModel

 from core.helper.code_executor.code_executor import CodeLanguage
-from core.workflow.entities.base_node_data_entities import BaseNodeData
 from core.workflow.entities.variable_entities import VariableSelector
+from core.workflow.nodes.base import BaseNodeData


 class CodeNodeData(BaseNodeData):
--- a/api/core/workflow/nodes/document_extractor/node.py
+++ b/api/core/workflow/nodes/document_extractor/node.py
@ -1,5 +1,6 @@
 import csv
 import io
+import json

 import docx
 import pandas as pd
@ -34,7 +35,8 @@ class DocumentExtractorNode(BaseNode[DocumentExtractorNodeData]):

    def _run(self):
        variable_selector = self.node_data.variable_selector
-        variable = self.graph_runtime_state.variable_pool.get(variable_selector)
+        variable = self.graph_runtime_state.variable_pool.get(
+            variable_selector)

        if variable is None:
            error_message = f"File variable not found for selector: {variable_selector}"
@ -45,7 +47,8 @@ class DocumentExtractorNode(BaseNode[DocumentExtractorNodeData]):

        value = variable.value
        inputs = {"variable_selector": variable_selector}
-        process_data = {"documents": value if isinstance(value, list) else [value]}
+        process_data = {"documents": value if isinstance(value, list) else [
+            value]}

        try:
            if isinstance(value, list):
@ -65,7 +68,8 @@ class DocumentExtractorNode(BaseNode[DocumentExtractorNodeData]):
                    outputs={"text": extracted_text},
                )
            else:
-                raise DocumentExtractorError(f"Unsupported variable type: {type(value)}")
+                raise DocumentExtractorError(
+                    f"Unsupported variable type: {type(value)}")
        except DocumentExtractorError as e:
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.FAILED,
@ -77,34 +81,32 @@ class DocumentExtractorNode(BaseNode[DocumentExtractorNodeData]):

 def _extract_text_by_mime_type(*, file_content: bytes, mime_type: str) -> str:
    """Extract text from a file based on its MIME type."""
-    if mime_type.startswith("text/plain") or mime_type in {"text/html", "text/htm", "text/markdown", "text/xml"}:
-        return _extract_text_from_plain_text(file_content)
-    elif mime_type == "application/pdf":
-        return _extract_text_from_pdf(file_content)
-    elif mime_type in {
-        "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
-        "application/msword",
-    }:
-        return _extract_text_from_doc(file_content)
-    elif mime_type == "text/csv":
-        return _extract_text_from_csv(file_content)
-    elif mime_type in {
-        "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet",
-        "application/vnd.ms-excel",
-    }:
-        return _extract_text_from_excel(file_content)
-    elif mime_type == "application/vnd.ms-powerpoint":
-        return _extract_text_from_ppt(file_content)
-    elif mime_type == "application/vnd.openxmlformats-officedocument.presentationml.presentation":
-        return _extract_text_from_pptx(file_content)
-    elif mime_type == "application/epub+zip":
-        return _extract_text_from_epub(file_content)
-    elif mime_type == "message/rfc822":
-        return _extract_text_from_eml(file_content)
-    elif mime_type == "application/vnd.ms-outlook":
-        return _extract_text_from_msg(file_content)
-    else:
-        raise UnsupportedFileTypeError(f"Unsupported MIME type: {mime_type}")
+    match mime_type:
+        case "text/plain" | "text/html" | "text/htm" | "text/markdown" | "text/xml":
+            return _extract_text_from_plain_text(file_content)
+        case "application/pdf":
+            return _extract_text_from_pdf(file_content)
+        case "application/vnd.openxmlformats-officedocument.wordprocessingml.document" | "application/msword":
+            return _extract_text_from_doc(file_content)
+        case "text/csv":
+            return _extract_text_from_csv(file_content)
+        case "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" | "application/vnd.ms-excel":
+            return _extract_text_from_excel(file_content)
+        case "application/vnd.ms-powerpoint":
+            return _extract_text_from_ppt(file_content)
+        case "application/vnd.openxmlformats-officedocument.presentationml.presentation":
+            return _extract_text_from_pptx(file_content)
+        case "application/epub+zip":
+            return _extract_text_from_epub(file_content)
+        case "message/rfc822":
+            return _extract_text_from_eml(file_content)
+        case "application/vnd.ms-outlook":
+            return _extract_text_from_msg(file_content)
+        case "application/json":
+            return _extract_text_from_json(file_content)
+        case _:
+            raise UnsupportedFileTypeError(
+                f"Unsupported MIME type: {mime_type}")


 def _extract_text_by_file_extension(*, file_content: bytes, file_extension: str) -> str:
@ -112,6 +114,8 @@ def _extract_text_by_file_extension(*, file_content: bytes, file_extension: str)
    match file_extension:
        case ".txt" | ".markdown" | ".md" | ".html" | ".htm" | ".xml":
            return _extract_text_from_plain_text(file_content)
+        case ".json":
+            return _extract_text_from_json(file_content)
        case ".pdf":
            return _extract_text_from_pdf(file_content)
        case ".doc" | ".docx":
@ -131,7 +135,8 @@ def _extract_text_by_file_extension(*, file_content: bytes, file_extension: str)
        case ".msg":
            return _extract_text_from_msg(file_content)
        case _:
-            raise UnsupportedFileTypeError(f"Unsupported Extension Type: {file_extension}")
+            raise UnsupportedFileTypeError(
+                f"Unsupported Extension Type: {file_extension}")


 def _extract_text_from_plain_text(file_content: bytes) -> str:
@ -141,6 +146,15 @@ def _extract_text_from_plain_text(file_content: bytes) -> str:
        raise TextExtractionError("Failed to decode plain text file") from e


+def _extract_text_from_json(file_content: bytes) -> str:
+    try:
+        json_data = json.loads(file_content.decode("utf-8"))
+        return json.dumps(json_data, indent=2, ensure_ascii=False)
+    except (UnicodeDecodeError, json.JSONDecodeError) as e:
+        raise TextExtractionError(
+            f"Failed to decode or parse JSON file: {e}") from e
+
+
 def _extract_text_from_pdf(file_content: bytes) -> str:
    try:
        pdf_file = io.BytesIO(file_content)
@ -153,7 +167,8 @@ def _extract_text_from_pdf(file_content: bytes) -> str:
            page.close()
        return text
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from PDF: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from PDF: {str(e)}") from e


 def _extract_text_from_doc(file_content: bytes) -> str:
@ -162,7 +177,8 @@ def _extract_text_from_doc(file_content: bytes) -> str:
        doc = docx.Document(doc_file)
        return "\n".join([paragraph.text for paragraph in doc.paragraphs])
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from DOC/DOCX: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from DOC/DOCX: {str(e)}") from e


 def _download_file_content(file: File) -> bytes:
@ -177,19 +193,23 @@ def _download_file_content(file: File) -> bytes:
        elif file.transfer_method == FileTransferMethod.LOCAL_FILE:
            return file_manager.download(file)
        else:
-            raise ValueError(f"Unsupported transfer method: {file.transfer_method}")
+            raise ValueError(
+                f"Unsupported transfer method: {file.transfer_method}")
    except Exception as e:
        raise FileDownloadError(f"Error downloading file: {str(e)}") from e


 def _extract_text_from_file(file: File):
-    if file.mime_type is None:
-        raise UnsupportedFileTypeError("Unable to determine file type: MIME type is missing")
    file_content = _download_file_content(file)
-    if file.transfer_method == FileTransferMethod.REMOTE_URL:
-        extracted_text = _extract_text_by_mime_type(file_content=file_content, mime_type=file.mime_type)
+    if file.extension:
+        extracted_text = _extract_text_by_file_extension(
+            file_content=file_content, file_extension=file.extension)
+    elif file.mime_type:
+        extracted_text = _extract_text_by_mime_type(
+            file_content=file_content, mime_type=file.mime_type)
    else:
-        extracted_text = _extract_text_by_file_extension(file_content=file_content, file_extension=file.extension)
+        raise UnsupportedFileTypeError(
+            "Unable to determine file type: MIME type or file extension is missing")
    return extracted_text


@ -210,7 +230,8 @@ def _extract_text_from_csv(file_content: bytes) -> str:

        return markdown_table.strip()
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from CSV: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from CSV: {str(e)}") from e


 def _extract_text_from_excel(file_content: bytes) -> str:
@ -226,7 +247,8 @@ def _extract_text_from_excel(file_content: bytes) -> str:
        markdown_table = df.to_markdown(index=False)
        return markdown_table
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from Excel file: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from Excel file: {str(e)}") from e


 def _extract_text_from_ppt(file_content: bytes) -> str:
@ -235,7 +257,8 @@ def _extract_text_from_ppt(file_content: bytes) -> str:
            elements = partition_ppt(file=file)
        return "\n".join([getattr(element, "text", "") for element in elements])
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from PPT: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from PPT: {str(e)}") from e


 def _extract_text_from_pptx(file_content: bytes) -> str:
@ -244,7 +267,8 @@ def _extract_text_from_pptx(file_content: bytes) -> str:
            elements = partition_pptx(file=file)
        return "\n".join([getattr(element, "text", "") for element in elements])
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from PPTX: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from PPTX: {str(e)}") from e


 def _extract_text_from_epub(file_content: bytes) -> str:
@ -253,7 +277,8 @@ def _extract_text_from_epub(file_content: bytes) -> str:
            elements = partition_epub(file=file)
        return "\n".join([str(element) for element in elements])
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from EPUB: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from EPUB: {str(e)}") from e


 def _extract_text_from_eml(file_content: bytes) -> str:
@ -262,7 +287,8 @@ def _extract_text_from_eml(file_content: bytes) -> str:
            elements = partition_email(file=file)
        return "\n".join([str(element) for element in elements])
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from EML: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from EML: {str(e)}") from e


 def _extract_text_from_msg(file_content: bytes) -> str:
@ -271,4 +297,5 @@ def _extract_text_from_msg(file_content: bytes) -> str:
            elements = partition_msg(file=file)
        return "\n".join([str(element) for element in elements])
    except Exception as e:
-        raise TextExtractionError(f"Failed to extract text from MSG: {str(e)}") from e
+        raise TextExtractionError(
+            f"Failed to extract text from MSG: {str(e)}") from e
--- a/api/core/workflow/nodes/end/init.py
+++ b/api/core/workflow/nodes/end/init.py
@ -0,0 +1,4 @@
+from .end_node import EndNode
+from .entities import EndStreamParam
+
+__all__ = ["EndStreamParam", "EndNode"]
--- a/api/core/workflow/nodes/end/end_node.py
+++ b/api/core/workflow/nodes/end/end_node.py
@ -1,13 +1,14 @@
 from collections.abc import Mapping, Sequence
-from typing import Any, cast
+from typing import Any

-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
 from core.workflow.nodes.end.entities import EndNodeData
+from core.workflow.nodes.enums import NodeType
 from models.workflow import WorkflowNodeExecutionStatus


-class EndNode(BaseNode):
+class EndNode(BaseNode[EndNodeData]):
    _node_data_cls = EndNodeData
    _node_type = NodeType.END

@ -16,20 +17,27 @@ class EndNode(BaseNode):
        Run node
        :return:
        """
-        node_data = self.node_data
-        node_data = cast(EndNodeData, node_data)
-        output_variables = node_data.outputs
+        output_variables = self.node_data.outputs

        outputs = {}
        for variable_selector in output_variables:
-            value = self.graph_runtime_state.variable_pool.get_any(variable_selector.value_selector)
+            variable = self.graph_runtime_state.variable_pool.get(variable_selector.value_selector)
+            value = variable.to_object() if variable is not None else None
            outputs[variable_selector.variable] = value

-        return NodeRunResult(status=WorkflowNodeExecutionStatus.SUCCEEDED, inputs=outputs, outputs=outputs)
+        return NodeRunResult(
+            status=WorkflowNodeExecutionStatus.SUCCEEDED,
+            inputs=outputs,
+            outputs=outputs,
+        )

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: EndNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: EndNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
--- a/api/core/workflow/nodes/end/end_stream_generate_router.py
+++ b/api/core/workflow/nodes/end/end_stream_generate_router.py
@ -1,5 +1,5 @@
-from core.workflow.entities.node_entities import NodeType
 from core.workflow.nodes.end.entities import EndNodeData, EndStreamParam
+from core.workflow.nodes.enums import NodeType


 class EndStreamGeneratorRouter:
--- a/api/core/workflow/nodes/end/entities.py
+++ b/api/core/workflow/nodes/end/entities.py
@ -1,7 +1,7 @@
 from pydantic import BaseModel, Field

-from core.workflow.entities.base_node_data_entities import BaseNodeData
 from core.workflow.entities.variable_entities import VariableSelector
+from core.workflow.nodes.base import BaseNodeData


 class EndNodeData(BaseNodeData):
--- a/api/core/workflow/nodes/event.py
+++ b/api/core/workflow/nodes/event.py
@ -1,20 +0,0 @@
-from pydantic import BaseModel, Field
-
-from core.workflow.entities.node_entities import NodeRunResult
-
-
-class RunCompletedEvent(BaseModel):
-    run_result: NodeRunResult = Field(..., description="run result")
-
-
-class RunStreamChunkEvent(BaseModel):
-    chunk_content: str = Field(..., description="chunk content")
-    from_variable_selector: list[str] = Field(..., description="from variable selector")
-
-
-class RunRetrieverResourceEvent(BaseModel):
-    retriever_resources: list[dict] = Field(..., description="retriever resources")
-    context: str = Field(..., description="context")
-
-
-RunEvent = RunCompletedEvent | RunStreamChunkEvent | RunRetrieverResourceEvent
--- a/api/core/workflow/nodes/http_request/init.py
+++ b/api/core/workflow/nodes/http_request/init.py
@ -0,0 +1,4 @@
+from .entities import BodyData, HttpRequestNodeAuthorization, HttpRequestNodeBody, HttpRequestNodeData
+from .node import HttpRequestNode
+
+__all__ = ["HttpRequestNodeData", "HttpRequestNodeAuthorization", "HttpRequestNodeBody", "BodyData", "HttpRequestNode"]
--- a/api/core/workflow/nodes/http_request/entities.py
+++ b/api/core/workflow/nodes/http_request/entities.py
@ -1,15 +1,25 @@
-from typing import Literal, Optional, Union
+from collections.abc import Sequence
+from typing import Any, Literal, Optional

-from pydantic import BaseModel, ValidationInfo, field_validator
+import httpx
+from pydantic import BaseModel, Field, ValidationInfo, field_validator

 from configs import dify_config
-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData
+
+NON_FILE_CONTENT_TYPES = (
+    "application/json",
+    "application/xml",
+    "text/html",
+    "text/plain",
+    "application/x-www-form-urlencoded",
+)


 class HttpRequestNodeAuthorizationConfig(BaseModel):
-    type: Literal[None, "basic", "bearer", "custom"]
-    api_key: Union[None, str] = None
-    header: Union[None, str] = None
+    type: Literal["basic", "bearer", "custom"]
+    api_key: str
+    header: str = ""


 class HttpRequestNodeAuthorization(BaseModel):
@ -31,9 +41,26 @@ class HttpRequestNodeAuthorization(BaseModel):
            return v


+class BodyData(BaseModel):
+    key: str = ""
+    type: Literal["file", "text"]
+    value: str = ""
+    file: Sequence[str] = Field(default_factory=list)
+
+
 class HttpRequestNodeBody(BaseModel):
-    type: Literal["none", "form-data", "x-www-form-urlencoded", "raw-text", "json"]
-    data: Union[None, str] = None
+    type: Literal["none", "form-data", "x-www-form-urlencoded", "raw-text", "json", "binary"]
+    data: Sequence[BodyData] = Field(default_factory=list)
+
+    @field_validator("data", mode="before")
+    @classmethod
+    def check_data(cls, v: Any):
+        """For compatibility, if body is not set, return empty list."""
+        if not v:
+            return []
+        if isinstance(v, str):
+            return [BodyData(key="", type="text", value=v)]
+        return v


 class HttpRequestNodeTimeout(BaseModel):
@ -54,3 +81,51 @@ class HttpRequestNodeData(BaseNodeData):
    params: str
    body: Optional[HttpRequestNodeBody] = None
    timeout: Optional[HttpRequestNodeTimeout] = None
+
+
+class Response:
+    headers: dict[str, str]
+    response: httpx.Response
+
+    def __init__(self, response: httpx.Response):
+        self.response = response
+        self.headers = dict(response.headers)
+
+    @property
+    def is_file(self):
+        content_type = self.content_type
+        content_disposition = self.response.headers.get("Content-Disposition", "")
+
+        return "attachment" in content_disposition or (
+            not any(non_file in content_type for non_file in NON_FILE_CONTENT_TYPES)
+            and any(file_type in content_type for file_type in ("application/", "image/", "audio/", "video/"))
+        )
+
+    @property
+    def content_type(self) -> str:
+        return self.headers.get("Content-Type", "")
+
+    @property
+    def text(self) -> str:
+        return self.response.text
+
+    @property
+    def content(self) -> bytes:
+        return self.response.content
+
+    @property
+    def status_code(self) -> int:
+        return self.response.status_code
+
+    @property
+    def size(self) -> int:
+        return len(self.content)
+
+    @property
+    def readable_size(self) -> str:
+        if self.size < 1024:
+            return f"{self.size} bytes"
+        elif self.size < 1024 * 1024:
+            return f"{(self.size / 1024):.2f} KB"
+        else:
+            return f"{(self.size / 1024 / 1024):.2f} MB"
--- a/api/core/workflow/nodes/http_request/http_executor.py
+++ b/api/core/workflow/nodes/http_request/http_executor.py
@ -1,343 +0,0 @@
-import json
-from copy import deepcopy
-from random import randint
-from typing import Any, Optional, Union
-from urllib.parse import urlencode
-
-import httpx
-
-from configs import dify_config
-from core.helper import ssrf_proxy
-from core.workflow.entities.variable_entities import VariableSelector
-from core.workflow.entities.variable_pool import VariablePool
-from core.workflow.nodes.http_request.entities import (
-    HttpRequestNodeAuthorization,
-    HttpRequestNodeBody,
-    HttpRequestNodeData,
-    HttpRequestNodeTimeout,
-)
-from core.workflow.utils.variable_template_parser import VariableTemplateParser
-
-
-class HttpExecutorResponse:
-    headers: dict[str, str]
-    response: httpx.Response
-
-    def __init__(self, response: httpx.Response):
-        self.response = response
-        self.headers = dict(response.headers) if isinstance(self.response, httpx.Response) else {}
-
-    @property
-    def is_file(self) -> bool:
-        """
-        check if response is file
-        """
-        content_type = self.get_content_type()
-        file_content_types = ["image", "audio", "video"]
-
-        return any(v in content_type for v in file_content_types)
-
-    def get_content_type(self) -> str:
-        return self.headers.get("content-type", "")
-
-    def extract_file(self) -> tuple[str, bytes]:
-        """
-        extract file from response if content type is file related
-        """
-        if self.is_file:
-            return self.get_content_type(), self.body
-
-        return "", b""
-
-    @property
-    def content(self) -> str:
-        if isinstance(self.response, httpx.Response):
-            return self.response.text
-        else:
-            raise ValueError(f"Invalid response type {type(self.response)}")
-
-    @property
-    def body(self) -> bytes:
-        if isinstance(self.response, httpx.Response):
-            return self.response.content
-        else:
-            raise ValueError(f"Invalid response type {type(self.response)}")
-
-    @property
-    def status_code(self) -> int:
-        if isinstance(self.response, httpx.Response):
-            return self.response.status_code
-        else:
-            raise ValueError(f"Invalid response type {type(self.response)}")
-
-    @property
-    def size(self) -> int:
-        return len(self.body)
-
-    @property
-    def readable_size(self) -> str:
-        if self.size < 1024:
-            return f"{self.size} bytes"
-        elif self.size < 1024 * 1024:
-            return f"{(self.size / 1024):.2f} KB"
-        else:
-            return f"{(self.size / 1024 / 1024):.2f} MB"
-
-
-class HttpExecutor:
-    server_url: str
-    method: str
-    authorization: HttpRequestNodeAuthorization
-    params: dict[str, Any]
-    headers: dict[str, Any]
-    body: Union[None, str]
-    files: Union[None, dict[str, Any]]
-    boundary: str
-    variable_selectors: list[VariableSelector]
-    timeout: HttpRequestNodeTimeout
-
-    def __init__(
-        self,
-        node_data: HttpRequestNodeData,
-        timeout: HttpRequestNodeTimeout,
-        variable_pool: Optional[VariablePool] = None,
-    ):
-        self.server_url = node_data.url
-        self.method = node_data.method
-        self.authorization = node_data.authorization
-        self.timeout = timeout
-        self.params = {}
-        self.headers = {}
-        self.body = None
-        self.files = None
-
-        # init template
-        self.variable_selectors = []
-        self._init_template(node_data, variable_pool)
-
-    @staticmethod
-    def _is_json_body(body: HttpRequestNodeBody):
-        """
-        check if body is json
-        """
-        if body and body.type == "json" and body.data:
-            try:
-                json.loads(body.data)
-                return True
-            except:
-                return False
-
-        return False
-
-    @staticmethod
-    def _to_dict(convert_text: str):
-        """
-        Convert the string like `aa:bb\n cc:dd` to dict `{aa:bb, cc:dd}`
-        """
-        kv_paris = convert_text.split("\n")
-        result = {}
-        for kv in kv_paris:
-            if not kv.strip():
-                continue
-
-            kv = kv.split(":", maxsplit=1)
-            if len(kv) == 1:
-                k, v = kv[0], ""
-            else:
-                k, v = kv
-            result[k.strip()] = v
-        return result
-
-    def _init_template(self, node_data: HttpRequestNodeData, variable_pool: Optional[VariablePool] = None):
-        # extract all template in url
-        self.server_url, server_url_variable_selectors = self._format_template(node_data.url, variable_pool)
-
-        # extract all template in params
-        params, params_variable_selectors = self._format_template(node_data.params, variable_pool)
-        self.params = self._to_dict(params)
-
-        # extract all template in headers
-        headers, headers_variable_selectors = self._format_template(node_data.headers, variable_pool)
-        self.headers = self._to_dict(headers)
-
-        # extract all template in body
-        body_data_variable_selectors = []
-        if node_data.body:
-            # check if it's a valid JSON
-            is_valid_json = self._is_json_body(node_data.body)
-
-            body_data = node_data.body.data or ""
-            if body_data:
-                body_data, body_data_variable_selectors = self._format_template(body_data, variable_pool, is_valid_json)
-
-            content_type_is_set = any(key.lower() == "content-type" for key in self.headers)
-            if node_data.body.type == "json" and not content_type_is_set:
-                self.headers["Content-Type"] = "application/json"
-            elif node_data.body.type == "x-www-form-urlencoded" and not content_type_is_set:
-                self.headers["Content-Type"] = "application/x-www-form-urlencoded"
-
-            if node_data.body.type in {"form-data", "x-www-form-urlencoded"}:
-                body = self._to_dict(body_data)
-
-                if node_data.body.type == "form-data":
-                    self.files = {k: ("", v) for k, v in body.items()}
-                    random_str = lambda n: "".join([chr(randint(97, 122)) for _ in range(n)])
-                    self.boundary = f"----WebKitFormBoundary{random_str(16)}"
-
-                    self.headers["Content-Type"] = f"multipart/form-data; boundary={self.boundary}"
-                else:
-                    self.body = urlencode(body)
-            elif node_data.body.type in {"json", "raw-text"}:
-                self.body = body_data
-            elif node_data.body.type == "none":
-                self.body = ""
-
-        self.variable_selectors = (
-            server_url_variable_selectors
-            + params_variable_selectors
-            + headers_variable_selectors
-            + body_data_variable_selectors
-        )
-
-    def _assembling_headers(self) -> dict[str, Any]:
-        authorization = deepcopy(self.authorization)
-        headers = deepcopy(self.headers) or {}
-        if self.authorization.type == "api-key":
-            if self.authorization.config is None:
-                raise ValueError("self.authorization config is required")
-            if authorization.config is None:
-                raise ValueError("authorization config is required")
-
-            if self.authorization.config.api_key is None:
-                raise ValueError("api_key is required")
-
-            if not authorization.config.header:
-                authorization.config.header = "Authorization"
-
-            if self.authorization.config.type == "bearer":
-                headers[authorization.config.header] = f"Bearer {authorization.config.api_key}"
-            elif self.authorization.config.type == "basic":
-                headers[authorization.config.header] = f"Basic {authorization.config.api_key}"
-            elif self.authorization.config.type == "custom":
-                headers[authorization.config.header] = authorization.config.api_key
-
-        return headers
-
-    def _validate_and_parse_response(self, response: httpx.Response) -> HttpExecutorResponse:
-        """
-        validate the response
-        """
-        if isinstance(response, httpx.Response):
-            executor_response = HttpExecutorResponse(response)
-        else:
-            raise ValueError(f"Invalid response type {type(response)}")
-
-        threshold_size = (
-            dify_config.HTTP_REQUEST_NODE_MAX_BINARY_SIZE
-            if executor_response.is_file
-            else dify_config.HTTP_REQUEST_NODE_MAX_TEXT_SIZE
-        )
-        if executor_response.size > threshold_size:
-            raise ValueError(
-                f'{"File" if executor_response.is_file else "Text"} size is too large,'
-                f' max size is {threshold_size / 1024 / 1024:.2f} MB,'
-                f' but current size is {executor_response.readable_size}.'
-            )
-
-        return executor_response
-
-    def _do_http_request(self, headers: dict[str, Any]) -> httpx.Response:
-        """
-        do http request depending on api bundle
-        """
-        kwargs = {
-            "url": self.server_url,
-            "headers": headers,
-            "params": self.params,
-            "timeout": (self.timeout.connect, self.timeout.read, self.timeout.write),
-            "follow_redirects": True,
-        }
-
-        if self.method in {"get", "head", "post", "put", "delete", "patch"}:
-            response = getattr(ssrf_proxy, self.method)(data=self.body, files=self.files, **kwargs)
-        else:
-            raise ValueError(f"Invalid http method {self.method}")
-        return response
-
-    def invoke(self) -> HttpExecutorResponse:
-        """
-        invoke http request
-        """
-        # assemble headers
-        headers = self._assembling_headers()
-
-        # do http request
-        response = self._do_http_request(headers)
-
-        # validate response
-        return self._validate_and_parse_response(response)
-
-    def to_raw_request(self) -> str:
-        """
-        convert to raw request
-        """
-        server_url = self.server_url
-        if self.params:
-            server_url += f"?{urlencode(self.params)}"
-
-        raw_request = f"{self.method.upper()} {server_url} HTTP/1.1\n"
-
-        headers = self._assembling_headers()
-        for k, v in headers.items():
-            # get authorization header
-            if self.authorization.type == "api-key":
-                authorization_header = "Authorization"
-                if self.authorization.config and self.authorization.config.header:
-                    authorization_header = self.authorization.config.header
-
-                if k.lower() == authorization_header.lower():
-                    raw_request += f'{k}: {"*" * len(v)}\n'
-                    continue
-
-            raw_request += f"{k}: {v}\n"
-
-        raw_request += "\n"
-
-        # if files, use multipart/form-data with boundary
-        if self.files:
-            boundary = self.boundary
-            raw_request += f"--{boundary}"
-            for k, v in self.files.items():
-                raw_request += f'\nContent-Disposition: form-data; name="{k}"\n\n'
-                raw_request += f"{v[1]}\n"
-                raw_request += f"--{boundary}"
-            raw_request += "--"
-        else:
-            raw_request += self.body or ""
-
-        return raw_request
-
-    def _format_template(
-        self, template: str, variable_pool: Optional[VariablePool], escape_quotes: bool = False
-    ) -> tuple[str, list[VariableSelector]]:
-        """
-        format template
-        """
-        variable_template_parser = VariableTemplateParser(template=template)
-        variable_selectors = variable_template_parser.extract_variable_selectors()
-
-        if variable_pool:
-            variable_value_mapping = {}
-            for variable_selector in variable_selectors:
-                variable = variable_pool.get_any(variable_selector.value_selector)
-                if variable is None:
-                    raise ValueError(f"Variable {variable_selector.variable} not found")
-                if escape_quotes and isinstance(variable, str):
-                    value = variable.replace('"', '\\"').replace("\n", "\\n")
-                else:
-                    value = variable
-                variable_value_mapping[variable_selector.variable] = value
-
-            return variable_template_parser.format(variable_value_mapping), variable_selectors
-        else:
-            return template, variable_selectors
--- a/api/core/workflow/nodes/http_request/http_request_node.py
+++ b/api/core/workflow/nodes/http_request/http_request_node.py
@ -1,165 +0,0 @@
-import logging
-from collections.abc import Mapping, Sequence
-from mimetypes import guess_extension
-from os import path
-from typing import Any, cast
-
-from configs import dify_config
-from core.app.segments import parser
-from core.file.file_obj import FileTransferMethod, FileType, FileVar
-from core.tools.tool_file_manager import ToolFileManager
-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
-from core.workflow.nodes.http_request.entities import (
-    HttpRequestNodeData,
-    HttpRequestNodeTimeout,
-)
-from core.workflow.nodes.http_request.http_executor import HttpExecutor, HttpExecutorResponse
-from models.workflow import WorkflowNodeExecutionStatus
-
-HTTP_REQUEST_DEFAULT_TIMEOUT = HttpRequestNodeTimeout(
-    connect=dify_config.HTTP_REQUEST_MAX_CONNECT_TIMEOUT,
-    read=dify_config.HTTP_REQUEST_MAX_READ_TIMEOUT,
-    write=dify_config.HTTP_REQUEST_MAX_WRITE_TIMEOUT,
-)
-
-
-class HttpRequestNode(BaseNode):
-    _node_data_cls = HttpRequestNodeData
-    _node_type = NodeType.HTTP_REQUEST
-
-    @classmethod
-    def get_default_config(cls, filters: dict | None = None) -> dict:
-        return {
-            "type": "http-request",
-            "config": {
-                "method": "get",
-                "authorization": {
-                    "type": "no-auth",
-                },
-                "body": {"type": "none"},
-                "timeout": {
-                    **HTTP_REQUEST_DEFAULT_TIMEOUT.model_dump(),
-                    "max_connect_timeout": dify_config.HTTP_REQUEST_MAX_CONNECT_TIMEOUT,
-                    "max_read_timeout": dify_config.HTTP_REQUEST_MAX_READ_TIMEOUT,
-                    "max_write_timeout": dify_config.HTTP_REQUEST_MAX_WRITE_TIMEOUT,
-                },
-            },
-        }
-
-    def _run(self) -> NodeRunResult:
-        node_data: HttpRequestNodeData = cast(HttpRequestNodeData, self.node_data)
-        # TODO: Switch to use segment directly
-        if node_data.authorization.config and node_data.authorization.config.api_key:
-            node_data.authorization.config.api_key = parser.convert_template(
-                template=node_data.authorization.config.api_key, variable_pool=self.graph_runtime_state.variable_pool
-            ).text
-
-        # init http executor
-        http_executor = None
-        try:
-            http_executor = HttpExecutor(
-                node_data=node_data,
-                timeout=self._get_request_timeout(node_data),
-                variable_pool=self.graph_runtime_state.variable_pool,
-            )
-
-            # invoke http executor
-            response = http_executor.invoke()
-        except Exception as e:
-            process_data = {}
-            if http_executor:
-                process_data = {
-                    "request": http_executor.to_raw_request(),
-                }
-            return NodeRunResult(
-                status=WorkflowNodeExecutionStatus.FAILED,
-                error=str(e),
-                process_data=process_data,
-            )
-
-        files = self.extract_files(http_executor.server_url, response)
-
-        return NodeRunResult(
-            status=WorkflowNodeExecutionStatus.SUCCEEDED,
-            outputs={
-                "status_code": response.status_code,
-                "body": response.content if not files else "",
-                "headers": response.headers,
-                "files": files,
-            },
-            process_data={
-                "request": http_executor.to_raw_request(),
-            },
-        )
-
-    @staticmethod
-    def _get_request_timeout(node_data: HttpRequestNodeData) -> HttpRequestNodeTimeout:
-        timeout = node_data.timeout
-        if timeout is None:
-            return HTTP_REQUEST_DEFAULT_TIMEOUT
-
-        timeout.connect = timeout.connect or HTTP_REQUEST_DEFAULT_TIMEOUT.connect
-        timeout.read = timeout.read or HTTP_REQUEST_DEFAULT_TIMEOUT.read
-        timeout.write = timeout.write or HTTP_REQUEST_DEFAULT_TIMEOUT.write
-        return timeout
-
-    @classmethod
-    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: HttpRequestNodeData
-    ) -> Mapping[str, Sequence[str]]:
-        """
-        Extract variable selector to variable mapping
-        :param graph_config: graph config
-        :param node_id: node id
-        :param node_data: node data
-        :return:
-        """
-        try:
-            http_executor = HttpExecutor(node_data=node_data, timeout=HTTP_REQUEST_DEFAULT_TIMEOUT)
-
-            variable_selectors = http_executor.variable_selectors
-
-            variable_mapping = {}
-            for variable_selector in variable_selectors:
-                variable_mapping[node_id + "." + variable_selector.variable] = variable_selector.value_selector
-
-            return variable_mapping
-        except Exception as e:
-            logging.exception(f"Failed to extract variable selector to variable mapping: {e}")
-            return {}
-
-    def extract_files(self, url: str, response: HttpExecutorResponse) -> list[FileVar]:
-        """
-        Extract files from response
-        """
-        files = []
-        mimetype, file_binary = response.extract_file()
-
-        if mimetype:
-            # extract filename from url
-            filename = path.basename(url)
-            # extract extension if possible
-            extension = guess_extension(mimetype) or ".bin"
-
-            tool_file = ToolFileManager.create_file_by_raw(
-                user_id=self.user_id,
-                tenant_id=self.tenant_id,
-                conversation_id=None,
-                file_binary=file_binary,
-                mimetype=mimetype,
-            )
-
-            files.append(
-                FileVar(
-                    tenant_id=self.tenant_id,
-                    type=FileType.IMAGE,
-                    transfer_method=FileTransferMethod.TOOL_FILE,
-                    related_id=tool_file.id,
-                    filename=filename,
-                    extension=extension,
-                    mime_type=mimetype,
-                )
-            )
-
-        return files
--- a/api/core/workflow/nodes/if_else/init.py
+++ b/api/core/workflow/nodes/if_else/init.py
@ -0,0 +1,3 @@
+from .if_else_node import IfElseNode
+
+__all__ = ["IfElseNode"]
--- a/api/core/workflow/nodes/if_else/entities.py
+++ b/api/core/workflow/nodes/if_else/entities.py
@ -1,8 +1,8 @@
 from typing import Literal, Optional

-from pydantic import BaseModel
+from pydantic import BaseModel, Field

-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData
 from core.workflow.utils.condition.entities import Condition


@ -21,6 +21,6 @@ class IfElseNodeData(BaseNodeData):
        conditions: list[Condition]

    logical_operator: Optional[Literal["and", "or"]] = "and"
-    conditions: Optional[list[Condition]] = None
+    conditions: Optional[list[Condition]] = Field(default=None, deprecated=True)

    cases: Optional[list[Case]] = None
--- a/api/core/workflow/nodes/if_else/if_else_node.py
+++ b/api/core/workflow/nodes/if_else/if_else_node.py
@ -1,14 +1,19 @@
 from collections.abc import Mapping, Sequence
-from typing import Any, cast
+from typing import Any, Literal

-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from typing_extensions import deprecated
+
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.entities.variable_pool import VariablePool
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.if_else.entities import IfElseNodeData
+from core.workflow.utils.condition.entities import Condition
 from core.workflow.utils.condition.processor import ConditionProcessor
 from models.workflow import WorkflowNodeExecutionStatus


-class IfElseNode(BaseNode):
+class IfElseNode(BaseNode[IfElseNodeData]):
    _node_data_cls = IfElseNodeData
    _node_type = NodeType.IF_ELSE

@ -17,9 +22,6 @@ class IfElseNode(BaseNode):
        Run node
        :return:
        """
-        node_data = self.node_data
-        node_data = cast(IfElseNodeData, node_data)
-
        node_inputs: dict[str, list] = {"conditions": []}

        process_datas: dict[str, list] = {"condition_results": []}
@ -30,15 +32,14 @@ class IfElseNode(BaseNode):
        condition_processor = ConditionProcessor()
        try:
            # Check if the new cases structure is used
-            if node_data.cases:
-                for case in node_data.cases:
-                    input_conditions, group_result = condition_processor.process_conditions(
-                        variable_pool=self.graph_runtime_state.variable_pool, conditions=case.conditions
+            if self.node_data.cases:
+                for case in self.node_data.cases:
+                    input_conditions, group_result, final_result = condition_processor.process_conditions(
+                        variable_pool=self.graph_runtime_state.variable_pool,
+                        conditions=case.conditions,
+                        operator=case.logical_operator,
                    )

-                    # Apply the logical operator for the current case
-                    final_result = all(group_result) if case.logical_operator == "and" else any(group_result)
-
                    process_datas["condition_results"].append(
                        {
                            "group": case.model_dump(),
@ -53,13 +54,15 @@ class IfElseNode(BaseNode):
                        break

            else:
+                # TODO: Update database then remove this
                # Fallback to old structure if cases are not defined
-                input_conditions, group_result = condition_processor.process_conditions(
-                    variable_pool=self.graph_runtime_state.variable_pool, conditions=node_data.conditions
+                input_conditions, group_result, final_result = _should_not_use_old_function(
+                    condition_processor=condition_processor,
+                    variable_pool=self.graph_runtime_state.variable_pool,
+                    conditions=self.node_data.conditions or [],
+                    operator=self.node_data.logical_operator or "and",
                )

-                final_result = all(group_result) if node_data.logical_operator == "and" else any(group_result)
-
                selected_case_id = "true" if final_result else "false"

                process_datas["condition_results"].append(
@ -87,7 +90,11 @@ class IfElseNode(BaseNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: IfElseNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: IfElseNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
@ -97,3 +104,18 @@ class IfElseNode(BaseNode):
        :return:
        """
        return {}
+
+
+@deprecated("This function is deprecated. You should use the new cases structure.")
+def _should_not_use_old_function(
+    *,
+    condition_processor: ConditionProcessor,
+    variable_pool: VariablePool,
+    conditions: list[Condition],
+    operator: Literal["and", "or"],
+):
+    return condition_processor.process_conditions(
+        variable_pool=variable_pool,
+        conditions=conditions,
+        operator=operator,
+    )
--- a/api/core/workflow/nodes/iteration/init.py
+++ b/api/core/workflow/nodes/iteration/init.py
@ -0,0 +1,5 @@
+from .entities import IterationNodeData
+from .iteration_node import IterationNode
+from .iteration_start_node import IterationStartNode
+
+__all__ = ["IterationNode", "IterationNodeData", "IterationStartNode"]
--- a/api/core/workflow/nodes/iteration/entities.py
+++ b/api/core/workflow/nodes/iteration/entities.py
@ -1,6 +1,8 @@
 from typing import Any, Optional

-from core.workflow.entities.base_node_data_entities import BaseIterationNodeData, BaseIterationState, BaseNodeData
+from pydantic import Field
+
+from core.workflow.nodes.base import BaseIterationNodeData, BaseIterationState, BaseNodeData


 class IterationNodeData(BaseIterationNodeData):
@ -26,7 +28,7 @@ class IterationState(BaseIterationState):
    Iteration State.
    """

-    outputs: list[Any] = None
+    outputs: list[Any] = Field(default_factory=list)
    current_output: Optional[Any] = None

    class MetaData(BaseIterationState.MetaData):
--- a/api/core/workflow/nodes/iteration/iteration_node.py
+++ b/api/core/workflow/nodes/iteration/iteration_node.py
@ -5,7 +5,8 @@ from typing import Any, cast

 from configs import dify_config
 from core.model_runtime.utils.encoders import jsonable_encoder
-from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult, NodeType
+from core.variables import IntegerSegment
+from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult
 from core.workflow.graph_engine.entities.event import (
    BaseGraphEvent,
    BaseNodeEvent,
@ -20,15 +21,16 @@ from core.workflow.graph_engine.entities.event import (
    NodeRunSucceededEvent,
 )
 from core.workflow.graph_engine.entities.graph import Graph
-from core.workflow.nodes.base_node import BaseNode
-from core.workflow.nodes.event import RunCompletedEvent, RunEvent
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
+from core.workflow.nodes.event import NodeEvent, RunCompletedEvent
 from core.workflow.nodes.iteration.entities import IterationNodeData
 from models.workflow import WorkflowNodeExecutionStatus

 logger = logging.getLogger(__name__)


-class IterationNode(BaseNode):
+class IterationNode(BaseNode[IterationNodeData]):
    """
    Iteration Node.
    """
@ -36,16 +38,24 @@ class IterationNode(BaseNode):
    _node_data_cls = IterationNodeData
    _node_type = NodeType.ITERATION

-    def _run(self) -> Generator[RunEvent | InNodeEvent, None, None]:
+    def _run(self) -> Generator[NodeEvent | InNodeEvent, None, None]:
        """
        Run the node.
        """
-        self.node_data = cast(IterationNodeData, self.node_data)
        iterator_list_segment = self.graph_runtime_state.variable_pool.get(self.node_data.iterator_selector)

        if not iterator_list_segment:
            raise ValueError(f"Iterator variable {self.node_data.iterator_selector} not found")

+        if len(iterator_list_segment.value) == 0:
+            yield RunCompletedEvent(
+                run_result=NodeRunResult(
+                    status=WorkflowNodeExecutionStatus.SUCCEEDED,
+                    outputs={"output": []},
+                )
+            )
+            return
+
        iterator_list_value = iterator_list_segment.to_object()

        if not isinstance(iterator_list_value, list):
@ -138,9 +148,16 @@ class IterationNode(BaseNode):

                            if NodeRunMetadataKey.ITERATION_ID not in metadata:
                                metadata[NodeRunMetadataKey.ITERATION_ID] = self.node_id
-                                metadata[NodeRunMetadataKey.ITERATION_INDEX] = variable_pool.get_any(
-                                    [self.node_id, "index"]
-                                )
+                                index_variable = variable_pool.get([self.node_id, "index"])
+                                if not isinstance(index_variable, IntegerSegment):
+                                    yield RunCompletedEvent(
+                                        run_result=NodeRunResult(
+                                            status=WorkflowNodeExecutionStatus.FAILED,
+                                            error=f"Invalid index variable type: {type(index_variable)}",
+                                        )
+                                    )
+                                    return
+                                metadata[NodeRunMetadataKey.ITERATION_INDEX] = index_variable.value
                                event.route_node_state.node_run_result.metadata = metadata

                        yield event
@ -172,19 +189,28 @@ class IterationNode(BaseNode):
                        yield event

                # append to iteration output variable list
-                current_iteration_output = variable_pool.get_any(self.node_data.output_selector)
+                current_iteration_output_variable = variable_pool.get(self.node_data.output_selector)
+                if current_iteration_output_variable is None:
+                    yield RunCompletedEvent(
+                        run_result=NodeRunResult(
+                            status=WorkflowNodeExecutionStatus.FAILED,
+                            error=f"Iteration output variable {self.node_data.output_selector} not found",
+                        )
+                    )
+                    return
+                current_iteration_output = current_iteration_output_variable.to_object()
                outputs.append(current_iteration_output)

                # remove all nodes outputs from variable pool
                for node_id in iteration_graph.node_ids:
-                    variable_pool.remove_node(node_id)
+                    variable_pool.remove([node_id])

                # move to next iteration
-                current_index = variable_pool.get([self.node_id, "index"])
-                if current_index is None:
+                current_index_variable = variable_pool.get([self.node_id, "index"])
+                if not isinstance(current_index_variable, IntegerSegment):
                    raise ValueError(f"iteration {self.node_id} current index not found")

-                next_index = int(current_index.to_object()) + 1
+                next_index = current_index_variable.value + 1
                variable_pool.add([self.node_id, "index"], next_index)

                if next_index < len(iterator_list_value):
@ -196,9 +222,7 @@ class IterationNode(BaseNode):
                    iteration_node_type=self.node_type,
                    iteration_node_data=self.node_data,
                    index=next_index,
-                    pre_iteration_output=jsonable_encoder(current_iteration_output)
-                    if current_iteration_output
-                    else None,
+                    pre_iteration_output=jsonable_encoder(current_iteration_output),
                )

            yield IterationRunSucceededEvent(
@ -247,7 +271,11 @@ class IterationNode(BaseNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: IterationNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: IterationNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
@ -273,15 +301,13 @@ class IterationNode(BaseNode):
            # variable selector to variable mapping
            try:
                # Get node class
-                from core.workflow.nodes.node_mapping import node_classes
+                from core.workflow.nodes.node_mapping import node_type_classes_mapping

-                node_type = NodeType.value_of(sub_node_config.get("data", {}).get("type"))
-                node_cls = node_classes.get(node_type)
+                node_type = NodeType(sub_node_config.get("data", {}).get("type"))
+                node_cls = node_type_classes_mapping.get(node_type)
                if not node_cls:
                    continue

-                node_cls = cast(BaseNode, node_cls)
-
                sub_node_variable_mapping = node_cls.extract_variable_selector_to_variable_mapping(
                    graph_config=graph_config, config=sub_node_config
                )
--- a/api/core/workflow/nodes/iteration/iteration_start_node.py
+++ b/api/core/workflow/nodes/iteration/iteration_start_node.py
@ -1,8 +1,9 @@
 from collections.abc import Mapping, Sequence
 from typing import Any

-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.iteration.entities import IterationNodeData, IterationStartNodeData
 from models.workflow import WorkflowNodeExecutionStatus

--- a/api/core/workflow/nodes/knowledge_retrieval/init.py
+++ b/api/core/workflow/nodes/knowledge_retrieval/init.py
@ -0,0 +1,3 @@
+from .knowledge_retrieval_node import KnowledgeRetrievalNode
+
+__all__ = ["KnowledgeRetrievalNode"]
--- a/api/core/workflow/nodes/knowledge_retrieval/entities.py
+++ b/api/core/workflow/nodes/knowledge_retrieval/entities.py
@ -2,7 +2,7 @@ from typing import Any, Literal, Optional

 from pydantic import BaseModel

-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData


 class RerankingModelConfig(BaseModel):
--- a/api/core/workflow/nodes/knowledge_retrieval/knowledge_retrieval_node.py
+++ b/api/core/workflow/nodes/knowledge_retrieval/knowledge_retrieval_node.py
@ -14,8 +14,10 @@ from core.model_runtime.entities.model_entities import ModelFeature, ModelType
 from core.model_runtime.model_providers.__base.large_language_model import LargeLanguageModel
 from core.rag.retrieval.dataset_retrieval import DatasetRetrieval
 from core.rag.retrieval.retrieval_methods import RetrievalMethod
-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.variables import StringSegment
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.knowledge_retrieval.entities import KnowledgeRetrievalNodeData
 from extensions.ext_database import db
 from models.dataset import Dataset, Document, DocumentSegment
@ -32,16 +34,20 @@ default_retrieval_model = {
 }


-class KnowledgeRetrievalNode(BaseNode):
+class KnowledgeRetrievalNode(BaseNode[KnowledgeRetrievalNodeData]):
    _node_data_cls = KnowledgeRetrievalNodeData
-    node_type = NodeType.KNOWLEDGE_RETRIEVAL
+    _node_type = NodeType.KNOWLEDGE_RETRIEVAL

    def _run(self) -> NodeRunResult:
-        node_data = cast(KnowledgeRetrievalNodeData, self.node_data)
-
        # extract variables
-        variable = self.graph_runtime_state.variable_pool.get_any(node_data.query_variable_selector)
-        query = variable
+        variable = self.graph_runtime_state.variable_pool.get(self.node_data.query_variable_selector)
+        if not isinstance(variable, StringSegment):
+            return NodeRunResult(
+                status=WorkflowNodeExecutionStatus.FAILED,
+                inputs={},
+                error="Query variable is not string type.",
+            )
+        query = variable.value
        variables = {"query": query}
        if not query:
            return NodeRunResult(
@ -49,7 +55,7 @@ class KnowledgeRetrievalNode(BaseNode):
            )
        # retrieve knowledge
        try:
-            results = self._fetch_dataset_retriever(node_data=node_data, query=query)
+            results = self._fetch_dataset_retriever(node_data=self.node_data, query=query)
            outputs = {"result": results}
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.SUCCEEDED, inputs=variables, process_data=None, outputs=outputs
@ -244,7 +250,11 @@ class KnowledgeRetrievalNode(BaseNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: KnowledgeRetrievalNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: KnowledgeRetrievalNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
--- a/api/core/workflow/nodes/llm/init.py
+++ b/api/core/workflow/nodes/llm/init.py
@ -0,0 +1,17 @@
+from .entities import (
+    LLMNodeChatModelMessage,
+    LLMNodeCompletionModelPromptTemplate,
+    LLMNodeData,
+    ModelConfig,
+    VisionConfig,
+)
+from .node import LLMNode
+
+__all__ = [
+    "LLMNode",
+    "LLMNodeChatModelMessage",
+    "LLMNodeCompletionModelPromptTemplate",
+    "LLMNodeData",
+    "ModelConfig",
+    "VisionConfig",
+]
--- a/api/core/workflow/nodes/llm/entities.py
+++ b/api/core/workflow/nodes/llm/entities.py
@ -1,17 +1,15 @@
-from typing import Any, Literal, Optional, Union
+from collections.abc import Sequence
+from typing import Any, Optional

-from pydantic import BaseModel
+from pydantic import BaseModel, Field, field_validator

+from core.model_runtime.entities import ImagePromptMessageContent
 from core.prompt.entities.advanced_prompt_entities import ChatModelMessage, CompletionModelPromptTemplate, MemoryConfig
-from core.workflow.entities.base_node_data_entities import BaseNodeData
 from core.workflow.entities.variable_entities import VariableSelector
+from core.workflow.nodes.base import BaseNodeData


 class ModelConfig(BaseModel):
-    """
-    Model Config.
-    """
-
    provider: str
    name: str
    mode: str
@ -19,62 +17,43 @@ class ModelConfig(BaseModel):


 class ContextConfig(BaseModel):
-    """
-    Context Config.
-    """
-
    enabled: bool
    variable_selector: Optional[list[str]] = None


+class VisionConfigOptions(BaseModel):
+    variable_selector: Sequence[str] = Field(default_factory=lambda: ["sys", "files"])
+    detail: ImagePromptMessageContent.DETAIL = ImagePromptMessageContent.DETAIL.HIGH
+
+
 class VisionConfig(BaseModel):
-    """
-    Vision Config.
-    """
+    enabled: bool = False
+    configs: VisionConfigOptions = Field(default_factory=VisionConfigOptions)

-    class Configs(BaseModel):
-        """
-        Configs.
-        """
-
-        detail: Literal["low", "high"]
-
-    enabled: bool
-    configs: Optional[Configs] = None
+    @field_validator("configs", mode="before")
+    @classmethod
+    def convert_none_configs(cls, v: Any):
+        if v is None:
+            return VisionConfigOptions()
+        return v


 class PromptConfig(BaseModel):
-    """
-    Prompt Config.
-    """
-
    jinja2_variables: Optional[list[VariableSelector]] = None


 class LLMNodeChatModelMessage(ChatModelMessage):
-    """
-    LLM Node Chat Model Message.
-    """
-
    jinja2_text: Optional[str] = None


 class LLMNodeCompletionModelPromptTemplate(CompletionModelPromptTemplate):
-    """
-    LLM Node Chat Model Prompt Template.
-    """
-
    jinja2_text: Optional[str] = None


 class LLMNodeData(BaseNodeData):
-    """
-    LLM Node Data.
-    """
-
    model: ModelConfig
-    prompt_template: Union[list[LLMNodeChatModelMessage], LLMNodeCompletionModelPromptTemplate]
+    prompt_template: Sequence[LLMNodeChatModelMessage] | LLMNodeCompletionModelPromptTemplate
    prompt_config: Optional[PromptConfig] = None
    memory: Optional[MemoryConfig] = None
    context: ContextConfig
-    vision: VisionConfig
+    vision: VisionConfig = Field(default_factory=VisionConfig)
--- a/api/core/workflow/nodes/llm/llm_node.py
+++ b/api/core/workflow/nodes/llm/llm_node.py
@ -1,774 +0,0 @@
-import json
-from collections.abc import Generator, Mapping, Sequence
-from copy import deepcopy
-from typing import TYPE_CHECKING, Any, Optional, cast
-
-from pydantic import BaseModel
-
-from core.app.entities.app_invoke_entities import ModelConfigWithCredentialsEntity
-from core.entities.model_entities import ModelStatus
-from core.entities.provider_entities import QuotaUnit
-from core.errors.error import ModelCurrentlyNotSupportError, ProviderTokenNotInitError, QuotaExceededError
-from core.memory.token_buffer_memory import TokenBufferMemory
-from core.model_manager import ModelInstance, ModelManager
-from core.model_runtime.entities.llm_entities import LLMResult, LLMUsage
-from core.model_runtime.entities.message_entities import (
-    ImagePromptMessageContent,
-    PromptMessage,
-    PromptMessageContentType,
-)
-from core.model_runtime.entities.model_entities import ModelType
-from core.model_runtime.model_providers.__base.large_language_model import LargeLanguageModel
-from core.model_runtime.utils.encoders import jsonable_encoder
-from core.prompt.advanced_prompt_transform import AdvancedPromptTransform
-from core.prompt.entities.advanced_prompt_entities import CompletionModelPromptTemplate, MemoryConfig
-from core.prompt.utils.prompt_message_util import PromptMessageUtil
-from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult, NodeType
-from core.workflow.entities.variable_pool import VariablePool
-from core.workflow.enums import SystemVariableKey
-from core.workflow.graph_engine.entities.event import InNodeEvent
-from core.workflow.nodes.base_node import BaseNode
-from core.workflow.nodes.event import RunCompletedEvent, RunEvent, RunRetrieverResourceEvent, RunStreamChunkEvent
-from core.workflow.nodes.llm.entities import (
-    LLMNodeChatModelMessage,
-    LLMNodeCompletionModelPromptTemplate,
-    LLMNodeData,
-    ModelConfig,
-)
-from core.workflow.utils.variable_template_parser import VariableTemplateParser
-from extensions.ext_database import db
-from models.model import Conversation
-from models.provider import Provider, ProviderType
-from models.workflow import WorkflowNodeExecutionStatus
-
-if TYPE_CHECKING:
-    from core.file.file_obj import FileVar
-
-
-class ModelInvokeCompleted(BaseModel):
-    """
-    Model invoke completed
-    """
-
-    text: str
-    usage: LLMUsage
-    finish_reason: Optional[str] = None
-
-
-class LLMNode(BaseNode):
-    _node_data_cls = LLMNodeData
-    _node_type = NodeType.LLM
-
-    def _run(self) -> Generator[RunEvent | InNodeEvent, None, None]:
-        """
-        Run node
-        :return:
-        """
-        node_data = cast(LLMNodeData, deepcopy(self.node_data))
-        variable_pool = self.graph_runtime_state.variable_pool
-
-        node_inputs = None
-        process_data = None
-
-        try:
-            # init messages template
-            node_data.prompt_template = self._transform_chat_messages(node_data.prompt_template)
-
-            # fetch variables and fetch values from variable pool
-            inputs = self._fetch_inputs(node_data, variable_pool)
-
-            # fetch jinja2 inputs
-            jinja_inputs = self._fetch_jinja_inputs(node_data, variable_pool)
-
-            # merge inputs
-            inputs.update(jinja_inputs)
-
-            node_inputs = {}
-
-            # fetch files
-            files = self._fetch_files(node_data, variable_pool)
-
-            if files:
-                node_inputs["#files#"] = [file.to_dict() for file in files]
-
-            # fetch context value
-            generator = self._fetch_context(node_data, variable_pool)
-            context = None
-            for event in generator:
-                if isinstance(event, RunRetrieverResourceEvent):
-                    context = event.context
-                    yield event
-
-            if context:
-                node_inputs["#context#"] = context  # type: ignore
-
-            # fetch model config
-            model_instance, model_config = self._fetch_model_config(node_data.model)
-
-            # fetch memory
-            memory = self._fetch_memory(node_data.memory, variable_pool, model_instance)
-
-            # fetch prompt messages
-            prompt_messages, stop = self._fetch_prompt_messages(
-                node_data=node_data,
-                query=variable_pool.get_any(["sys", SystemVariableKey.QUERY.value]) if node_data.memory else None,
-                query_prompt_template=node_data.memory.query_prompt_template if node_data.memory else None,
-                inputs=inputs,
-                files=files,
-                context=context,
-                memory=memory,
-                model_config=model_config,
-            )
-
-            process_data = {
-                "model_mode": model_config.mode,
-                "prompts": PromptMessageUtil.prompt_messages_to_prompt_for_saving(
-                    model_mode=model_config.mode, prompt_messages=prompt_messages
-                ),
-                "model_provider": model_config.provider,
-                "model_name": model_config.model,
-            }
-
-            # handle invoke result
-            generator = self._invoke_llm(
-                node_data_model=node_data.model,
-                model_instance=model_instance,
-                prompt_messages=prompt_messages,
-                stop=stop,
-            )
-
-            result_text = ""
-            usage = LLMUsage.empty_usage()
-            finish_reason = None
-            for event in generator:
-                if isinstance(event, RunStreamChunkEvent):
-                    yield event
-                elif isinstance(event, ModelInvokeCompleted):
-                    result_text = event.text
-                    usage = event.usage
-                    finish_reason = event.finish_reason
-                    break
-        except Exception as e:
-            yield RunCompletedEvent(
-                run_result=NodeRunResult(
-                    status=WorkflowNodeExecutionStatus.FAILED,
-                    error=str(e),
-                    inputs=node_inputs,
-                    process_data=process_data,
-                )
-            )
-            return
-
-        outputs = {"text": result_text, "usage": jsonable_encoder(usage), "finish_reason": finish_reason}
-
-        yield RunCompletedEvent(
-            run_result=NodeRunResult(
-                status=WorkflowNodeExecutionStatus.SUCCEEDED,
-                inputs=node_inputs,
-                process_data=process_data,
-                outputs=outputs,
-                metadata={
-                    NodeRunMetadataKey.TOTAL_TOKENS: usage.total_tokens,
-                    NodeRunMetadataKey.TOTAL_PRICE: usage.total_price,
-                    NodeRunMetadataKey.CURRENCY: usage.currency,
-                },
-                llm_usage=usage,
-            )
-        )
-
-    def _invoke_llm(
-        self,
-        node_data_model: ModelConfig,
-        model_instance: ModelInstance,
-        prompt_messages: list[PromptMessage],
-        stop: Optional[list[str]] = None,
-    ) -> Generator[RunEvent | ModelInvokeCompleted, None, None]:
-        """
-        Invoke large language model
-        :param node_data_model: node data model
-        :param model_instance: model instance
-        :param prompt_messages: prompt messages
-        :param stop: stop
-        :return:
-        """
-        db.session.close()
-
-        invoke_result = model_instance.invoke_llm(
-            prompt_messages=prompt_messages,
-            model_parameters=node_data_model.completion_params,
-            stop=stop,
-            stream=True,
-            user=self.user_id,
-        )
-
-        # handle invoke result
-        generator = self._handle_invoke_result(invoke_result=invoke_result)
-
-        usage = LLMUsage.empty_usage()
-        for event in generator:
-            yield event
-            if isinstance(event, ModelInvokeCompleted):
-                usage = event.usage
-
-        # deduct quota
-        self.deduct_llm_quota(tenant_id=self.tenant_id, model_instance=model_instance, usage=usage)
-
-    def _handle_invoke_result(
-        self, invoke_result: LLMResult | Generator
-    ) -> Generator[RunEvent | ModelInvokeCompleted, None, None]:
-        """
-        Handle invoke result
-        :param invoke_result: invoke result
-        :return:
-        """
-        if isinstance(invoke_result, LLMResult):
-            return
-
-        model = None
-        prompt_messages: list[PromptMessage] = []
-        full_text = ""
-        usage = None
-        finish_reason = None
-        for result in invoke_result:
-            text = result.delta.message.content
-            full_text += text
-
-            yield RunStreamChunkEvent(chunk_content=text, from_variable_selector=[self.node_id, "text"])
-
-            if not model:
-                model = result.model
-
-            if not prompt_messages:
-                prompt_messages = result.prompt_messages
-
-            if not usage and result.delta.usage:
-                usage = result.delta.usage
-
-            if not finish_reason and result.delta.finish_reason:
-                finish_reason = result.delta.finish_reason
-
-        if not usage:
-            usage = LLMUsage.empty_usage()
-
-        yield ModelInvokeCompleted(text=full_text, usage=usage, finish_reason=finish_reason)
-
-    def _transform_chat_messages(
-        self, messages: list[LLMNodeChatModelMessage] | LLMNodeCompletionModelPromptTemplate
-    ) -> list[LLMNodeChatModelMessage] | LLMNodeCompletionModelPromptTemplate:
-        """
-        Transform chat messages
-
-        :param messages: chat messages
-        :return:
-        """
-
-        if isinstance(messages, LLMNodeCompletionModelPromptTemplate):
-            if messages.edition_type == "jinja2" and messages.jinja2_text:
-                messages.text = messages.jinja2_text
-
-            return messages
-
-        for message in messages:
-            if message.edition_type == "jinja2" and message.jinja2_text:
-                message.text = message.jinja2_text
-
-        return messages
-
-    def _fetch_jinja_inputs(self, node_data: LLMNodeData, variable_pool: VariablePool) -> dict[str, str]:
-        """
-        Fetch jinja inputs
-        :param node_data: node data
-        :param variable_pool: variable pool
-        :return:
-        """
-        variables = {}
-
-        if not node_data.prompt_config:
-            return variables
-
-        for variable_selector in node_data.prompt_config.jinja2_variables or []:
-            variable = variable_selector.variable
-            value = variable_pool.get_any(variable_selector.value_selector)
-
-            def parse_dict(d: dict) -> str:
-                """
-                Parse dict into string
-                """
-                # check if it's a context structure
-                if "metadata" in d and "_source" in d["metadata"] and "content" in d:
-                    return d["content"]
-
-                # else, parse the dict
-                try:
-                    return json.dumps(d, ensure_ascii=False)
-                except Exception:
-                    return str(d)
-
-            if isinstance(value, str):
-                value = value
-            elif isinstance(value, list):
-                result = ""
-                for item in value:
-                    if isinstance(item, dict):
-                        result += parse_dict(item)
-                    elif isinstance(item, str):
-                        result += item
-                    elif isinstance(item, int | float):
-                        result += str(item)
-                    else:
-                        result += str(item)
-                    result += "\n"
-                value = result.strip()
-            elif isinstance(value, dict):
-                value = parse_dict(value)
-            elif isinstance(value, int | float):
-                value = str(value)
-            else:
-                value = str(value)
-
-            variables[variable] = value
-
-        return variables
-
-    def _fetch_inputs(self, node_data: LLMNodeData, variable_pool: VariablePool) -> dict[str, str]:
-        """
-        Fetch inputs
-        :param node_data: node data
-        :param variable_pool: variable pool
-        :return:
-        """
-        inputs = {}
-        prompt_template = node_data.prompt_template
-
-        variable_selectors = []
-        if isinstance(prompt_template, list):
-            for prompt in prompt_template:
-                variable_template_parser = VariableTemplateParser(template=prompt.text)
-                variable_selectors.extend(variable_template_parser.extract_variable_selectors())
-        elif isinstance(prompt_template, CompletionModelPromptTemplate):
-            variable_template_parser = VariableTemplateParser(template=prompt_template.text)
-            variable_selectors = variable_template_parser.extract_variable_selectors()
-
-        for variable_selector in variable_selectors:
-            variable_value = variable_pool.get_any(variable_selector.value_selector)
-            if variable_value is None:
-                raise ValueError(f"Variable {variable_selector.variable} not found")
-
-            inputs[variable_selector.variable] = variable_value
-
-        memory = node_data.memory
-        if memory and memory.query_prompt_template:
-            query_variable_selectors = VariableTemplateParser(
-                template=memory.query_prompt_template
-            ).extract_variable_selectors()
-            for variable_selector in query_variable_selectors:
-                variable_value = variable_pool.get_any(variable_selector.value_selector)
-                if variable_value is None:
-                    raise ValueError(f"Variable {variable_selector.variable} not found")
-
-                inputs[variable_selector.variable] = variable_value
-
-        return inputs
-
-    def _fetch_files(self, node_data: LLMNodeData, variable_pool: VariablePool) -> list["FileVar"]:
-        """
-        Fetch files
-        :param node_data: node data
-        :param variable_pool: variable pool
-        :return:
-        """
-        if not node_data.vision.enabled:
-            return []
-
-        files = variable_pool.get_any(["sys", SystemVariableKey.FILES.value])
-        if not files:
-            return []
-
-        return files
-
-    def _fetch_context(self, node_data: LLMNodeData, variable_pool: VariablePool) -> Generator[RunEvent, None, None]:
-        """
-        Fetch context
-        :param node_data: node data
-        :param variable_pool: variable pool
-        :return:
-        """
-        if not node_data.context.enabled:
-            return
-
-        if not node_data.context.variable_selector:
-            return
-
-        context_value = variable_pool.get_any(node_data.context.variable_selector)
-        if context_value:
-            if isinstance(context_value, str):
-                yield RunRetrieverResourceEvent(retriever_resources=[], context=context_value)
-            elif isinstance(context_value, list):
-                context_str = ""
-                original_retriever_resource = []
-                for item in context_value:
-                    if isinstance(item, str):
-                        context_str += item + "\n"
-                    else:
-                        if "content" not in item:
-                            raise ValueError(f"Invalid context structure: {item}")
-
-                        context_str += item["content"] + "\n"
-
-                        retriever_resource = self._convert_to_original_retriever_resource(item)
-                        if retriever_resource:
-                            original_retriever_resource.append(retriever_resource)
-
-                yield RunRetrieverResourceEvent(
-                    retriever_resources=original_retriever_resource, context=context_str.strip()
-                )
-
-    def _convert_to_original_retriever_resource(self, context_dict: dict) -> Optional[dict]:
-        """
-        Convert to original retriever resource, temp.
-        :param context_dict: context dict
-        :return:
-        """
-        if (
-            "metadata" in context_dict
-            and "_source" in context_dict["metadata"]
-            and context_dict["metadata"]["_source"] == "knowledge"
-        ):
-            metadata = context_dict.get("metadata", {})
-
-            source = {
-                "position": metadata.get("position"),
-                "dataset_id": metadata.get("dataset_id"),
-                "dataset_name": metadata.get("dataset_name"),
-                "document_id": metadata.get("document_id"),
-                "document_name": metadata.get("document_name"),
-                "data_source_type": metadata.get("document_data_source_type"),
-                "segment_id": metadata.get("segment_id"),
-                "retriever_from": metadata.get("retriever_from"),
-                "score": metadata.get("score"),
-                "hit_count": metadata.get("segment_hit_count"),
-                "word_count": metadata.get("segment_word_count"),
-                "segment_position": metadata.get("segment_position"),
-                "index_node_hash": metadata.get("segment_index_node_hash"),
-                "content": context_dict.get("content"),
-            }
-
-            return source
-
-        return None
-
-    def _fetch_model_config(
-        self, node_data_model: ModelConfig
-    ) -> tuple[ModelInstance, ModelConfigWithCredentialsEntity]:
-        """
-        Fetch model config
-        :param node_data_model: node data model
-        :return:
-        """
-        model_name = node_data_model.name
-        provider_name = node_data_model.provider
-
-        model_manager = ModelManager()
-        model_instance = model_manager.get_model_instance(
-            tenant_id=self.tenant_id, model_type=ModelType.LLM, provider=provider_name, model=model_name
-        )
-
-        provider_model_bundle = model_instance.provider_model_bundle
-        model_type_instance = model_instance.model_type_instance
-        model_type_instance = cast(LargeLanguageModel, model_type_instance)
-
-        model_credentials = model_instance.credentials
-
-        # check model
-        provider_model = provider_model_bundle.configuration.get_provider_model(
-            model=model_name, model_type=ModelType.LLM
-        )
-
-        if provider_model is None:
-            raise ValueError(f"Model {model_name} not exist.")
-
-        if provider_model.status == ModelStatus.NO_CONFIGURE:
-            raise ProviderTokenNotInitError(f"Model {model_name} credentials is not initialized.")
-        elif provider_model.status == ModelStatus.NO_PERMISSION:
-            raise ModelCurrentlyNotSupportError(f"Dify Hosted OpenAI {model_name} currently not support.")
-        elif provider_model.status == ModelStatus.QUOTA_EXCEEDED:
-            raise QuotaExceededError(f"Model provider {provider_name} quota exceeded.")
-
-        # model config
-        completion_params = node_data_model.completion_params
-        stop = []
-        if "stop" in completion_params:
-            stop = completion_params["stop"]
-            del completion_params["stop"]
-
-        # get model mode
-        model_mode = node_data_model.mode
-        if not model_mode:
-            raise ValueError("LLM mode is required.")
-
-        model_schema = model_type_instance.get_model_schema(model_name, model_credentials)
-
-        if not model_schema:
-            raise ValueError(f"Model {model_name} not exist.")
-
-        return model_instance, ModelConfigWithCredentialsEntity(
-            provider=provider_name,
-            model=model_name,
-            model_schema=model_schema,
-            mode=model_mode,
-            provider_model_bundle=provider_model_bundle,
-            credentials=model_credentials,
-            parameters=completion_params,
-            stop=stop,
-        )
-
-    def _fetch_memory(
-        self, node_data_memory: Optional[MemoryConfig], variable_pool: VariablePool, model_instance: ModelInstance
-    ) -> Optional[TokenBufferMemory]:
-        """
-        Fetch memory
-        :param node_data_memory: node data memory
-        :param variable_pool: variable pool
-        :return:
-        """
-        if not node_data_memory:
-            return None
-
-        # get conversation id
-        conversation_id = variable_pool.get_any(["sys", SystemVariableKey.CONVERSATION_ID.value])
-        if conversation_id is None:
-            return None
-
-        # get conversation
-        conversation = (
-            db.session.query(Conversation)
-            .filter(Conversation.app_id == self.app_id, Conversation.id == conversation_id)
-            .first()
-        )
-
-        if not conversation:
-            return None
-
-        memory = TokenBufferMemory(conversation=conversation, model_instance=model_instance)
-
-        return memory
-
-    def _fetch_prompt_messages(
-        self,
-        node_data: LLMNodeData,
-        query: Optional[str],
-        query_prompt_template: Optional[str],
-        inputs: dict[str, str],
-        files: list["FileVar"],
-        context: Optional[str],
-        memory: Optional[TokenBufferMemory],
-        model_config: ModelConfigWithCredentialsEntity,
-    ) -> tuple[list[PromptMessage], Optional[list[str]]]:
-        """
-        Fetch prompt messages
-        :param node_data: node data
-        :param query: query
-        :param query_prompt_template: query prompt template
-        :param inputs: inputs
-        :param files: files
-        :param context: context
-        :param memory: memory
-        :param model_config: model config
-        :return:
-        """
-        prompt_transform = AdvancedPromptTransform(with_variable_tmpl=True)
-        prompt_messages = prompt_transform.get_prompt(
-            prompt_template=node_data.prompt_template,
-            inputs=inputs,
-            query=query or "",
-            files=files,
-            context=context,
-            memory_config=node_data.memory,
-            memory=memory,
-            model_config=model_config,
-            query_prompt_template=query_prompt_template,
-        )
-        stop = model_config.stop
-
-        vision_enabled = node_data.vision.enabled
-        vision_detail = node_data.vision.configs.detail if node_data.vision.configs else None
-        filtered_prompt_messages = []
-        for prompt_message in prompt_messages:
-            if prompt_message.is_empty():
-                continue
-
-            if not isinstance(prompt_message.content, str):
-                prompt_message_content = []
-                for content_item in prompt_message.content:
-                    if (
-                        vision_enabled
-                        and content_item.type == PromptMessageContentType.IMAGE
-                        and isinstance(content_item, ImagePromptMessageContent)
-                    ):
-                        # Override vision config if LLM node has vision config
-                        if vision_detail:
-                            content_item.detail = ImagePromptMessageContent.DETAIL(vision_detail)
-                        prompt_message_content.append(content_item)
-                    elif content_item.type == PromptMessageContentType.TEXT:
-                        prompt_message_content.append(content_item)
-
-                if len(prompt_message_content) > 1:
-                    prompt_message.content = prompt_message_content
-                elif (
-                    len(prompt_message_content) == 1 and prompt_message_content[0].type == PromptMessageContentType.TEXT
-                ):
-                    prompt_message.content = prompt_message_content[0].data
-
-            filtered_prompt_messages.append(prompt_message)
-
-        if not filtered_prompt_messages:
-            raise ValueError(
-                "No prompt found in the LLM configuration. "
-                "Please ensure a prompt is properly configured before proceeding."
-            )
-
-        return filtered_prompt_messages, stop
-
-    @classmethod
-    def deduct_llm_quota(cls, tenant_id: str, model_instance: ModelInstance, usage: LLMUsage) -> None:
-        """
-        Deduct LLM quota
-        :param tenant_id: tenant id
-        :param model_instance: model instance
-        :param usage: usage
-        :return:
-        """
-        provider_model_bundle = model_instance.provider_model_bundle
-        provider_configuration = provider_model_bundle.configuration
-
-        if provider_configuration.using_provider_type != ProviderType.SYSTEM:
-            return
-
-        system_configuration = provider_configuration.system_configuration
-
-        quota_unit = None
-        for quota_configuration in system_configuration.quota_configurations:
-            if quota_configuration.quota_type == system_configuration.current_quota_type:
-                quota_unit = quota_configuration.quota_unit
-
-                if quota_configuration.quota_limit == -1:
-                    return
-
-                break
-
-        used_quota = None
-        if quota_unit:
-            if quota_unit == QuotaUnit.TOKENS:
-                used_quota = usage.total_tokens
-            elif quota_unit == QuotaUnit.CREDITS:
-                used_quota = 1
-
-                if "gpt-4" in model_instance.model:
-                    used_quota = 20
-            else:
-                used_quota = 1
-
-        if used_quota is not None:
-            db.session.query(Provider).filter(
-                Provider.tenant_id == tenant_id,
-                Provider.provider_name == model_instance.provider,
-                Provider.provider_type == ProviderType.SYSTEM.value,
-                Provider.quota_type == system_configuration.current_quota_type.value,
-                Provider.quota_limit > Provider.quota_used,
-            ).update({"quota_used": Provider.quota_used + used_quota})
-            db.session.commit()
-
-    @classmethod
-    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: LLMNodeData
-    ) -> Mapping[str, Sequence[str]]:
-        """
-        Extract variable selector to variable mapping
-        :param graph_config: graph config
-        :param node_id: node id
-        :param node_data: node data
-        :return:
-        """
-        prompt_template = node_data.prompt_template
-
-        variable_selectors = []
-        if isinstance(prompt_template, list):
-            for prompt in prompt_template:
-                if prompt.edition_type != "jinja2":
-                    variable_template_parser = VariableTemplateParser(template=prompt.text)
-                    variable_selectors.extend(variable_template_parser.extract_variable_selectors())
-        else:
-            if prompt_template.edition_type != "jinja2":
-                variable_template_parser = VariableTemplateParser(template=prompt_template.text)
-                variable_selectors = variable_template_parser.extract_variable_selectors()
-
-        variable_mapping = {}
-        for variable_selector in variable_selectors:
-            variable_mapping[variable_selector.variable] = variable_selector.value_selector
-
-        memory = node_data.memory
-        if memory and memory.query_prompt_template:
-            query_variable_selectors = VariableTemplateParser(
-                template=memory.query_prompt_template
-            ).extract_variable_selectors()
-            for variable_selector in query_variable_selectors:
-                variable_mapping[variable_selector.variable] = variable_selector.value_selector
-
-        if node_data.context.enabled:
-            variable_mapping["#context#"] = node_data.context.variable_selector
-
-        if node_data.vision.enabled:
-            variable_mapping["#files#"] = ["sys", SystemVariableKey.FILES.value]
-
-        if node_data.memory:
-            variable_mapping["#sys.query#"] = ["sys", SystemVariableKey.QUERY.value]
-
-        if node_data.prompt_config:
-            enable_jinja = False
-
-            if isinstance(prompt_template, list):
-                for prompt in prompt_template:
-                    if prompt.edition_type == "jinja2":
-                        enable_jinja = True
-                        break
-            else:
-                if prompt_template.edition_type == "jinja2":
-                    enable_jinja = True
-
-            if enable_jinja:
-                for variable_selector in node_data.prompt_config.jinja2_variables or []:
-                    variable_mapping[variable_selector.variable] = variable_selector.value_selector
-
-        variable_mapping = {node_id + "." + key: value for key, value in variable_mapping.items()}
-
-        return variable_mapping
-
-    @classmethod
-    def get_default_config(cls, filters: Optional[dict] = None) -> dict:
-        """
-        Get default config of node.
-        :param filters: filter by node config parameters.
-        :return:
-        """
-        return {
-            "type": "llm",
-            "config": {
-                "prompt_templates": {
-                    "chat_model": {
-                        "prompts": [
-                            {"role": "system", "text": "You are a helpful AI assistant.", "edition_type": "basic"}
-                        ]
-                    },
-                    "completion_model": {
-                        "conversation_histories_role": {"user_prefix": "Human", "assistant_prefix": "Assistant"},
-                        "prompt": {
-                            "text": "Here is the chat histories between human and assistant, inside "
-                            "<histories></histories> XML tags.\n\n<histories>\n{{"
-                            "#histories#}}\n</histories>\n\n\nHuman: {{#sys.query#}}\n\nAssistant:",
-                            "edition_type": "basic",
-                        },
-                        "stop": ["Human:"],
-                    },
-                }
-            },
-        }
--- a/api/core/workflow/nodes/loop/entities.py
+++ b/api/core/workflow/nodes/loop/entities.py
@ -1,4 +1,4 @@
-from core.workflow.entities.base_node_data_entities import BaseIterationNodeData, BaseIterationState
+from core.workflow.nodes.base import BaseIterationNodeData, BaseIterationState


 class LoopNodeData(BaseIterationNodeData):
--- a/api/core/workflow/nodes/loop/loop_node.py
+++ b/api/core/workflow/nodes/loop/loop_node.py
@ -1,12 +1,12 @@
 from typing import Any

-from core.workflow.entities.node_entities import NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.loop.entities import LoopNodeData, LoopState
 from core.workflow.utils.condition.entities import Condition


-class LoopNode(BaseNode):
+class LoopNode(BaseNode[LoopNodeData]):
    """
    Loop Node.
    """
--- a/api/core/workflow/nodes/node_mapping.py
+++ b/api/core/workflow/nodes/node_mapping.py
@ -1,22 +1,24 @@
-from core.workflow.entities.node_entities import NodeType
-from core.workflow.nodes.answer.answer_node import AnswerNode
-from core.workflow.nodes.code.code_node import CodeNode
-from core.workflow.nodes.end.end_node import EndNode
-from core.workflow.nodes.http_request.http_request_node import HttpRequestNode
-from core.workflow.nodes.if_else.if_else_node import IfElseNode
-from core.workflow.nodes.iteration.iteration_node import IterationNode
-from core.workflow.nodes.iteration.iteration_start_node import IterationStartNode
-from core.workflow.nodes.knowledge_retrieval.knowledge_retrieval_node import KnowledgeRetrievalNode
-from core.workflow.nodes.llm.llm_node import LLMNode
-from core.workflow.nodes.parameter_extractor.parameter_extractor_node import ParameterExtractorNode
-from core.workflow.nodes.question_classifier.question_classifier_node import QuestionClassifierNode
-from core.workflow.nodes.start.start_node import StartNode
-from core.workflow.nodes.template_transform.template_transform_node import TemplateTransformNode
-from core.workflow.nodes.tool.tool_node import ToolNode
-from core.workflow.nodes.variable_aggregator.variable_aggregator_node import VariableAggregatorNode
+from core.workflow.nodes.answer import AnswerNode
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.code import CodeNode
+from core.workflow.nodes.document_extractor import DocumentExtractorNode
+from core.workflow.nodes.end import EndNode
+from core.workflow.nodes.enums import NodeType
+from core.workflow.nodes.http_request import HttpRequestNode
+from core.workflow.nodes.if_else import IfElseNode
+from core.workflow.nodes.iteration import IterationNode, IterationStartNode
+from core.workflow.nodes.knowledge_retrieval import KnowledgeRetrievalNode
+from core.workflow.nodes.list_operator import ListOperatorNode
+from core.workflow.nodes.llm import LLMNode
+from core.workflow.nodes.parameter_extractor import ParameterExtractorNode
+from core.workflow.nodes.question_classifier import QuestionClassifierNode
+from core.workflow.nodes.start import StartNode
+from core.workflow.nodes.template_transform import TemplateTransformNode
+from core.workflow.nodes.tool import ToolNode
+from core.workflow.nodes.variable_aggregator import VariableAggregatorNode
 from core.workflow.nodes.variable_assigner import VariableAssignerNode

-node_classes = {
+node_type_classes_mapping: dict[NodeType, type[BaseNode]] = {
    NodeType.START: StartNode,
    NodeType.END: EndNode,
    NodeType.ANSWER: AnswerNode,
@ -34,4 +36,6 @@ node_classes = {
    NodeType.ITERATION_START: IterationStartNode,
    NodeType.PARAMETER_EXTRACTOR: ParameterExtractorNode,
    NodeType.CONVERSATION_VARIABLE_ASSIGNER: VariableAssignerNode,
+    NodeType.DOCUMENT_EXTRACTOR: DocumentExtractorNode,
+    NodeType.LIST_OPERATOR: ListOperatorNode,
 }
--- a/api/core/workflow/nodes/parameter_extractor/init.py
+++ b/api/core/workflow/nodes/parameter_extractor/init.py
@ -0,0 +1,3 @@
+from .parameter_extractor_node import ParameterExtractorNode
+
+__all__ = ["ParameterExtractorNode"]
--- a/api/core/workflow/nodes/parameter_extractor/entities.py
+++ b/api/core/workflow/nodes/parameter_extractor/entities.py
@ -1,20 +1,10 @@
 from typing import Any, Literal, Optional

-from pydantic import BaseModel, field_validator
+from pydantic import BaseModel, Field, field_validator

 from core.prompt.entities.advanced_prompt_entities import MemoryConfig
-from core.workflow.entities.base_node_data_entities import BaseNodeData
-
-
-class ModelConfig(BaseModel):
-    """
-    Model Config.
-    """
-
-    provider: str
-    name: str
-    mode: str
-    completion_params: dict[str, Any] = {}
+from core.workflow.nodes.base import BaseNodeData
+from core.workflow.nodes.llm import ModelConfig, VisionConfig


 class ParameterConfig(BaseModel):
@ -49,6 +39,7 @@ class ParameterExtractorNodeData(BaseNodeData):
    instruction: Optional[str] = None
    memory: Optional[MemoryConfig] = None
    reasoning_mode: Literal["function_call", "prompt"]
+    vision: VisionConfig = Field(default_factory=VisionConfig)

    @field_validator("reasoning_mode", mode="before")
    @classmethod
@ -64,7 +55,7 @@ class ParameterExtractorNodeData(BaseNodeData):
        parameters = {"type": "object", "properties": {}, "required": []}

        for parameter in self.parameters:
-            parameter_schema = {"description": parameter.description}
+            parameter_schema: dict[str, Any] = {"description": parameter.description}

            if parameter.type in {"string", "select"}:
                parameter_schema["type"] = "string"
--- a/api/core/workflow/nodes/parameter_extractor/parameter_extractor_node.py
+++ b/api/core/workflow/nodes/parameter_extractor/parameter_extractor_node.py
@ -4,6 +4,7 @@ from collections.abc import Mapping, Sequence
 from typing import Any, Optional, cast

 from core.app.entities.app_invoke_entities import ModelConfigWithCredentialsEntity
+from core.file import File
 from core.memory.token_buffer_memory import TokenBufferMemory
 from core.model_manager import ModelInstance
 from core.model_runtime.entities.llm_entities import LLMResult, LLMUsage
@ -22,12 +23,16 @@ from core.prompt.advanced_prompt_transform import AdvancedPromptTransform
 from core.prompt.entities.advanced_prompt_entities import ChatModelMessage, CompletionModelPromptTemplate
 from core.prompt.simple_prompt_transform import ModelMode
 from core.prompt.utils.prompt_message_util import PromptMessageUtil
-from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult, NodeType
+from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult
 from core.workflow.entities.variable_pool import VariablePool
-from core.workflow.nodes.llm.entities import ModelConfig
-from core.workflow.nodes.llm.llm_node import LLMNode
-from core.workflow.nodes.parameter_extractor.entities import ParameterExtractorNodeData
-from core.workflow.nodes.parameter_extractor.prompts import (
+from core.workflow.nodes.enums import NodeType
+from core.workflow.nodes.llm import LLMNode, ModelConfig
+from core.workflow.utils import variable_template_parser
+from extensions.ext_database import db
+from models.workflow import WorkflowNodeExecutionStatus
+
+from .entities import ParameterExtractorNodeData
+from .prompts import (
    CHAT_EXAMPLE,
    CHAT_GENERATE_JSON_USER_MESSAGE_TEMPLATE,
    COMPLETION_GENERATE_JSON_PROMPT,
@ -36,9 +41,6 @@ from core.workflow.nodes.parameter_extractor.prompts import (
    FUNCTION_CALLING_EXTRACTOR_SYSTEM_PROMPT,
    FUNCTION_CALLING_EXTRACTOR_USER_TEMPLATE,
 )
-from core.workflow.utils.variable_template_parser import VariableTemplateParser
-from extensions.ext_database import db
-from models.workflow import WorkflowNodeExecutionStatus


 class ParameterExtractorNode(LLMNode):
@ -65,33 +67,39 @@ class ParameterExtractorNode(LLMNode):
            }
        }

-    def _run(self) -> NodeRunResult:
+    def _run(self):
        """
        Run the node.
        """
        node_data = cast(ParameterExtractorNodeData, self.node_data)
-        variable = self.graph_runtime_state.variable_pool.get_any(node_data.query)
-        if not variable:
-            raise ValueError("Input variable content not found or is empty")
-        query = variable
+        variable = self.graph_runtime_state.variable_pool.get(node_data.query)
+        query = variable.text if variable else ""

-        inputs = {
-            "query": query,
-            "parameters": jsonable_encoder(node_data.parameters),
-            "instruction": jsonable_encoder(node_data.instruction),
-        }
+        files = (
+            self._fetch_files(
+                selector=node_data.vision.configs.variable_selector,
+            )
+            if node_data.vision.enabled
+            else []
+        )

        model_instance, model_config = self._fetch_model_config(node_data.model)
        if not isinstance(model_instance.model_type_instance, LargeLanguageModel):
            raise ValueError("Model is not a Large Language Model")

        llm_model = model_instance.model_type_instance
-        model_schema = llm_model.get_model_schema(model_config.model, model_config.credentials)
+        model_schema = llm_model.get_model_schema(
+            model=model_config.model,
+            credentials=model_config.credentials,
+        )
        if not model_schema:
            raise ValueError("Model schema not found")

        # fetch memory
-        memory = self._fetch_memory(node_data.memory, self.graph_runtime_state.variable_pool, model_instance)
+        memory = self._fetch_memory(
+            node_data_memory=node_data.memory,
+            model_instance=model_instance,
+        )

        if (
            set(model_schema.features or []) & {ModelFeature.TOOL_CALL, ModelFeature.MULTI_TOOL_CALL}
@ -99,15 +107,33 @@ class ParameterExtractorNode(LLMNode):
        ):
            # use function call
            prompt_messages, prompt_message_tools = self._generate_function_call_prompt(
-                node_data, query, self.graph_runtime_state.variable_pool, model_config, memory
+                node_data=node_data,
+                query=query,
+                variable_pool=self.graph_runtime_state.variable_pool,
+                model_config=model_config,
+                memory=memory,
+                files=files,
            )
        else:
            # use prompt engineering
            prompt_messages = self._generate_prompt_engineering_prompt(
-                node_data, query, self.graph_runtime_state.variable_pool, model_config, memory
+                data=node_data,
+                query=query,
+                variable_pool=self.graph_runtime_state.variable_pool,
+                model_config=model_config,
+                memory=memory,
+                files=files,
            )
+
            prompt_message_tools = []

+        inputs = {
+            "query": query,
+            "files": [f.to_dict() for f in files],
+            "parameters": jsonable_encoder(node_data.parameters),
+            "instruction": jsonable_encoder(node_data.instruction),
+        }
+
        process_data = {
            "model_mode": model_config.mode,
            "prompts": PromptMessageUtil.prompt_messages_to_prompt_for_saving(
@ -119,7 +145,7 @@ class ParameterExtractorNode(LLMNode):
        }

        try:
-            text, usage, tool_call = self._invoke_llm(
+            text, usage, tool_call = self._invoke(
                node_data_model=node_data.model,
                model_instance=model_instance,
                prompt_messages=prompt_messages,
@ -150,12 +176,12 @@ class ParameterExtractorNode(LLMNode):
                error = "Failed to extract result from function call or text response, using empty result."

        try:
-            result = self._validate_result(node_data, result)
+            result = self._validate_result(data=node_data, result=result or {})
        except Exception as e:
            error = str(e)

        # transform result into standard format
-        result = self._transform_result(node_data, result)
+        result = self._transform_result(data=node_data, result=result or {})

        return NodeRunResult(
            status=WorkflowNodeExecutionStatus.SUCCEEDED,
@ -170,7 +196,7 @@ class ParameterExtractorNode(LLMNode):
            llm_usage=usage,
        )

-    def _invoke_llm(
+    def _invoke(
        self,
        node_data_model: ModelConfig,
        model_instance: ModelInstance,
@ -178,14 +204,6 @@ class ParameterExtractorNode(LLMNode):
        tools: list[PromptMessageTool],
        stop: list[str],
    ) -> tuple[str, LLMUsage, Optional[AssistantPromptMessage.ToolCall]]:
-        """
-        Invoke large language model
-        :param node_data_model: node data model
-        :param model_instance: model instance
-        :param prompt_messages: prompt messages
-        :param stop: stop
-        :return:
-        """
        db.session.close()

        invoke_result = model_instance.invoke_llm(
@ -202,6 +220,9 @@ class ParameterExtractorNode(LLMNode):
            raise ValueError(f"Invalid invoke result: {invoke_result}")

        text = invoke_result.message.content
+        if not isinstance(text, str):
+            raise ValueError(f"Invalid text content type: {type(text)}. Expected str.")
+
        usage = invoke_result.usage
        tool_call = invoke_result.message.tool_calls[0] if invoke_result.message.tool_calls else None

@ -217,6 +238,7 @@ class ParameterExtractorNode(LLMNode):
        variable_pool: VariablePool,
        model_config: ModelConfigWithCredentialsEntity,
        memory: Optional[TokenBufferMemory],
+        files: Sequence[File],
    ) -> tuple[list[PromptMessage], list[PromptMessageTool]]:
        """
        Generate function call prompt.
@ -234,7 +256,7 @@ class ParameterExtractorNode(LLMNode):
            prompt_template=prompt_template,
            inputs={},
            query="",
-            files=[],
+            files=files,
            context="",
            memory_config=node_data.memory,
            memory=None,
@ -296,6 +318,7 @@ class ParameterExtractorNode(LLMNode):
        variable_pool: VariablePool,
        model_config: ModelConfigWithCredentialsEntity,
        memory: Optional[TokenBufferMemory],
+        files: Sequence[File],
    ) -> list[PromptMessage]:
        """
        Generate prompt engineering prompt.
@ -303,9 +326,23 @@ class ParameterExtractorNode(LLMNode):
        model_mode = ModelMode.value_of(data.model.mode)

        if model_mode == ModelMode.COMPLETION:
-            return self._generate_prompt_engineering_completion_prompt(data, query, variable_pool, model_config, memory)
+            return self._generate_prompt_engineering_completion_prompt(
+                node_data=data,
+                query=query,
+                variable_pool=variable_pool,
+                model_config=model_config,
+                memory=memory,
+                files=files,
+            )
        elif model_mode == ModelMode.CHAT:
-            return self._generate_prompt_engineering_chat_prompt(data, query, variable_pool, model_config, memory)
+            return self._generate_prompt_engineering_chat_prompt(
+                node_data=data,
+                query=query,
+                variable_pool=variable_pool,
+                model_config=model_config,
+                memory=memory,
+                files=files,
+            )
        else:
            raise ValueError(f"Invalid model mode: {model_mode}")

@ -316,20 +353,23 @@ class ParameterExtractorNode(LLMNode):
        variable_pool: VariablePool,
        model_config: ModelConfigWithCredentialsEntity,
        memory: Optional[TokenBufferMemory],
+        files: Sequence[File],
    ) -> list[PromptMessage]:
        """
        Generate completion prompt.
        """
        prompt_transform = AdvancedPromptTransform(with_variable_tmpl=True)
-        rest_token = self._calculate_rest_token(node_data, query, variable_pool, model_config, "")
+        rest_token = self._calculate_rest_token(
+            node_data=node_data, query=query, variable_pool=variable_pool, model_config=model_config, context=""
+        )
        prompt_template = self._get_prompt_engineering_prompt_template(
-            node_data, query, variable_pool, memory, rest_token
+            node_data=node_data, query=query, variable_pool=variable_pool, memory=memory, max_token_limit=rest_token
        )
        prompt_messages = prompt_transform.get_prompt(
            prompt_template=prompt_template,
            inputs={"structure": json.dumps(node_data.get_parameter_json_schema())},
            query="",
-            files=[],
+            files=files,
            context="",
            memory_config=node_data.memory,
            memory=memory,
@ -345,27 +385,30 @@ class ParameterExtractorNode(LLMNode):
        variable_pool: VariablePool,
        model_config: ModelConfigWithCredentialsEntity,
        memory: Optional[TokenBufferMemory],
+        files: Sequence[File],
    ) -> list[PromptMessage]:
        """
        Generate chat prompt.
        """
        prompt_transform = AdvancedPromptTransform(with_variable_tmpl=True)
-        rest_token = self._calculate_rest_token(node_data, query, variable_pool, model_config, "")
+        rest_token = self._calculate_rest_token(
+            node_data=node_data, query=query, variable_pool=variable_pool, model_config=model_config, context=""
+        )
        prompt_template = self._get_prompt_engineering_prompt_template(
-            node_data,
-            CHAT_GENERATE_JSON_USER_MESSAGE_TEMPLATE.format(
+            node_data=node_data,
+            query=CHAT_GENERATE_JSON_USER_MESSAGE_TEMPLATE.format(
                structure=json.dumps(node_data.get_parameter_json_schema()), text=query
            ),
-            variable_pool,
-            memory,
-            rest_token,
+            variable_pool=variable_pool,
+            memory=memory,
+            max_token_limit=rest_token,
        )

        prompt_messages = prompt_transform.get_prompt(
            prompt_template=prompt_template,
            inputs={},
            query="",
-            files=[],
+            files=files,
            context="",
            memory_config=node_data.memory,
            memory=None,
@ -425,10 +468,11 @@ class ParameterExtractorNode(LLMNode):
                raise ValueError(f"Invalid `string` value for parameter {parameter.name}")

            if parameter.type.startswith("array"):
-                if not isinstance(result.get(parameter.name), list):
+                parameters = result.get(parameter.name)
+                if not isinstance(parameters, list):
                    raise ValueError(f"Invalid `array` value for parameter {parameter.name}")
                nested_type = parameter.type[6:-1]
-                for item in result.get(parameter.name):
+                for item in parameters:
                    if nested_type == "number" and not isinstance(item, int | float):
                        raise ValueError(f"Invalid `array[number]` value for parameter {parameter.name}")
                    if nested_type == "string" and not isinstance(item, str):
@ -565,18 +609,6 @@ class ParameterExtractorNode(LLMNode):

        return result

-    def _render_instruction(self, instruction: str, variable_pool: VariablePool) -> str:
-        """
-        Render instruction.
-        """
-        variable_template_parser = VariableTemplateParser(instruction)
-        inputs = {}
-        for selector in variable_template_parser.extract_variable_selectors():
-            variable = variable_pool.get_any(selector.value_selector)
-            inputs[selector.variable] = variable
-
-        return variable_template_parser.format(inputs)
-
    def _get_function_calling_prompt_template(
        self,
        node_data: ParameterExtractorNodeData,
@ -588,9 +620,9 @@ class ParameterExtractorNode(LLMNode):
        model_mode = ModelMode.value_of(node_data.model.mode)
        input_text = query
        memory_str = ""
-        instruction = self._render_instruction(node_data.instruction or "", variable_pool)
+        instruction = variable_pool.convert_template(node_data.instruction or "").text

-        if memory:
+        if memory and node_data.memory and node_data.memory.window:
            memory_str = memory.get_history_prompt_text(
                max_token_limit=max_token_limit, message_limit=node_data.memory.window.size
            )
@ -611,13 +643,13 @@ class ParameterExtractorNode(LLMNode):
        variable_pool: VariablePool,
        memory: Optional[TokenBufferMemory],
        max_token_limit: int = 2000,
-    ) -> list[ChatModelMessage]:
+    ):
        model_mode = ModelMode.value_of(node_data.model.mode)
        input_text = query
        memory_str = ""
-        instruction = self._render_instruction(node_data.instruction or "", variable_pool)
+        instruction = variable_pool.convert_template(node_data.instruction or "").text

-        if memory:
+        if memory and node_data.memory and node_data.memory.window:
            memory_str = memory.get_history_prompt_text(
                max_token_limit=max_token_limit, message_limit=node_data.memory.window.size
            )
@ -691,7 +723,7 @@ class ParameterExtractorNode(LLMNode):
                ):
                    max_tokens = (
                        model_config.parameters.get(parameter_rule.name)
-                        or model_config.parameters.get(parameter_rule.use_template)
+                        or model_config.parameters.get(parameter_rule.use_template or "")
                    ) or 0

            rest_tokens = model_context_tokens - max_tokens - curr_message_tokens
@ -712,7 +744,11 @@ class ParameterExtractorNode(LLMNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: ParameterExtractorNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: ParameterExtractorNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
@ -721,11 +757,11 @@ class ParameterExtractorNode(LLMNode):
        :param node_data: node data
        :return:
        """
-        variable_mapping = {"query": node_data.query}
+        variable_mapping: dict[str, Sequence[str]] = {"query": node_data.query}

        if node_data.instruction:
-            variable_template_parser = VariableTemplateParser(template=node_data.instruction)
-            for selector in variable_template_parser.extract_variable_selectors():
+            selectors = variable_template_parser.extract_selectors_from_template(node_data.instruction)
+            for selector in selectors:
                variable_mapping[selector.variable] = selector.value_selector

        variable_mapping = {node_id + "." + key: value for key, value in variable_mapping.items()}
--- a/api/core/workflow/nodes/question_classifier/init.py
+++ b/api/core/workflow/nodes/question_classifier/init.py
@ -0,0 +1,4 @@
+from .entities import QuestionClassifierNodeData
+from .question_classifier_node import QuestionClassifierNode
+
+__all__ = ["QuestionClassifierNodeData", "QuestionClassifierNode"]
--- a/api/core/workflow/nodes/question_classifier/entities.py
+++ b/api/core/workflow/nodes/question_classifier/entities.py
@ -1,39 +1,21 @@
-from typing import Any, Optional
+from typing import Optional

-from pydantic import BaseModel
+from pydantic import BaseModel, Field

 from core.prompt.entities.advanced_prompt_entities import MemoryConfig
-from core.workflow.entities.base_node_data_entities import BaseNodeData
-
-
-class ModelConfig(BaseModel):
-    """
-    Model Config.
-    """
-
-    provider: str
-    name: str
-    mode: str
-    completion_params: dict[str, Any] = {}
+from core.workflow.nodes.base import BaseNodeData
+from core.workflow.nodes.llm import ModelConfig, VisionConfig


 class ClassConfig(BaseModel):
-    """
-    Class Config.
-    """
-
    id: str
    name: str


 class QuestionClassifierNodeData(BaseNodeData):
-    """
-    Knowledge retrieval Node Data.
-    """
-
    query_variable_selector: list[str]
-    type: str = "question-classifier"
    model: ModelConfig
    classes: list[ClassConfig]
    instruction: Optional[str] = None
    memory: Optional[MemoryConfig] = None
+    vision: VisionConfig = Field(default_factory=VisionConfig)
--- a/api/core/workflow/nodes/question_classifier/question_classifier_node.py
+++ b/api/core/workflow/nodes/question_classifier/question_classifier_node.py
@ -1,25 +1,30 @@
 import json
 import logging
 from collections.abc import Mapping, Sequence
-from typing import Any, Optional, Union, cast
+from typing import TYPE_CHECKING, Any, Optional, cast

 from core.app.entities.app_invoke_entities import ModelConfigWithCredentialsEntity
 from core.memory.token_buffer_memory import TokenBufferMemory
 from core.model_manager import ModelInstance
-from core.model_runtime.entities.llm_entities import LLMUsage
-from core.model_runtime.entities.message_entities import PromptMessage, PromptMessageRole
-from core.model_runtime.entities.model_entities import ModelPropertyKey
+from core.model_runtime.entities import LLMUsage, ModelPropertyKey, PromptMessageRole
 from core.model_runtime.utils.encoders import jsonable_encoder
 from core.prompt.advanced_prompt_transform import AdvancedPromptTransform
-from core.prompt.entities.advanced_prompt_entities import ChatModelMessage, CompletionModelPromptTemplate
 from core.prompt.simple_prompt_transform import ModelMode
 from core.prompt.utils.prompt_message_util import PromptMessageUtil
-from core.prompt.utils.prompt_template_parser import PromptTemplateParser
-from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult, NodeType
-from core.workflow.entities.variable_pool import VariablePool
-from core.workflow.nodes.llm.llm_node import LLMNode, ModelInvokeCompleted
-from core.workflow.nodes.question_classifier.entities import QuestionClassifierNodeData
-from core.workflow.nodes.question_classifier.template_prompts import (
+from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult
+from core.workflow.nodes.enums import NodeType
+from core.workflow.nodes.event import ModelInvokeCompletedEvent
+from core.workflow.nodes.llm import (
+    LLMNode,
+    LLMNodeChatModelMessage,
+    LLMNodeCompletionModelPromptTemplate,
+)
+from core.workflow.utils.variable_template_parser import VariableTemplateParser
+from libs.json_in_md_parser import parse_and_check_json_markdown
+from models.workflow import WorkflowNodeExecutionStatus
+
+from .entities import QuestionClassifierNodeData
+from .template_prompts import (
    QUESTION_CLASSIFIER_ASSISTANT_PROMPT_1,
    QUESTION_CLASSIFIER_ASSISTANT_PROMPT_2,
    QUESTION_CLASSIFIER_COMPLETION_PROMPT,
@ -28,46 +33,78 @@ from core.workflow.nodes.question_classifier.template_prompts import (
    QUESTION_CLASSIFIER_USER_PROMPT_2,
    QUESTION_CLASSIFIER_USER_PROMPT_3,
 )
-from core.workflow.utils.variable_template_parser import VariableTemplateParser
-from libs.json_in_md_parser import parse_and_check_json_markdown
-from models.workflow import WorkflowNodeExecutionStatus
+
+if TYPE_CHECKING:
+    from core.file import File


 class QuestionClassifierNode(LLMNode):
    _node_data_cls = QuestionClassifierNodeData
-    node_type = NodeType.QUESTION_CLASSIFIER
+    _node_type = NodeType.QUESTION_CLASSIFIER

-    def _run(self) -> NodeRunResult:
-        node_data: QuestionClassifierNodeData = cast(self._node_data_cls, self.node_data)
-        node_data = cast(QuestionClassifierNodeData, node_data)
+    def _run(self):
+        node_data = cast(QuestionClassifierNodeData, self.node_data)
        variable_pool = self.graph_runtime_state.variable_pool

        # extract variables
-        variable = variable_pool.get(node_data.query_variable_selector)
+        variable = variable_pool.get(node_data.query_variable_selector) if node_data.query_variable_selector else None
        query = variable.value if variable else None
        variables = {"query": query}
        # fetch model config
        model_instance, model_config = self._fetch_model_config(node_data.model)
        # fetch memory
-        memory = self._fetch_memory(node_data.memory, variable_pool, model_instance)
+        memory = self._fetch_memory(
+            node_data_memory=node_data.memory,
+            model_instance=model_instance,
+        )
        # fetch instruction
-        instruction = self._format_instruction(node_data.instruction, variable_pool) if node_data.instruction else ""
-        node_data.instruction = instruction
+        node_data.instruction = node_data.instruction or ""
+        node_data.instruction = variable_pool.convert_template(node_data.instruction).text
+
+        files: Sequence[File] = (
+            self._fetch_files(
+                selector=node_data.vision.configs.variable_selector,
+            )
+            if node_data.vision.enabled
+            else []
+        )
+
        # fetch prompt messages
-        prompt_messages, stop = self._fetch_prompt(
-            node_data=node_data, context="", query=query, memory=memory, model_config=model_config
+        rest_token = self._calculate_rest_token(
+            node_data=node_data,
+            query=query or "",
+            model_config=model_config,
+            context="",
+        )
+        prompt_template = self._get_prompt_template(
+            node_data=node_data,
+            query=query or "",
+            memory=memory,
+            max_token_limit=rest_token,
+        )
+        prompt_messages, stop = self._fetch_prompt_messages(
+            prompt_template=prompt_template,
+            system_query=query,
+            memory=memory,
+            model_config=model_config,
+            files=files,
+            vision_enabled=node_data.vision.enabled,
+            vision_detail=node_data.vision.configs.detail,
        )

        # handle invoke result
        generator = self._invoke_llm(
-            node_data_model=node_data.model, model_instance=model_instance, prompt_messages=prompt_messages, stop=stop
+            node_data_model=node_data.model,
+            model_instance=model_instance,
+            prompt_messages=prompt_messages,
+            stop=stop,
        )

        result_text = ""
        usage = LLMUsage.empty_usage()
        finish_reason = None
        for event in generator:
-            if isinstance(event, ModelInvokeCompleted):
+            if isinstance(event, ModelInvokeCompletedEvent):
                result_text = event.text
                usage = event.usage
                finish_reason = event.finish_reason
@ -129,7 +166,11 @@ class QuestionClassifierNode(LLMNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: QuestionClassifierNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: QuestionClassifierNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
@ -159,40 +200,6 @@ class QuestionClassifierNode(LLMNode):
        """
        return {"type": "question-classifier", "config": {"instructions": ""}}

-    def _fetch_prompt(
-        self,
-        node_data: QuestionClassifierNodeData,
-        query: str,
-        context: Optional[str],
-        memory: Optional[TokenBufferMemory],
-        model_config: ModelConfigWithCredentialsEntity,
-    ) -> tuple[list[PromptMessage], Optional[list[str]]]:
-        """
-        Fetch prompt
-        :param node_data: node data
-        :param query: inputs
-        :param context: context
-        :param memory: memory
-        :param model_config: model config
-        :return:
-        """
-        prompt_transform = AdvancedPromptTransform(with_variable_tmpl=True)
-        rest_token = self._calculate_rest_token(node_data, query, model_config, context)
-        prompt_template = self._get_prompt_template(node_data, query, memory, rest_token)
-        prompt_messages = prompt_transform.get_prompt(
-            prompt_template=prompt_template,
-            inputs={},
-            query="",
-            files=[],
-            context=context,
-            memory_config=node_data.memory,
-            memory=None,
-            model_config=model_config,
-        )
-        stop = model_config.stop
-
-        return prompt_messages, stop
-
    def _calculate_rest_token(
        self,
        node_data: QuestionClassifierNodeData,
@ -229,7 +236,7 @@ class QuestionClassifierNode(LLMNode):
                ):
                    max_tokens = (
                        model_config.parameters.get(parameter_rule.name)
-                        or model_config.parameters.get(parameter_rule.use_template)
+                        or model_config.parameters.get(parameter_rule.use_template or "")
                    ) or 0

            rest_tokens = model_context_tokens - max_tokens - curr_message_tokens
@ -243,7 +250,7 @@ class QuestionClassifierNode(LLMNode):
        query: str,
        memory: Optional[TokenBufferMemory],
        max_token_limit: int = 2000,
-    ) -> Union[list[ChatModelMessage], CompletionModelPromptTemplate]:
+    ):
        model_mode = ModelMode.value_of(node_data.model.mode)
        classes = node_data.classes
        categories = []
@ -255,31 +262,32 @@ class QuestionClassifierNode(LLMNode):
        memory_str = ""
        if memory:
            memory_str = memory.get_history_prompt_text(
-                max_token_limit=max_token_limit, message_limit=node_data.memory.window.size
+                max_token_limit=max_token_limit,
+                message_limit=node_data.memory.window.size if node_data.memory and node_data.memory.window else None,
            )
-        prompt_messages = []
+        prompt_messages: list[LLMNodeChatModelMessage] = []
        if model_mode == ModelMode.CHAT:
-            system_prompt_messages = ChatModelMessage(
+            system_prompt_messages = LLMNodeChatModelMessage(
                role=PromptMessageRole.SYSTEM, text=QUESTION_CLASSIFIER_SYSTEM_PROMPT.format(histories=memory_str)
            )
            prompt_messages.append(system_prompt_messages)
-            user_prompt_message_1 = ChatModelMessage(
+            user_prompt_message_1 = LLMNodeChatModelMessage(
                role=PromptMessageRole.USER, text=QUESTION_CLASSIFIER_USER_PROMPT_1
            )
            prompt_messages.append(user_prompt_message_1)
-            assistant_prompt_message_1 = ChatModelMessage(
+            assistant_prompt_message_1 = LLMNodeChatModelMessage(
                role=PromptMessageRole.ASSISTANT, text=QUESTION_CLASSIFIER_ASSISTANT_PROMPT_1
            )
            prompt_messages.append(assistant_prompt_message_1)
-            user_prompt_message_2 = ChatModelMessage(
+            user_prompt_message_2 = LLMNodeChatModelMessage(
                role=PromptMessageRole.USER, text=QUESTION_CLASSIFIER_USER_PROMPT_2
            )
            prompt_messages.append(user_prompt_message_2)
-            assistant_prompt_message_2 = ChatModelMessage(
+            assistant_prompt_message_2 = LLMNodeChatModelMessage(
                role=PromptMessageRole.ASSISTANT, text=QUESTION_CLASSIFIER_ASSISTANT_PROMPT_2
            )
            prompt_messages.append(assistant_prompt_message_2)
-            user_prompt_message_3 = ChatModelMessage(
+            user_prompt_message_3 = LLMNodeChatModelMessage(
                role=PromptMessageRole.USER,
                text=QUESTION_CLASSIFIER_USER_PROMPT_3.format(
                    input_text=input_text,
@ -290,7 +298,7 @@ class QuestionClassifierNode(LLMNode):
            prompt_messages.append(user_prompt_message_3)
            return prompt_messages
        elif model_mode == ModelMode.COMPLETION:
-            return CompletionModelPromptTemplate(
+            return LLMNodeCompletionModelPromptTemplate(
                text=QUESTION_CLASSIFIER_COMPLETION_PROMPT.format(
                    histories=memory_str,
                    input_text=input_text,
@ -302,23 +310,3 @@ class QuestionClassifierNode(LLMNode):

        else:
            raise ValueError(f"Model mode {model_mode} not support.")
-
-    def _format_instruction(self, instruction: str, variable_pool: VariablePool) -> str:
-        inputs = {}
-
-        variable_selectors = []
-        variable_template_parser = VariableTemplateParser(template=instruction)
-        variable_selectors.extend(variable_template_parser.extract_variable_selectors())
-        for variable_selector in variable_selectors:
-            variable = variable_pool.get(variable_selector.value_selector)
-            variable_value = variable.value if variable else None
-            if variable_value is None:
-                raise ValueError(f"Variable {variable_selector.variable} not found")
-
-            inputs[variable_selector.variable] = variable_value
-
-        prompt_template = PromptTemplateParser(template=instruction, with_variable_tmpl=True)
-        prompt_inputs = {k: inputs[k] for k in prompt_template.variable_keys if k in inputs}
-
-        instruction = prompt_template.format(prompt_inputs)
-        return instruction
--- a/api/core/workflow/nodes/start/init.py
+++ b/api/core/workflow/nodes/start/init.py
@ -0,0 +1,3 @@
+from .start_node import StartNode
+
+__all__ = ["StartNode"]
--- a/api/core/workflow/nodes/start/entities.py
+++ b/api/core/workflow/nodes/start/entities.py
@ -3,7 +3,7 @@ from collections.abc import Sequence
 from pydantic import Field

 from core.app.app_config.entities import VariableEntity
-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData


 class StartNodeData(BaseNodeData):
--- a/api/core/workflow/nodes/start/start_node.py
+++ b/api/core/workflow/nodes/start/start_node.py
@ -1,25 +1,24 @@
 from collections.abc import Mapping, Sequence
 from typing import Any

-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.entities.variable_pool import SYSTEM_VARIABLE_NODE_ID
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.constants import SYSTEM_VARIABLE_NODE_ID
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.start.entities import StartNodeData
 from models.workflow import WorkflowNodeExecutionStatus


-class StartNode(BaseNode):
+class StartNode(BaseNode[StartNodeData]):
    _node_data_cls = StartNodeData
    _node_type = NodeType.START

    def _run(self) -> NodeRunResult:
-        """
-        Run node
-        :return:
-        """
        node_inputs = dict(self.graph_runtime_state.variable_pool.user_inputs)
        system_inputs = self.graph_runtime_state.variable_pool.system_variables

+        # TODO: System variables should be directly accessible, no need for special handling
+        # Set system variables as node outputs.
        for var in system_inputs:
            node_inputs[SYSTEM_VARIABLE_NODE_ID + "." + var] = system_inputs[var]

@ -27,13 +26,10 @@ class StartNode(BaseNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: StartNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: StartNodeData,
    ) -> Mapping[str, Sequence[str]]:
-        """
-        Extract variable selector to variable mapping
-        :param graph_config: graph config
-        :param node_id: node id
-        :param node_data: node data
-        :return:
-        """
        return {}
--- a/api/core/workflow/nodes/template_transform/init.py
+++ b/api/core/workflow/nodes/template_transform/init.py
@ -0,0 +1,3 @@
+from .template_transform_node import TemplateTransformNode
+
+__all__ = ["TemplateTransformNode"]
--- a/api/core/workflow/nodes/template_transform/entities.py
+++ b/api/core/workflow/nodes/template_transform/entities.py
@ -1,5 +1,5 @@
-from core.workflow.entities.base_node_data_entities import BaseNodeData
 from core.workflow.entities.variable_entities import VariableSelector
+from core.workflow.nodes.base import BaseNodeData


 class TemplateTransformNodeData(BaseNodeData):
--- a/api/core/workflow/nodes/template_transform/template_transform_node.py
+++ b/api/core/workflow/nodes/template_transform/template_transform_node.py
@ -1,17 +1,18 @@
 import os
 from collections.abc import Mapping, Sequence
-from typing import Any, Optional, cast
+from typing import Any, Optional

 from core.helper.code_executor.code_executor import CodeExecutionError, CodeExecutor, CodeLanguage
-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.template_transform.entities import TemplateTransformNodeData
 from models.workflow import WorkflowNodeExecutionStatus

 MAX_TEMPLATE_TRANSFORM_OUTPUT_LENGTH = int(os.environ.get("TEMPLATE_TRANSFORM_MAX_LENGTH", "80000"))


-class TemplateTransformNode(BaseNode):
+class TemplateTransformNode(BaseNode[TemplateTransformNodeData]):
    _node_data_cls = TemplateTransformNodeData
    _node_type = NodeType.TEMPLATE_TRANSFORM

@ -28,22 +29,21 @@ class TemplateTransformNode(BaseNode):
        }

    def _run(self) -> NodeRunResult:
-        """
-        Run node
-        """
-        node_data = self.node_data
-        node_data: TemplateTransformNodeData = cast(self._node_data_cls, node_data)
-
        # Get variables
        variables = {}
-        for variable_selector in node_data.variables:
+        for variable_selector in self.node_data.variables:
            variable_name = variable_selector.variable
-            value = self.graph_runtime_state.variable_pool.get_any(variable_selector.value_selector)
-            variables[variable_name] = value
+            value = self.graph_runtime_state.variable_pool.get(variable_selector.value_selector)
+            if value is None:
+                return NodeRunResult(
+                    status=WorkflowNodeExecutionStatus.FAILED,
+                    error=f"Variable {variable_name} not found in variable pool",
+                )
+            variables[variable_name] = value.to_object()
        # Run code
        try:
            result = CodeExecutor.execute_workflow_code_template(
-                language=CodeLanguage.JINJA2, code=node_data.template, inputs=variables
+                language=CodeLanguage.JINJA2, code=self.node_data.template, inputs=variables
            )
        except CodeExecutionError as e:
            return NodeRunResult(inputs=variables, status=WorkflowNodeExecutionStatus.FAILED, error=str(e))
@ -61,7 +61,7 @@ class TemplateTransformNode(BaseNode):

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: TemplateTransformNodeData
+        cls, *, graph_config: Mapping[str, Any], node_id: str, node_data: TemplateTransformNodeData
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
--- a/api/core/workflow/nodes/tool/init.py
+++ b/api/core/workflow/nodes/tool/init.py
@ -0,0 +1,3 @@
+from .tool_node import ToolNode
+
+__all__ = ["ToolNode"]
--- a/api/core/workflow/nodes/tool/entities.py
+++ b/api/core/workflow/nodes/tool/entities.py
@ -3,7 +3,7 @@ from typing import Any, Literal, Union
 from pydantic import BaseModel, field_validator
 from pydantic_core.core_schema import ValidationInfo

-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData


 class ToolEntity(BaseModel):
@ -51,7 +51,4 @@ class ToolNodeData(BaseNodeData, ToolEntity):
                raise ValueError("value must be a string, int, float, or bool")
            return typ

-    """
-    Tool Node Schema
-    """
    tool_parameters: dict[str, ToolInput]
--- a/api/core/workflow/nodes/tool/tool_node.py
+++ b/api/core/workflow/nodes/tool/tool_node.py
@ -1,24 +1,28 @@
 from collections.abc import Mapping, Sequence
 from os import path
-from typing import Any, cast
+from typing import Any
+
+from sqlalchemy import select
+from sqlalchemy.orm import Session

-from core.app.segments import ArrayAnySegment, ArrayAnyVariable, parser
 from core.callback_handler.workflow_tool_callback_handler import DifyWorkflowCallbackHandler
-from core.file.file_obj import FileTransferMethod, FileType, FileVar
+from core.file.models import File, FileTransferMethod, FileType
 from core.tools.entities.tool_entities import ToolInvokeMessage, ToolParameter
 from core.tools.tool_engine import ToolEngine
 from core.tools.tool_manager import ToolManager
 from core.tools.utils.message_transformer import ToolFileMessageTransformer
-from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult, NodeType
+from core.workflow.entities.node_entities import NodeRunMetadataKey, NodeRunResult
 from core.workflow.entities.variable_pool import VariablePool
-from core.workflow.enums import SystemVariableKey
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.tool.entities import ToolNodeData
 from core.workflow.utils.variable_template_parser import VariableTemplateParser
-from models import WorkflowNodeExecutionStatus
+from extensions.ext_database import db
+from models import ToolFile
+from models.workflow import WorkflowNodeExecutionStatus


-class ToolNode(BaseNode):
+class ToolNode(BaseNode[ToolNodeData]):
    """
    Tool Node
    """
@ -27,37 +31,38 @@ class ToolNode(BaseNode):
    _node_type = NodeType.TOOL

    def _run(self) -> NodeRunResult:
-        """
-        Run the tool node
-        """
-
-        node_data = cast(ToolNodeData, self.node_data)
-
        # fetch tool icon
-        tool_info = {"provider_type": node_data.provider_type, "provider_id": node_data.provider_id}
+        tool_info = {
+            "provider_type": self.node_data.provider_type,
+            "provider_id": self.node_data.provider_id,
+        }

        # get tool runtime
        try:
            tool_runtime = ToolManager.get_workflow_tool_runtime(
-                self.tenant_id, self.app_id, self.node_id, node_data, self.invoke_from
+                self.tenant_id, self.app_id, self.node_id, self.node_data, self.invoke_from
            )
        except Exception as e:
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.FAILED,
                inputs={},
-                metadata={NodeRunMetadataKey.TOOL_INFO: tool_info},
+                metadata={
+                    NodeRunMetadataKey.TOOL_INFO: tool_info,
+                },
                error=f"Failed to get tool runtime: {str(e)}",
            )

        # get parameters
        tool_parameters = tool_runtime.get_runtime_parameters() or []
        parameters = self._generate_parameters(
-            tool_parameters=tool_parameters, variable_pool=self.graph_runtime_state.variable_pool, node_data=node_data
+            tool_parameters=tool_parameters,
+            variable_pool=self.graph_runtime_state.variable_pool,
+            node_data=self.node_data,
        )
        parameters_for_log = self._generate_parameters(
            tool_parameters=tool_parameters,
            variable_pool=self.graph_runtime_state.variable_pool,
-            node_data=node_data,
+            node_data=self.node_data,
            for_log=True,
        )

@ -74,7 +79,9 @@ class ToolNode(BaseNode):
            return NodeRunResult(
                status=WorkflowNodeExecutionStatus.FAILED,
                inputs=parameters_for_log,
-                metadata={NodeRunMetadataKey.TOOL_INFO: tool_info},
+                metadata={
+                    NodeRunMetadataKey.TOOL_INFO: tool_info,
+                },
                error=f"Failed to invoke tool: {str(e)}",
            )

@ -83,8 +90,14 @@ class ToolNode(BaseNode):

        return NodeRunResult(
            status=WorkflowNodeExecutionStatus.SUCCEEDED,
-            outputs={"text": plain_text, "files": files, "json": json},
-            metadata={NodeRunMetadataKey.TOOL_INFO: tool_info},
+            outputs={
+                "text": plain_text,
+                "files": files,
+                "json": json,
+            },
+            metadata={
+                NodeRunMetadataKey.TOOL_INFO: tool_info,
+            },
            inputs=parameters_for_log,
        )

@ -116,29 +129,25 @@ class ToolNode(BaseNode):
            if not parameter:
                result[parameter_name] = None
                continue
-            if parameter.type == ToolParameter.ToolParameterType.FILE:
-                result[parameter_name] = [v.to_dict() for v in self._fetch_files(variable_pool)]
+            tool_input = node_data.tool_parameters[parameter_name]
+            if tool_input.type == "variable":
+                variable = variable_pool.get(tool_input.value)
+                if variable is None:
+                    raise ValueError(f"variable {tool_input.value} not exists")
+                parameter_value = variable.value
+            elif tool_input.type in {"mixed", "constant"}:
+                segment_group = variable_pool.convert_template(str(tool_input.value))
+                parameter_value = segment_group.log if for_log else segment_group.text
            else:
-                tool_input = node_data.tool_parameters[parameter_name]
-                if tool_input.type == "variable":
-                    # TODO: check if the variable exists in the variable pool
-                    parameter_value = variable_pool.get(tool_input.value).value
-                else:
-                    segment_group = parser.convert_template(
-                        template=str(tool_input.value),
-                        variable_pool=variable_pool,
-                    )
-                    parameter_value = segment_group.log if for_log else segment_group.text
-                result[parameter_name] = parameter_value
+                raise ValueError(f"unknown tool input type '{tool_input.type}'")
+            result[parameter_name] = parameter_value

        return result

-    def _fetch_files(self, variable_pool: VariablePool) -> list[FileVar]:
-        variable = variable_pool.get(["sys", SystemVariableKey.FILES.value])
-        assert isinstance(variable, ArrayAnyVariable | ArrayAnySegment)
-        return list(variable.value) if variable else []
-
-    def _convert_tool_messages(self, messages: list[ToolInvokeMessage]) -> tuple[str, list[FileVar], list[dict]]:
+    def _convert_tool_messages(
+        self,
+        messages: list[ToolInvokeMessage],
+    ):
        """
        Convert ToolInvokeMessages into tuple[plain_text, files]
        """
@ -156,50 +165,86 @@ class ToolNode(BaseNode):

        return plain_text, files, json

-    def _extract_tool_response_binary(self, tool_response: list[ToolInvokeMessage]) -> list[FileVar]:
+    def _extract_tool_response_binary(self, tool_response: list[ToolInvokeMessage]) -> list[File]:
        """
        Extract tool response binary
        """
        result = []
-
        for response in tool_response:
            if response.type in {ToolInvokeMessage.MessageType.IMAGE_LINK, ToolInvokeMessage.MessageType.IMAGE}:
-                url = response.message
-                ext = path.splitext(url)[1]
-                mimetype = response.meta.get("mime_type", "image/jpeg")
-                filename = response.save_as or url.split("/")[-1]
+                url = str(response.message) if response.message else None
+                ext = path.splitext(url)[1] if url else ".bin"
+                tool_file_id = str(url).split("/")[-1].split(".")[0]
                transfer_method = response.meta.get("transfer_method", FileTransferMethod.TOOL_FILE)

-                # get tool file id
-                tool_file_id = url.split("/")[-1].split(".")[0]
+                with Session(db.engine) as session:
+                    stmt = select(ToolFile).where(ToolFile.id == tool_file_id)
+                    tool_file = session.scalar(stmt)
+                    if tool_file is None:
+                        raise ValueError(f"tool file {tool_file_id} not exists")
+
                result.append(
-                    FileVar(
+                    File(
                        tenant_id=self.tenant_id,
                        type=FileType.IMAGE,
                        transfer_method=transfer_method,
-                        url=url,
-                        related_id=tool_file_id,
-                        filename=filename,
+                        remote_url=url,
+                        related_id=tool_file.id,
+                        filename=tool_file.name,
                        extension=ext,
-                        mime_type=mimetype,
+                        mime_type=tool_file.mimetype,
+                        size=tool_file.size,
                    )
                )
            elif response.type == ToolInvokeMessage.MessageType.BLOB:
                # get tool file id
-                tool_file_id = response.message.split("/")[-1].split(".")[0]
+                tool_file_id = str(response.message).split("/")[-1].split(".")[0]
+                with Session(db.engine) as session:
+                    stmt = select(ToolFile).where(ToolFile.id == tool_file_id)
+                    tool_file = session.scalar(stmt)
+                    if tool_file is None:
+                        raise ValueError(f"tool file {tool_file_id} not exists")
                result.append(
-                    FileVar(
+                    File(
                        tenant_id=self.tenant_id,
                        type=FileType.IMAGE,
                        transfer_method=FileTransferMethod.TOOL_FILE,
-                        related_id=tool_file_id,
-                        filename=response.save_as,
+                        related_id=tool_file.id,
+                        filename=tool_file.name,
                        extension=path.splitext(response.save_as)[1],
-                        mime_type=response.meta.get("mime_type", "application/octet-stream"),
+                        mime_type=tool_file.mimetype,
+                        size=tool_file.size,
                    )
                )
            elif response.type == ToolInvokeMessage.MessageType.LINK:
-                pass  # TODO:
+                url = str(response.message)
+                transfer_method = FileTransferMethod.TOOL_FILE
+                tool_file_id = url.split("/")[-1].split(".")[0]
+                with Session(db.engine) as session:
+                    stmt = select(ToolFile).where(ToolFile.id == tool_file_id)
+                    tool_file = session.scalar(stmt)
+                    if tool_file is None:
+                        raise ValueError(f"tool file {tool_file_id} not exists")
+                if "." in url:
+                    extension = "." + url.split("/")[-1].split(".")[1]
+                else:
+                    extension = ".bin"
+                file = File(
+                    tenant_id=self.tenant_id,
+                    type=FileType(response.save_as),
+                    transfer_method=transfer_method,
+                    remote_url=url,
+                    filename=tool_file.name,
+                    related_id=tool_file.id,
+                    extension=extension,
+                    mime_type=tool_file.mimetype,
+                    size=tool_file.size,
+                )
+                result.append(file)
+
+            elif response.type == ToolInvokeMessage.MessageType.FILE:
+                assert response.meta is not None
+                result.append(response.meta["file"])

        return result

@ -218,12 +263,16 @@ class ToolNode(BaseNode):
            ]
        )

-    def _extract_tool_response_json(self, tool_response: list[ToolInvokeMessage]) -> list[dict]:
+    def _extract_tool_response_json(self, tool_response: list[ToolInvokeMessage]):
        return [message.message for message in tool_response if message.type == ToolInvokeMessage.MessageType.JSON]

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: ToolNodeData
+        cls,
+        *,
+        graph_config: Mapping[str, Any],
+        node_id: str,
+        node_data: ToolNodeData,
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
@ -236,7 +285,7 @@ class ToolNode(BaseNode):
        for parameter_name in node_data.tool_parameters:
            input = node_data.tool_parameters[parameter_name]
            if input.type == "mixed":
-                selectors = VariableTemplateParser(input.value).extract_variable_selectors()
+                selectors = VariableTemplateParser(str(input.value)).extract_variable_selectors()
                for selector in selectors:
                    result[selector.variable] = selector.value_selector
            elif input.type == "variable":
--- a/api/core/workflow/nodes/variable_aggregator/init.py
+++ b/api/core/workflow/nodes/variable_aggregator/init.py
@ -0,0 +1,3 @@
+from .variable_aggregator_node import VariableAggregatorNode
+
+__all__ = ["VariableAggregatorNode"]
--- a/api/core/workflow/nodes/variable_aggregator/entities.py
+++ b/api/core/workflow/nodes/variable_aggregator/entities.py
@ -2,7 +2,7 @@ from typing import Literal, Optional

 from pydantic import BaseModel

-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData


 class AdvancedSettings(BaseModel):
--- a/api/core/workflow/nodes/variable_aggregator/variable_aggregator_node.py
+++ b/api/core/workflow/nodes/variable_aggregator/variable_aggregator_node.py
@ -1,45 +1,45 @@
 from collections.abc import Mapping, Sequence
-from typing import Any, cast
+from typing import Any

-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode
+from core.workflow.nodes.enums import NodeType
 from core.workflow.nodes.variable_aggregator.entities import VariableAssignerNodeData
 from models.workflow import WorkflowNodeExecutionStatus


-class VariableAggregatorNode(BaseNode):
+class VariableAggregatorNode(BaseNode[VariableAssignerNodeData]):
    _node_data_cls = VariableAssignerNodeData
    _node_type = NodeType.VARIABLE_AGGREGATOR

    def _run(self) -> NodeRunResult:
-        node_data = cast(VariableAssignerNodeData, self.node_data)
        # Get variables
        outputs = {}
        inputs = {}

-        if not node_data.advanced_settings or not node_data.advanced_settings.group_enabled:
-            for selector in node_data.variables:
-                variable = self.graph_runtime_state.variable_pool.get_any(selector)
+        if not self.node_data.advanced_settings or not self.node_data.advanced_settings.group_enabled:
+            for selector in self.node_data.variables:
+                variable = self.graph_runtime_state.variable_pool.get(selector)
                if variable is not None:
-                    outputs = {"output": variable}
+                    outputs = {"output": variable.to_object()}

-                    inputs = {".".join(selector[1:]): variable}
+                    inputs = {".".join(selector[1:]): variable.to_object()}
                    break
        else:
-            for group in node_data.advanced_settings.groups:
+            for group in self.node_data.advanced_settings.groups:
                for selector in group.variables:
-                    variable = self.graph_runtime_state.variable_pool.get_any(selector)
+                    variable = self.graph_runtime_state.variable_pool.get(selector)

                    if variable is not None:
-                        outputs[group.group_name] = {"output": variable}
-                        inputs[".".join(selector[1:])] = variable
+                        outputs[group.group_name] = {"output": variable.to_object()}
+                        inputs[".".join(selector[1:])] = variable.to_object()
                        break

        return NodeRunResult(status=WorkflowNodeExecutionStatus.SUCCEEDED, outputs=outputs, inputs=inputs)

    @classmethod
    def _extract_variable_selector_to_variable_mapping(
-        cls, graph_config: Mapping[str, Any], node_id: str, node_data: VariableAssignerNodeData
+        cls, *, graph_config: Mapping[str, Any], node_id: str, node_data: VariableAssignerNodeData
    ) -> Mapping[str, Sequence[str]]:
        """
        Extract variable selector to variable mapping
--- a/api/core/workflow/nodes/variable_assigner/node.py
+++ b/api/core/workflow/nodes/variable_assigner/node.py
@ -1,40 +1,38 @@
-from typing import cast
-
 from sqlalchemy import select
 from sqlalchemy.orm import Session

-from core.app.segments import SegmentType, Variable, factory
-from core.workflow.entities.base_node_data_entities import BaseNodeData
-from core.workflow.entities.node_entities import NodeRunResult, NodeType
-from core.workflow.nodes.base_node import BaseNode
+from core.variables import SegmentType, Variable
+from core.workflow.entities.node_entities import NodeRunResult
+from core.workflow.nodes.base import BaseNode, BaseNodeData
+from core.workflow.nodes.enums import NodeType
 from extensions.ext_database import db
-from models import ConversationVariable, WorkflowNodeExecutionStatus
+from factories import variable_factory
+from models import ConversationVariable
+from models.workflow import WorkflowNodeExecutionStatus

 from .exc import VariableAssignerNodeError
 from .node_data import VariableAssignerData, WriteMode


-class VariableAssignerNode(BaseNode):
+class VariableAssignerNode(BaseNode[VariableAssignerData]):
    _node_data_cls: type[BaseNodeData] = VariableAssignerData
    _node_type: NodeType = NodeType.CONVERSATION_VARIABLE_ASSIGNER

    def _run(self) -> NodeRunResult:
-        data = cast(VariableAssignerData, self.node_data)
-
        # Should be String, Number, Object, ArrayString, ArrayNumber, ArrayObject
-        original_variable = self.graph_runtime_state.variable_pool.get(data.assigned_variable_selector)
+        original_variable = self.graph_runtime_state.variable_pool.get(self.node_data.assigned_variable_selector)
        if not isinstance(original_variable, Variable):
            raise VariableAssignerNodeError("assigned variable not found")

-        match data.write_mode:
+        match self.node_data.write_mode:
            case WriteMode.OVER_WRITE:
-                income_value = self.graph_runtime_state.variable_pool.get(data.input_variable_selector)
+                income_value = self.graph_runtime_state.variable_pool.get(self.node_data.input_variable_selector)
                if not income_value:
                    raise VariableAssignerNodeError("input value not found")
                updated_variable = original_variable.model_copy(update={"value": income_value.value})

            case WriteMode.APPEND:
-                income_value = self.graph_runtime_state.variable_pool.get(data.input_variable_selector)
+                income_value = self.graph_runtime_state.variable_pool.get(self.node_data.input_variable_selector)
                if not income_value:
                    raise VariableAssignerNodeError("input value not found")
                updated_value = original_variable.value + [income_value.value]
@ -45,10 +43,10 @@ class VariableAssignerNode(BaseNode):
                updated_variable = original_variable.model_copy(update={"value": income_value.to_object()})

            case _:
-                raise VariableAssignerNodeError(f"unsupported write mode: {data.write_mode}")
+                raise VariableAssignerNodeError(f"unsupported write mode: {self.node_data.write_mode}")

        # Over write the variable.
-        self.graph_runtime_state.variable_pool.add(data.assigned_variable_selector, updated_variable)
+        self.graph_runtime_state.variable_pool.add(self.node_data.assigned_variable_selector, updated_variable)

        # TODO: Move database operation to the pipeline.
        # Update conversation variable.
@ -80,12 +78,12 @@ def update_conversation_variable(conversation_id: str, variable: Variable):
 def get_zero_value(t: SegmentType):
    match t:
        case SegmentType.ARRAY_OBJECT | SegmentType.ARRAY_STRING | SegmentType.ARRAY_NUMBER:
-            return factory.build_segment([])
+            return variable_factory.build_segment([])
        case SegmentType.OBJECT:
-            return factory.build_segment({})
+            return variable_factory.build_segment({})
        case SegmentType.STRING:
-            return factory.build_segment("")
+            return variable_factory.build_segment("")
        case SegmentType.NUMBER:
-            return factory.build_segment(0)
+            return variable_factory.build_segment(0)
        case _:
            raise VariableAssignerNodeError(f"unsupported variable type: {t}")
--- a/api/core/workflow/nodes/variable_assigner/node_data.py
+++ b/api/core/workflow/nodes/variable_assigner/node_data.py
@ -2,7 +2,7 @@ from collections.abc import Sequence
 from enum import Enum
 from typing import Optional

-from core.workflow.entities.base_node_data_entities import BaseNodeData
+from core.workflow.nodes.base import BaseNodeData


 class WriteMode(str, Enum):