refactor(api): type WaterCrawl API responses with TypedDict (#33700)

2026-05-05 09:58:04 +08:00 · 2026-03-19 03:35:44 +02:00
parent 9367020bfd
commit 9ff0d9df88
3 changed files with 76 additions and 24 deletions
--- a/api/services/website_service.py
+++ b/api/services/website_service.py
@ -216,8 +216,10 @@ class WebsiteService:
            "max_depth": request.options.max_depth,
            "use_sitemap": request.options.use_sitemap,
        }
-        return WaterCrawlProvider(api_key=api_key, base_url=config.get("base_url")).crawl_url(
-            url=request.url, options=options
+        return dict(
+            WaterCrawlProvider(api_key=api_key, base_url=config.get("base_url")).crawl_url(
+                url=request.url, options=options
+            )
        )

    @classmethod
@ -289,8 +291,8 @@ class WebsiteService:
        return crawl_status_data

    @classmethod
-    def _get_watercrawl_status(cls, job_id: str, api_key: str, config: dict) -> dict[str, Any]:
-        return WaterCrawlProvider(api_key, config.get("base_url")).get_crawl_status(job_id)
+    def _get_watercrawl_status(cls, job_id: str, api_key: str, config: dict[str, Any]) -> dict[str, Any]:
+        return dict(WaterCrawlProvider(api_key, config.get("base_url")).get_crawl_status(job_id))

    @classmethod
    def _get_jinareader_status(cls, job_id: str, api_key: str) -> dict[str, Any]:
@ -363,8 +365,11 @@ class WebsiteService:
        return None

    @classmethod
-    def _get_watercrawl_url_data(cls, job_id: str, url: str, api_key: str, config: dict) -> dict[str, Any] | None:
-        return WaterCrawlProvider(api_key, config.get("base_url")).get_crawl_url_data(job_id, url)
+    def _get_watercrawl_url_data(
+        cls, job_id: str, url: str, api_key: str, config: dict[str, Any]
+    ) -> dict[str, Any] | None:
+        result = WaterCrawlProvider(api_key, config.get("base_url")).get_crawl_url_data(job_id, url)
+        return dict(result) if result is not None else None

    @classmethod
    def _get_jinareader_url_data(cls, job_id: str, url: str, api_key: str) -> dict[str, Any] | None:
@ -419,5 +424,5 @@ class WebsiteService:
        return dict(firecrawl_app.scrape_url(url=request.url, params=params))

    @classmethod
-    def _scrape_with_watercrawl(cls, request: ScrapeRequest, api_key: str, config: dict) -> dict[str, Any]:
-        return WaterCrawlProvider(api_key=api_key, base_url=config.get("base_url")).scrape_url(request.url)
+    def _scrape_with_watercrawl(cls, request: ScrapeRequest, api_key: str, config: dict[str, Any]) -> dict[str, Any]:
+        return dict(WaterCrawlProvider(api_key=api_key, base_url=config.get("base_url")).scrape_url(request.url))