refactor: extract operator operations into StoreOperationsMixin

Move knowledge-entry lifecycle, rerun/auto/manual search drivers, LLM summary management, manual knowledge registration, and keyword-candidate collection/ promotion into a mixin; CopyrighterStore inherits it. Drop now-unused imports; point the rollback test at store_serialization._stable_id. sqlite_store.py 1598 -> 874 lines (5333 -> 874, -84%).
2026-06-20 22:28:30 +09:00 · 2026-06-20 22:28:30 +09:00 · b575d2ee06
commit b575d2ee06
parent 3bc07d94c3
3 changed files with 771 additions and 734 deletions
--- a/src/rights_filter/server/sqlite_store.py
+++ b/src/rights_filter/server/sqlite_store.py
@ -16,7 +16,6 @@ from rights_filter.analysis.face_person_detection import HeuristicFacePersonDete
 from rights_filter.analysis.fingerprints import FingerprintService
 from rights_filter.analysis.internal_analyzer import InternalAnalyzer
 from rights_filter.analysis.risk_scoring import RiskScorer
-from rights_filter.analysis.search_result_promoter import SearchResultPromoter
 from rights_filter.domain.records import (
    Evidence,
    EvidenceSource,
@ -30,7 +29,7 @@ from rights_filter.integrations.cloud_vision_web_detection import (
 from rights_filter.integrations.env_clients import ProviderRuntime, build_provider_runtime
 from rights_filter.integrations.external_policy import ExternalApiPolicy
 from rights_filter.jobs.batch_analyzer import BatchAnalyzer, SubmissionImage
-from rights_filter.server.image_store import LocalSubmissionImageStore, SUPPORTED_IMAGE_SUFFIXES
+from rights_filter.server.image_store import LocalSubmissionImageStore
 from rights_filter.server.store_constants import (
    DEFAULT_COVERAGE_GOOD_THRESHOLD,
    DEFAULT_COVERAGE_WARN_THRESHOLD,
@ -49,6 +48,7 @@ from rights_filter.server.store_remote_fetch import (
    _fetch_url_bytes,
 )
 from rights_filter.server.store_enrichment import StoreEnrichmentMixin
+from rights_filter.server.store_operations import StoreOperationsMixin
 from rights_filter.server.store_persistence import StorePersistenceMixin
 from rights_filter.server.store_search_candidates import StoreSearchCandidatesMixin
 from rights_filter.server.store_schema import (
@ -59,24 +59,23 @@ from rights_filter.server.store_schema import (
 )
 from rights_filter.server.store_serialization import (
    _default_evidence_contribution,
-    _domain_evidence_from_ui,
    _evidence_id,
    _evidence_matches_provider,
    _evidence_payload,
-    _knowledge_type_value,
    _now_label,
    _provider_item_failed,
    _provider_item_has_result,
-    _stable_id,
    _submission_payload,
    _submission_search_hint_evidence,
-    _timestamp_id,
-    _watchlist_source_evidence,
 )
-from rights_filter.server.store_text import _text_list, _unique_texts


-class CopyrighterStore(StorePersistenceMixin, StoreSearchCandidatesMixin, StoreEnrichmentMixin):
+class CopyrighterStore(
+    StorePersistenceMixin,
+    StoreSearchCandidatesMixin,
+    StoreEnrichmentMixin,
+    StoreOperationsMixin,
+):
    def __init__(
        self,
        db_path: Path | str,
@ -774,730 +773,6 @@ class CopyrighterStore(StorePersistenceMixin, StoreSearchCandidatesMixin, StoreE
        )
        return self.review(submission_id)

-    def promote_watchlist_entry(self, entry_id: str) -> dict[str, Any]:
-        entry = self._get("knowledge_entries", entry_id)
-        if entry.get("entryStatus") != "watchlist":
-            raise ValueError("knowledge entry is not a watchlist candidate")
-        entry["entryStatus"] = "confirmed"
-        entry["active"] = True
-        entry["excludedReason"] = ""
-        entry["confirmedAt"] = _now_label()
-        entry["confirmedBy"] = "rights.ops"
-        self._put("knowledge_entries", entry_id, entry)
-        self.add_audit_event(
-            "rights.ops",
-            "Watchlist candidate promoted",
-            str(entry.get("name", entry_id)),
-            "promoted into confirmed reference DB",
-        )
-        return self.bootstrap()
-
-    def exclude_watchlist_entry(self, entry_id: str, reason: str = "") -> dict[str, Any]:
-        entry = self._get("knowledge_entries", entry_id)
-        if entry.get("entryStatus") not in {"watchlist", "confirmed"}:
-            raise ValueError("knowledge entry cannot be excluded")
-        entry["entryStatus"] = "excluded"
-        entry["active"] = False
-        entry["excludedReason"] = reason.strip() or "오탐 또는 무관 후보"
-        entry["excludedAt"] = _now_label()
-        entry["excludedBy"] = "rights.ops"
-        self._put("knowledge_entries", entry_id, entry)
-        self.add_audit_event(
-            "rights.ops",
-            "Watchlist candidate excluded",
-            str(entry.get("name", entry_id)),
-            entry["excludedReason"],
-        )
-        return self.bootstrap()
-
-    def update_knowledge_entry(self, entry_id: str, payload: dict[str, Any]) -> dict[str, Any]:
-        entry = self._get("knowledge_entries", entry_id)
-        updates: dict[str, Any] = {}
-        if "aliases" in payload:
-            updates["aliases"] = _text_list(payload.get("aliases"))
-        if "keywords" in payload:
-            updates["keywords"] = _text_list(payload.get("keywords"))
-        if "memo" in payload:
-            updates["memo"] = str(payload.get("memo", "")).strip()
-        if not updates:
-            raise ValueError("aliases, keywords, memo 중 수정할 값이 필요합니다")
-
-        before = {key: entry.get(key) for key in updates}
-        entry.update(updates)
-        self._put("knowledge_entries", entry_id, entry)
-        self.add_audit_event(
-            "rights.ops",
-            "Knowledge entry updated",
-            str(entry.get("name", entry_id)),
-            f"{json.dumps(before, ensure_ascii=False)} -> {json.dumps(updates, ensure_ascii=False)}",
-        )
-        return self.bootstrap()
-
-    def deactivate_knowledge_entry(self, entry_id: str, reason: str = "") -> dict[str, Any]:
-        entry = self._get("knowledge_entries", entry_id)
-        if entry.get("entryStatus", "confirmed") != "confirmed":
-            raise ValueError("확정 DB 항목만 비활성화할 수 있습니다")
-        if not entry.get("active", False):
-            raise ValueError("이미 비활성 상태입니다")
-        entry["active"] = False
-        entry["deactivatedAt"] = _now_label()
-        entry["deactivatedBy"] = "rights.ops"
-        entry["deactivatedReason"] = reason.strip()
-        self._put("knowledge_entries", entry_id, entry)
-        self.add_audit_event(
-            "rights.ops",
-            "Knowledge entry deactivated",
-            str(entry.get("name", entry_id)),
-            reason.strip() or "운영자 비활성화",
-        )
-        return self.bootstrap()
-
-    def reactivate_knowledge_entry(self, entry_id: str, reason: str) -> dict[str, Any]:
-        if not reason.strip():
-            raise ValueError("재활성에는 사유 메모가 필요합니다")
-        entry = self._get("knowledge_entries", entry_id)
-        if entry.get("entryStatus", "confirmed") != "confirmed":
-            raise ValueError("확정 DB 항목만 재활성화할 수 있습니다")
-        if entry.get("active", False):
-            raise ValueError("이미 활성 상태입니다")
-        entry["active"] = True
-        entry["reactivatedAt"] = _now_label()
-        entry["reactivatedBy"] = "rights.ops"
-        entry["reactivatedReason"] = reason.strip()
-        self._put("knowledge_entries", entry_id, entry)
-        self.add_audit_event(
-            "rights.ops",
-            "Knowledge entry reactivated",
-            str(entry.get("name", entry_id)),
-            reason.strip(),
-        )
-        return self.bootstrap()
-
-    def _create_or_update_watchlist_entry(
-        self,
-        submission_id: str,
-        decision: str,
-        memo: str,
-        image_store: LocalSubmissionImageStore | None,
-        *,
-        conn: sqlite3.Connection | None = None,
-    ) -> None:
-        submission = self._get("submissions", submission_id, conn=conn)
-        evidence = self._evidence_by_submission().get(submission_id, [])
-        selected_evidence = _watchlist_source_evidence(evidence)
-        selected_evidence_ids = [str(item.get("id", "")) for item in selected_evidence if item.get("id")]
-        sample_fingerprints = self._watchlist_fingerprints(submission_id, image_store)
-
-        entry_id = _stable_id("kb-watchlist", submission_id)
-        try:
-            existing = self._get("knowledge_entries", entry_id, conn=conn)
-        except KeyError:
-            existing = {}
-
-        keywords = _unique_texts(
-            [
-                *[str(item) for item in submission.get("reasons", [])[:3]],
-                *[str(item.get("title", "")) for item in selected_evidence[:3]],
-            ]
-        )
-        entry = {
-            **existing,
-            "id": entry_id,
-            "name": submission.get("derivedPreview", {}).get("entryName") or f"{submission.get('title', submission_id)} / {submission_id}",
-            "type": "rejected_image",
-            "aliases": _unique_texts([submission_id, str(submission.get("title", ""))]),
-            "keywords": keywords,
-            "memo": memo.strip() or ("보류 판정으로 자동 생성" if decision == "held" else "반려 판정으로 자동 생성"),
-            "provenance": "automatic",
-            "active": True,
-            "entryStatus": "watchlist",
-            "originDecisionStatus": decision,
-            "sourceDecision": f"DEC-{submission_id}",
-            "sourceSubmissionId": submission_id,
-            "sourceEvidenceIds": selected_evidence_ids,
-            "sampleFingerprints": sample_fingerprints or _text_list(existing.get("sampleFingerprints")),
-            "imageAsset": str(submission.get("asset", "")),
-            "imageFacts": submission.get("fileFacts", {}),
-            "contributionCount": int(existing.get("contributionCount", 0) or 0),
-            "matchedSubmissionIds": _text_list(existing.get("matchedSubmissionIds")),
-            "lastOriginDecisionAt": _now_label(),
-        }
-        self._put("knowledge_entries", entry_id, entry, conn=conn)
-
-    def _watchlist_fingerprints(
-        self,
-        submission_id: str,
-        image_store: LocalSubmissionImageStore | None,
-    ) -> list[str]:
-        if image_store is None:
-            return []
-        try:
-            fingerprints = FingerprintService().fingerprints_for(
-                image_store.image_payload(submission_id).content
-            )
-        except Exception:
-            return []
-        return [fingerprints.perceptual]
-
-    def rerun_enrichment(
-        self,
-        submission_id: str,
-        image_store: LocalSubmissionImageStore | None = None,
-    ) -> dict[str, Any]:
-        submission = self._get("submissions", submission_id)
-        score_before = int(submission.get("riskScore", 0) or 0)
-        evidence_before = {
-            str(item.get("id", "")): item
-            for item in self._evidence_by_submission().get(submission_id, [])
-        }
-        submission["lastAnalysis"] = _now_label()
-        self._put("submissions", submission_id, submission)
-        evidence = {
-            "id": f"ev-{submission_id}-rerun-{_timestamp_id()}",
-            "group": "internal",
-            "source": "fingerprint",
-            "title": "재분석 요청이 접수됨",
-            "confidence": 0,
-            "query": "",
-            "domain": "internal",
-            "url": "",
-            "retrievedAt": _now_label(),
-            "contributed": False,
-            "sourceEvidenceIds": [],
-            "status": "queued",
-        }
-        self._put("evidence", evidence["id"], {**evidence, "submission_id": submission_id})
-
-        if image_store is not None:
-            self._rerun_internal_analysis(submission_id, image_store)
-            google_evidence = self._rerun_google_image_search(submission_id, image_store)
-            query_source_evidence = [
-                *google_evidence,
-                *_submission_search_hint_evidence(submission),
-            ]
-            self._auto_naver_search(submission_id, query_source_evidence, image_store)
-            self._auto_google_custom_search(submission_id, query_source_evidence, image_store)
-
-        self._ensure_llm_summary(submission_id)
-
-        self.add_audit_event("rights.ops", "Analysis run created", submission_id, "operator rerun")
-        self._rescore_submission(submission_id)
-        self._sync_submission_provider_state()
-
-        evidence_after = {
-            str(item.get("id", "")): item
-            for item in self._evidence_for_submission(submission_id)
-        }
-        rerun_marker_prefix = f"ev-{submission_id}-rerun-"
-        # LLM 요약은 재분석마다 삭제 후 재생성되어 id가 항상 바뀌므로(요약의
-        # source_evidence_ids에 타임스탬프 마커 id가 섞임) diff에 포함하면
-        # 변경이 없어도 매번 신규+제거로 잡힌다 — diff 대상에서 제외한다.
-        added_ids = [
-            evidence_id
-            for evidence_id in evidence_after
-            if evidence_id not in evidence_before
-            and not evidence_id.startswith(rerun_marker_prefix)
-            and str(evidence_after[evidence_id].get("source", "")) != "llm"
-        ]
-        removed_items = [
-            evidence_before[evidence_id]
-            for evidence_id in evidence_before
-            if evidence_id not in evidence_after
-            and str(evidence_before[evidence_id].get("source", "")) != "llm"
-        ]
-        refreshed = self._get("submissions", submission_id)
-        refreshed["lastRerunDiff"] = {
-            "at": _now_label(),
-            "scoreBefore": score_before,
-            "scoreAfter": int(refreshed.get("riskScore", 0) or 0),
-            "addedEvidenceIds": added_ids,
-            "removedEvidenceIds": [str(item.get("id", "")) for item in removed_items],
-            "removedSummaries": [
-                {"source": str(item.get("source", "")), "reason": str(item.get("title", ""))}
-                for item in removed_items
-            ],
-        }
-        self._put("submissions", submission_id, refreshed)
-        return self.review(submission_id)
-
-    def run_auto_search(
-        self,
-        submission_id: str,
-        image_store: LocalSubmissionImageStore | None = None,
-    ) -> dict[str, Any]:
-        submission = self._get("submissions", submission_id)
-        submission["lastAnalysis"] = _now_label()
-        self._put("submissions", submission_id, submission)
-
-        existing_evidence = self._evidence_by_submission().get(submission_id, [])
-        query_source_evidence = [
-            _domain_evidence_from_ui(item)
-            for item in existing_evidence
-            if item.get("source") in {"google", "naver", "face", "fingerprint", "llm", "failure"}
-        ]
-        query_source_evidence.extend(_submission_search_hint_evidence(submission))
-
-        self._auto_naver_search(submission_id, query_source_evidence, image_store)
-        self._auto_google_custom_search(submission_id, query_source_evidence, image_store)
-
-        self._ensure_llm_summary(submission_id)
-        self._rescore_submission(submission_id)
-        self._sync_submission_provider_state()
-        self.add_audit_event(
-            "rights.ops",
-            "Provider called",
-            f"auto-search / {submission_id}",
-            "operator request for auto text search",
-        )
-        return self.review(submission_id)
-
-    def manual_search(
-        self,
-        submission_id: str,
-        provider: str,
-        query: str,
-        image_store: LocalSubmissionImageStore | None = None,
-    ) -> dict[str, Any]:
-        submission = self._get("submissions", submission_id)
-        provider_payload = self._get("providers", provider)
-        if not provider_payload["enabled"]:
-            raise ValueError(f"{provider} provider disabled")
-
-        domain_evidence, provider_call_count = self._manual_search_evidence(
-            submission_id,
-            provider,
-            query,
-            image_store,
-        )
-        for item in domain_evidence:
-            evidence = _evidence_payload(submission_id, item)
-            evidence["status"] = "manual"
-            self._put("evidence", evidence["id"], evidence)
-
-        submission.setdefault("queryHistory", []).insert(
-            0,
-            {
-                "provider": provider,
-                "query": query,
-                "status": "manual",
-                "timestamp": _now_label(),
-                "count": len(domain_evidence),
-            },
-        )
-        self._put("submissions", submission_id, submission)
-        if any(
-            item.source in {EvidenceSource.SEARCH_SKIPPED, EvidenceSource.ENRICHMENT_FAILURE}
-            for item in domain_evidence
-        ):
-            provider_payload["lastFailure"] = domain_evidence[0].reason if domain_evidence else f"{provider} search failed"
-        else:
-            provider_payload["lastSuccess"] = _now_label()
-            provider_payload["lastFailure"] = "없음"
-        self._apply_provider_usage_delta(provider, provider_call_count, provider_payload)
-        self._ensure_llm_summary(submission_id)
-        if image_store is not None:
-            self._rescore_submission(submission_id)
-        self._sync_submission_provider_state()
-        self.add_audit_event("rights.ops", "Provider called", f"{provider} / {submission_id}", f"manual text query: {query}")
-        return self.review(submission_id)
-
-    def _ensure_llm_summaries_for_existing_source_evidence(self, queue_id: str | None = None) -> None:
-        for submission in self._all("submissions", queue_id=queue_id):
-            self._ensure_llm_summary(str(submission["id"]), only_if_missing=True)
-
-    def _ensure_llm_summary(self, submission_id: str, *, only_if_missing: bool = False) -> bool:
-        if self.provider_runtime.llm_assistant is None:
-            return False
-
-        llm_provider = self._get("providers", "llm")
-        if not llm_provider.get("enabled"):
-            return False
-
-        evidence_payloads = self._evidence_by_submission().get(submission_id, [])
-        if only_if_missing and any(
-            _evidence_matches_provider(item, "llm") and _provider_item_has_result(item)
-            for item in evidence_payloads
-        ):
-            return False
-
-        source_evidence = [
-            _domain_evidence_from_ui(item)
-            for item in evidence_payloads
-            if item.get("source") in {"fingerprint", "face", "google", "naver"}
-        ]
-        if not source_evidence:
-            return False
-
-        llm_evidence = self.provider_runtime.llm_assistant.summarize(
-            submission_id,
-            source_evidence,
-        )
-        self._delete_llm_summary_evidence(submission_id)
-        self._put(
-            "evidence",
-            _evidence_id(submission_id, llm_evidence),
-            _evidence_payload(submission_id, llm_evidence),
-        )
-        if llm_evidence.source == EvidenceSource.ENRICHMENT_FAILURE:
-            llm_provider["lastFailure"] = llm_evidence.reason
-        else:
-            llm_provider["lastSuccess"] = _now_label()
-            llm_provider["lastFailure"] = "없음"
-        self._apply_provider_usage_delta("llm", 1, llm_provider)
-        return True
-
-    def _delete_llm_summary_evidence(self, submission_id: str) -> None:
-        with self._connect() as conn:
-            conn.execute(
-                """
-                delete from evidence
-                where submission_id = ?
-                  and (
-                    source = 'llm'
-                    or (
-                      source = 'failure'
-                      and json_extract(payload, '$.title') like 'LLM assistance failed%'
-                    )
-                  )
-                """,
-                (submission_id,),
-            )
-
-    def _manual_search_evidence(
-        self,
-        submission_id: str,
-        provider: str,
-        query: str,
-        image_store: LocalSubmissionImageStore | None,
-    ) -> tuple[list[Evidence], int]:
-        if provider == "naver":
-            if self.provider_runtime.naver_adapter is None:
-                raise ValueError(f"{provider} provider not connected")
-            promoter = SearchResultPromoter()
-            can_compare_search_images = self._can_compare_search_result_images(
-                submission_id,
-                image_store,
-            )
-            domain_evidence = self.provider_runtime.naver_adapter.search(
-                submission_id,
-                query,
-                self.provider_runtime.search_policy,
-            )
-            domain_evidence = promoter.promote(domain_evidence)
-            call_count = 1 if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in domain_evidence) else 0
-            similarity_evidence: list[Evidence] = []
-            if can_compare_search_images and image_store is not None:
-                similarity_evidence = self._sync_search_result_image_similarity(
-                    submission_id,
-                    domain_evidence,
-                    image_store,
-                    status="manual",
-                )
-            page_similarity_evidence: list[Evidence] = []
-            if can_compare_search_images and image_store is not None and not similarity_evidence:
-                page_evidence = self.provider_runtime.naver_adapter.search_pages(
-                    submission_id,
-                    query,
-                    self.provider_runtime.search_policy,
-                )
-                if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in page_evidence):
-                    call_count += 1
-                page_evidence = promoter.promote(page_evidence)
-                domain_evidence.extend(page_evidence)
-                page_similarity_evidence = self._sync_search_result_image_similarity(
-                    submission_id,
-                    page_evidence,
-                    image_store,
-                    status="manual",
-                )
-            if (
-                can_compare_search_images
-                and image_store is not None
-                and not similarity_evidence
-                and not page_similarity_evidence
-            ):
-                web_evidence = self.provider_runtime.naver_adapter.search_web_pages(
-                    submission_id,
-                    query,
-                    self.provider_runtime.search_policy,
-                )
-                if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
-                    call_count += 1
-                web_evidence = promoter.promote(web_evidence)
-                domain_evidence.extend(web_evidence)
-                self._sync_search_result_image_similarity(
-                    submission_id,
-                    web_evidence,
-                    image_store,
-                    status="manual",
-                )
-            return domain_evidence, call_count
-
-        if provider == "google_search":
-            if self.provider_runtime.google_custom_search_adapter is None:
-                raise ValueError(f"{provider} provider not connected")
-            can_compare_search_images = self._can_compare_search_result_images(
-                submission_id,
-                image_store,
-            )
-            domain_evidence = self.provider_runtime.google_custom_search_adapter.search_images(
-                submission_id,
-                query,
-                self.provider_runtime.google_custom_search_policy,
-            )
-            call_count = 1 if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in domain_evidence) else 0
-            similarity_evidence: list[Evidence] = []
-            if can_compare_search_images and image_store is not None:
-                similarity_evidence = self._sync_search_result_image_similarity(
-                    submission_id,
-                    domain_evidence,
-                    image_store,
-                    status="manual",
-                )
-            if can_compare_search_images and image_store is not None and not similarity_evidence:
-                web_evidence = self.provider_runtime.google_custom_search_adapter.search_web_pages(
-                    submission_id,
-                    query,
-                    self.provider_runtime.google_custom_search_policy,
-                )
-                if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
-                    call_count += 1
-                domain_evidence.extend(web_evidence)
-                self._sync_search_result_image_similarity(
-                    submission_id,
-                    web_evidence,
-                    image_store,
-                    status="manual",
-                )
-            return domain_evidence, call_count
-
-        raise ValueError(f"{provider} provider not connected")
-
-    def register_manual_knowledge_entry(self, payload: dict[str, Any]) -> dict[str, Any]:
-        name = str(payload.get("name", "")).strip()
-        if not name:
-            raise ValueError("knowledge name required")
-
-        entry_id = f"kb-manual-{_timestamp_id()}"
-        image_record = self._store_manual_knowledge_image(entry_id, payload.get("image"))
-        sample_fingerprints = [image_record["perceptualFingerprint"]] if image_record else []
-        entry = {
-            "id": entry_id,
-            "name": name,
-            "type": _knowledge_type_value(str(payload.get("type", "other"))),
-            "aliases": _text_list(payload.get("aliases")),
-            "keywords": _text_list(payload.get("keywords")),
-            "memo": str(payload.get("memo", "")).strip(),
-            "provenance": "manual",
-            "active": True,
-            "entryStatus": "confirmed",
-            "sourceDecision": "",
-            "sampleFingerprints": sample_fingerprints,
-            "imageAsset": image_record["asset"] if image_record else "",
-            "imageFacts": image_record["facts"] if image_record else {},
-        }
-        self._put("knowledge_entries", entry_id, entry)
-        self.add_audit_event(
-            "rights.ops",
-            "Knowledge entry manually created",
-            name,
-            "manual image reference" if image_record else "manual text reference",
-        )
-        return entry
-
-    def collect_keyword_candidates(self, query: str, provider: str = "naver") -> dict[str, Any]:
-        query = query.strip()
-        if not query:
-            raise ValueError("collection query required")
-        if provider not in {"naver", "google_search"}:
-            raise ValueError(f"{provider} provider not supported for candidate collection")
-
-        self._sync_provider_payloads()
-        provider_payload = self._get("providers", provider)
-        if not provider_payload["enabled"]:
-            raise ValueError(f"{provider} provider disabled")
-        if provider == "naver" and self.provider_runtime.naver_adapter is None:
-            raise ValueError("naver provider not connected")
-        if provider == "google_search" and self.provider_runtime.google_custom_search_adapter is None:
-            raise ValueError("google_search provider not connected")
-
-        self._clear_collection_candidates()
-        if provider == "google_search":
-            domain_evidence = self.provider_runtime.google_custom_search_adapter.search_images(
-                "candidate-collection",
-                query,
-                self.provider_runtime.google_custom_search_policy,
-            )
-        else:
-            domain_evidence = self.provider_runtime.naver_adapter.search(
-                "candidate-collection",
-                query,
-                self.provider_runtime.search_policy,
-            )
-        collected = 0
-        provider_call_count = 1 if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in domain_evidence) else 0
-        for candidate in self._collection_candidates_from_evidence(query, domain_evidence, provider):
-            self._put("collection_candidates", candidate["id"], candidate)
-            collected += 1
-
-        if provider == "google_search" and collected == 0:
-            web_evidence = self.provider_runtime.google_custom_search_adapter.search_web_pages(
-                "candidate-collection",
-                query,
-                self.provider_runtime.google_custom_search_policy,
-            )
-            if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
-                provider_call_count += 1
-            domain_evidence.extend(web_evidence)
-            for candidate in self._collection_candidates_from_evidence(query, web_evidence, provider):
-                self._put("collection_candidates", candidate["id"], candidate)
-                collected += 1
-        if provider == "naver" and collected == 0:
-            page_evidence = self.provider_runtime.naver_adapter.search_pages(
-                "candidate-collection",
-                query,
-                self.provider_runtime.search_policy,
-            )
-            if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in page_evidence):
-                provider_call_count += 1
-            domain_evidence.extend(page_evidence)
-            for candidate in self._collection_candidates_from_evidence(query, page_evidence, provider):
-                self._put("collection_candidates", candidate["id"], candidate)
-                collected += 1
-        if provider == "naver" and collected == 0:
-            web_evidence = self.provider_runtime.naver_adapter.search_web_pages(
-                "candidate-collection",
-                query,
-                self.provider_runtime.search_policy,
-            )
-            if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
-                provider_call_count += 1
-            domain_evidence.extend(web_evidence)
-            for candidate in self._collection_candidates_from_evidence(query, web_evidence, provider):
-                self._put("collection_candidates", candidate["id"], candidate)
-                collected += 1
-
-        if any(
-            item.source in {EvidenceSource.SEARCH_SKIPPED, EvidenceSource.ENRICHMENT_FAILURE}
-            for item in domain_evidence
-        ):
-            provider_payload["lastFailure"] = domain_evidence[0].reason if domain_evidence else f"{provider} collection failed"
-        else:
-            provider_payload["lastSuccess"] = _now_label()
-            provider_payload["lastFailure"] = "없음"
-        self._apply_provider_usage_delta(provider, provider_call_count, provider_payload)
-        self.add_audit_event("rights.ops", "Keyword candidates collected", provider, f"{query} · {collected} candidates")
-        payload = self.bootstrap()
-        payload["collected"] = collected
-        return payload
-
-    def promote_collection_candidate(self, candidate_id: str, payload: dict[str, Any]) -> dict[str, Any]:
-        with self._write_lock:
-            candidate = self._get("collection_candidates", candidate_id)
-            # Idempotent: a double-click / retry must not create a second
-            # confirmed knowledge entry for the same candidate.
-            if candidate.get("status") == "promoted" and candidate.get("promotedKnowledgeId"):
-                return self.bootstrap()
-            # Deterministic id so a racing retry upserts the same row instead of
-            # minting a new timestamped id.
-            entry_id = _stable_id("kb-candidate", candidate_id)
-            query = str(candidate.get("query", ""))
-            name = str(payload.get("name", "")).strip() or str(candidate.get("title", "")).strip() or query
-            memo = str(payload.get("memo", "")).strip() or f"키워드 후보 수집에서 편입: {query}"
-            entry = {
-                "id": entry_id,
-                "name": name,
-                "type": _knowledge_type_value(str(payload.get("type", "rejected_reference"))),
-                "aliases": _text_list(payload.get("aliases")) or [query],
-                "keywords": _text_list(payload.get("keywords")) or [query],
-                "memo": memo,
-                "provenance": "manual",
-                "active": True,
-                "entryStatus": "confirmed",
-                "sourceDecision": "",
-                "sourceCandidate": candidate_id,
-                "sampleFingerprints": _text_list(candidate.get("sampleFingerprints")),
-                "imageAsset": str(candidate.get("imageAsset", "")),
-                "imageFacts": candidate.get("imageFacts", {}),
-            }
-            with self._transaction() as conn:
-                self._put("knowledge_entries", entry_id, entry, conn=conn)
-                candidate["status"] = "promoted"
-                candidate["promotedKnowledgeId"] = entry_id
-                self._put("collection_candidates", candidate_id, candidate, conn=conn)
-                self.add_audit_event(
-                    "rights.ops", "Knowledge entry manually created", name,
-                    f"promoted candidate {candidate_id}", conn=conn,
-                )
-        return self.bootstrap()
-
-    def promote_collection_candidates(self, payload: dict[str, Any]) -> dict[str, Any]:
-        candidate_ids = _unique_texts(_text_list(payload.get("candidate_ids", payload.get("candidateIds"))))
-        if not candidate_ids:
-            raise ValueError("candidate_ids required")
-
-        candidates = [self._get("collection_candidates", candidate_id) for candidate_id in candidate_ids]
-        sample_fingerprints = _unique_texts(
-            fingerprint
-            for candidate in candidates
-            for fingerprint in _text_list(candidate.get("sampleFingerprints"))
-        )
-        if not sample_fingerprints:
-            raise ValueError("selected candidates have no sample fingerprints")
-
-        entry_id = f"kb-candidate-{_timestamp_id()}"
-        queries = _unique_texts(str(candidate.get("query", "")) for candidate in candidates)
-        image_assets = _unique_texts(str(candidate.get("imageAsset", "")) for candidate in candidates)
-        image_facts = [
-            candidate.get("imageFacts", {})
-            for candidate in candidates
-            if isinstance(candidate.get("imageFacts", {}), dict) and candidate.get("imageFacts", {})
-        ]
-        fallback_name = next(
-            (
-                str(candidate.get("title", "")).strip() or str(candidate.get("query", "")).strip()
-                for candidate in candidates
-                if str(candidate.get("title", "")).strip() or str(candidate.get("query", "")).strip()
-            ),
-            "Collected reference",
-        )
-        name = str(payload.get("name", "")).strip() or fallback_name
-        memo = str(payload.get("memo", "")).strip() or f"Promoted from collected candidates: {', '.join(queries)}"
-        entry = {
-            "id": entry_id,
-            "name": name,
-            "type": _knowledge_type_value(str(payload.get("type", "rejected_reference"))),
-            "aliases": _text_list(payload.get("aliases")) or queries,
-            "keywords": _text_list(payload.get("keywords")) or queries,
-            "memo": memo,
-            "provenance": "manual",
-            "active": True,
-            "entryStatus": "confirmed",
-            "sourceDecision": "",
-            "sourceCandidate": candidate_ids[0] if len(candidate_ids) == 1 else "",
-            "sourceCandidates": candidate_ids,
-            "sampleFingerprints": sample_fingerprints,
-            "imageAsset": image_assets[0] if image_assets else "",
-            "imageAssets": image_assets,
-            "imageFacts": {
-                "samples": len(candidates),
-                "queries": queries,
-                "items": image_facts,
-            },
-        }
-        self._put("knowledge_entries", entry_id, entry)
-        for candidate in candidates:
-            candidate["status"] = "promoted"
-            candidate["promotedKnowledgeId"] = entry_id
-            self._put("collection_candidates", str(candidate["id"]), candidate)
-        self.add_audit_event(
-            "rights.ops",
-            "Knowledge entry manually created",
-            name,
-            f"promoted {len(candidates)} collected candidates",
-        )
-        return self.bootstrap()
-
    def providers(self) -> list[dict[str, Any]]:
        return self._all("providers")

--- a/src/rights_filter/server/store_operations.py
+++ b/src/rights_filter/server/store_operations.py
@ -0,0 +1,761 @@
+"""Operator-facing operations for CopyrighterStore, as a mixin.
+
+Knowledge-entry lifecycle (watchlist promote/exclude, update/deactivate/
+reactivate), rerun/auto/manual search drivers, LLM summary management, manual
+knowledge registration, and keyword-candidate collection/promotion. Mixed into
+CopyrighterStore; relies on persistence + enrichment + search-candidate methods
+and self.* attributes provided by the host class. Behavior unchanged.
+"""
+
+from __future__ import annotations
+
+import json
+import re
+import sqlite3
+from typing import Any
+
+from rights_filter.analysis.fingerprints import FingerprintService
+from rights_filter.analysis.search_result_promoter import SearchResultPromoter
+from rights_filter.domain.records import Evidence, EvidenceSource
+from rights_filter.server.image_store import LocalSubmissionImageStore
+from rights_filter.server.store_serialization import (
+    _domain_evidence_from_ui,
+    _evidence_id,
+    _evidence_matches_provider,
+    _evidence_payload,
+    _knowledge_type_value,
+    _now_label,
+    _provider_item_has_result,
+    _stable_id,
+    _submission_search_hint_evidence,
+    _timestamp_id,
+    _watchlist_source_evidence,
+)
+from rights_filter.server.store_text import _text_list, _unique_texts
+
+
+class StoreOperationsMixin:
+    def promote_watchlist_entry(self, entry_id: str) -> dict[str, Any]:
+        entry = self._get("knowledge_entries", entry_id)
+        if entry.get("entryStatus") != "watchlist":
+            raise ValueError("knowledge entry is not a watchlist candidate")
+        entry["entryStatus"] = "confirmed"
+        entry["active"] = True
+        entry["excludedReason"] = ""
+        entry["confirmedAt"] = _now_label()
+        entry["confirmedBy"] = "rights.ops"
+        self._put("knowledge_entries", entry_id, entry)
+        self.add_audit_event(
+            "rights.ops",
+            "Watchlist candidate promoted",
+            str(entry.get("name", entry_id)),
+            "promoted into confirmed reference DB",
+        )
+        return self.bootstrap()
+
+    def exclude_watchlist_entry(self, entry_id: str, reason: str = "") -> dict[str, Any]:
+        entry = self._get("knowledge_entries", entry_id)
+        if entry.get("entryStatus") not in {"watchlist", "confirmed"}:
+            raise ValueError("knowledge entry cannot be excluded")
+        entry["entryStatus"] = "excluded"
+        entry["active"] = False
+        entry["excludedReason"] = reason.strip() or "오탐 또는 무관 후보"
+        entry["excludedAt"] = _now_label()
+        entry["excludedBy"] = "rights.ops"
+        self._put("knowledge_entries", entry_id, entry)
+        self.add_audit_event(
+            "rights.ops",
+            "Watchlist candidate excluded",
+            str(entry.get("name", entry_id)),
+            entry["excludedReason"],
+        )
+        return self.bootstrap()
+
+    def update_knowledge_entry(self, entry_id: str, payload: dict[str, Any]) -> dict[str, Any]:
+        entry = self._get("knowledge_entries", entry_id)
+        updates: dict[str, Any] = {}
+        if "aliases" in payload:
+            updates["aliases"] = _text_list(payload.get("aliases"))
+        if "keywords" in payload:
+            updates["keywords"] = _text_list(payload.get("keywords"))
+        if "memo" in payload:
+            updates["memo"] = str(payload.get("memo", "")).strip()
+        if not updates:
+            raise ValueError("aliases, keywords, memo 중 수정할 값이 필요합니다")
+
+        before = {key: entry.get(key) for key in updates}
+        entry.update(updates)
+        self._put("knowledge_entries", entry_id, entry)
+        self.add_audit_event(
+            "rights.ops",
+            "Knowledge entry updated",
+            str(entry.get("name", entry_id)),
+            f"{json.dumps(before, ensure_ascii=False)} -> {json.dumps(updates, ensure_ascii=False)}",
+        )
+        return self.bootstrap()
+
+    def deactivate_knowledge_entry(self, entry_id: str, reason: str = "") -> dict[str, Any]:
+        entry = self._get("knowledge_entries", entry_id)
+        if entry.get("entryStatus", "confirmed") != "confirmed":
+            raise ValueError("확정 DB 항목만 비활성화할 수 있습니다")
+        if not entry.get("active", False):
+            raise ValueError("이미 비활성 상태입니다")
+        entry["active"] = False
+        entry["deactivatedAt"] = _now_label()
+        entry["deactivatedBy"] = "rights.ops"
+        entry["deactivatedReason"] = reason.strip()
+        self._put("knowledge_entries", entry_id, entry)
+        self.add_audit_event(
+            "rights.ops",
+            "Knowledge entry deactivated",
+            str(entry.get("name", entry_id)),
+            reason.strip() or "운영자 비활성화",
+        )
+        return self.bootstrap()
+
+    def reactivate_knowledge_entry(self, entry_id: str, reason: str) -> dict[str, Any]:
+        if not reason.strip():
+            raise ValueError("재활성에는 사유 메모가 필요합니다")
+        entry = self._get("knowledge_entries", entry_id)
+        if entry.get("entryStatus", "confirmed") != "confirmed":
+            raise ValueError("확정 DB 항목만 재활성화할 수 있습니다")
+        if entry.get("active", False):
+            raise ValueError("이미 활성 상태입니다")
+        entry["active"] = True
+        entry["reactivatedAt"] = _now_label()
+        entry["reactivatedBy"] = "rights.ops"
+        entry["reactivatedReason"] = reason.strip()
+        self._put("knowledge_entries", entry_id, entry)
+        self.add_audit_event(
+            "rights.ops",
+            "Knowledge entry reactivated",
+            str(entry.get("name", entry_id)),
+            reason.strip(),
+        )
+        return self.bootstrap()
+
+    def _create_or_update_watchlist_entry(
+        self,
+        submission_id: str,
+        decision: str,
+        memo: str,
+        image_store: LocalSubmissionImageStore | None,
+        *,
+        conn: sqlite3.Connection | None = None,
+    ) -> None:
+        submission = self._get("submissions", submission_id, conn=conn)
+        evidence = self._evidence_by_submission().get(submission_id, [])
+        selected_evidence = _watchlist_source_evidence(evidence)
+        selected_evidence_ids = [str(item.get("id", "")) for item in selected_evidence if item.get("id")]
+        sample_fingerprints = self._watchlist_fingerprints(submission_id, image_store)
+
+        entry_id = _stable_id("kb-watchlist", submission_id)
+        try:
+            existing = self._get("knowledge_entries", entry_id, conn=conn)
+        except KeyError:
+            existing = {}
+
+        keywords = _unique_texts(
+            [
+                *[str(item) for item in submission.get("reasons", [])[:3]],
+                *[str(item.get("title", "")) for item in selected_evidence[:3]],
+            ]
+        )
+        entry = {
+            **existing,
+            "id": entry_id,
+            "name": submission.get("derivedPreview", {}).get("entryName") or f"{submission.get('title', submission_id)} / {submission_id}",
+            "type": "rejected_image",
+            "aliases": _unique_texts([submission_id, str(submission.get("title", ""))]),
+            "keywords": keywords,
+            "memo": memo.strip() or ("보류 판정으로 자동 생성" if decision == "held" else "반려 판정으로 자동 생성"),
+            "provenance": "automatic",
+            "active": True,
+            "entryStatus": "watchlist",
+            "originDecisionStatus": decision,
+            "sourceDecision": f"DEC-{submission_id}",
+            "sourceSubmissionId": submission_id,
+            "sourceEvidenceIds": selected_evidence_ids,
+            "sampleFingerprints": sample_fingerprints or _text_list(existing.get("sampleFingerprints")),
+            "imageAsset": str(submission.get("asset", "")),
+            "imageFacts": submission.get("fileFacts", {}),
+            "contributionCount": int(existing.get("contributionCount", 0) or 0),
+            "matchedSubmissionIds": _text_list(existing.get("matchedSubmissionIds")),
+            "lastOriginDecisionAt": _now_label(),
+        }
+        self._put("knowledge_entries", entry_id, entry, conn=conn)
+
+    def _watchlist_fingerprints(
+        self,
+        submission_id: str,
+        image_store: LocalSubmissionImageStore | None,
+    ) -> list[str]:
+        if image_store is None:
+            return []
+        try:
+            fingerprints = FingerprintService().fingerprints_for(
+                image_store.image_payload(submission_id).content
+            )
+        except Exception:
+            return []
+        return [fingerprints.perceptual]
+
+    def rerun_enrichment(
+        self,
+        submission_id: str,
+        image_store: LocalSubmissionImageStore | None = None,
+    ) -> dict[str, Any]:
+        submission = self._get("submissions", submission_id)
+        score_before = int(submission.get("riskScore", 0) or 0)
+        evidence_before = {
+            str(item.get("id", "")): item
+            for item in self._evidence_by_submission().get(submission_id, [])
+        }
+        submission["lastAnalysis"] = _now_label()
+        self._put("submissions", submission_id, submission)
+        evidence = {
+            "id": f"ev-{submission_id}-rerun-{_timestamp_id()}",
+            "group": "internal",
+            "source": "fingerprint",
+            "title": "재분석 요청이 접수됨",
+            "confidence": 0,
+            "query": "",
+            "domain": "internal",
+            "url": "",
+            "retrievedAt": _now_label(),
+            "contributed": False,
+            "sourceEvidenceIds": [],
+            "status": "queued",
+        }
+        self._put("evidence", evidence["id"], {**evidence, "submission_id": submission_id})
+
+        if image_store is not None:
+            self._rerun_internal_analysis(submission_id, image_store)
+            google_evidence = self._rerun_google_image_search(submission_id, image_store)
+            query_source_evidence = [
+                *google_evidence,
+                *_submission_search_hint_evidence(submission),
+            ]
+            self._auto_naver_search(submission_id, query_source_evidence, image_store)
+            self._auto_google_custom_search(submission_id, query_source_evidence, image_store)
+
+        self._ensure_llm_summary(submission_id)
+
+        self.add_audit_event("rights.ops", "Analysis run created", submission_id, "operator rerun")
+        self._rescore_submission(submission_id)
+        self._sync_submission_provider_state()
+
+        evidence_after = {
+            str(item.get("id", "")): item
+            for item in self._evidence_for_submission(submission_id)
+        }
+        rerun_marker_prefix = f"ev-{submission_id}-rerun-"
+        # LLM 요약은 재분석마다 삭제 후 재생성되어 id가 항상 바뀌므로(요약의
+        # source_evidence_ids에 타임스탬프 마커 id가 섞임) diff에 포함하면
+        # 변경이 없어도 매번 신규+제거로 잡힌다 — diff 대상에서 제외한다.
+        added_ids = [
+            evidence_id
+            for evidence_id in evidence_after
+            if evidence_id not in evidence_before
+            and not evidence_id.startswith(rerun_marker_prefix)
+            and str(evidence_after[evidence_id].get("source", "")) != "llm"
+        ]
+        removed_items = [
+            evidence_before[evidence_id]
+            for evidence_id in evidence_before
+            if evidence_id not in evidence_after
+            and str(evidence_before[evidence_id].get("source", "")) != "llm"
+        ]
+        refreshed = self._get("submissions", submission_id)
+        refreshed["lastRerunDiff"] = {
+            "at": _now_label(),
+            "scoreBefore": score_before,
+            "scoreAfter": int(refreshed.get("riskScore", 0) or 0),
+            "addedEvidenceIds": added_ids,
+            "removedEvidenceIds": [str(item.get("id", "")) for item in removed_items],
+            "removedSummaries": [
+                {"source": str(item.get("source", "")), "reason": str(item.get("title", ""))}
+                for item in removed_items
+            ],
+        }
+        self._put("submissions", submission_id, refreshed)
+        return self.review(submission_id)
+
+    def run_auto_search(
+        self,
+        submission_id: str,
+        image_store: LocalSubmissionImageStore | None = None,
+    ) -> dict[str, Any]:
+        submission = self._get("submissions", submission_id)
+        submission["lastAnalysis"] = _now_label()
+        self._put("submissions", submission_id, submission)
+
+        existing_evidence = self._evidence_by_submission().get(submission_id, [])
+        query_source_evidence = [
+            _domain_evidence_from_ui(item)
+            for item in existing_evidence
+            if item.get("source") in {"google", "naver", "face", "fingerprint", "llm", "failure"}
+        ]
+        query_source_evidence.extend(_submission_search_hint_evidence(submission))
+
+        self._auto_naver_search(submission_id, query_source_evidence, image_store)
+        self._auto_google_custom_search(submission_id, query_source_evidence, image_store)
+
+        self._ensure_llm_summary(submission_id)
+        self._rescore_submission(submission_id)
+        self._sync_submission_provider_state()
+        self.add_audit_event(
+            "rights.ops",
+            "Provider called",
+            f"auto-search / {submission_id}",
+            "operator request for auto text search",
+        )
+        return self.review(submission_id)
+
+    def manual_search(
+        self,
+        submission_id: str,
+        provider: str,
+        query: str,
+        image_store: LocalSubmissionImageStore | None = None,
+    ) -> dict[str, Any]:
+        submission = self._get("submissions", submission_id)
+        provider_payload = self._get("providers", provider)
+        if not provider_payload["enabled"]:
+            raise ValueError(f"{provider} provider disabled")
+
+        domain_evidence, provider_call_count = self._manual_search_evidence(
+            submission_id,
+            provider,
+            query,
+            image_store,
+        )
+        for item in domain_evidence:
+            evidence = _evidence_payload(submission_id, item)
+            evidence["status"] = "manual"
+            self._put("evidence", evidence["id"], evidence)
+
+        submission.setdefault("queryHistory", []).insert(
+            0,
+            {
+                "provider": provider,
+                "query": query,
+                "status": "manual",
+                "timestamp": _now_label(),
+                "count": len(domain_evidence),
+            },
+        )
+        self._put("submissions", submission_id, submission)
+        if any(
+            item.source in {EvidenceSource.SEARCH_SKIPPED, EvidenceSource.ENRICHMENT_FAILURE}
+            for item in domain_evidence
+        ):
+            provider_payload["lastFailure"] = domain_evidence[0].reason if domain_evidence else f"{provider} search failed"
+        else:
+            provider_payload["lastSuccess"] = _now_label()
+            provider_payload["lastFailure"] = "없음"
+        self._apply_provider_usage_delta(provider, provider_call_count, provider_payload)
+        self._ensure_llm_summary(submission_id)
+        if image_store is not None:
+            self._rescore_submission(submission_id)
+        self._sync_submission_provider_state()
+        self.add_audit_event("rights.ops", "Provider called", f"{provider} / {submission_id}", f"manual text query: {query}")
+        return self.review(submission_id)
+
+    def _ensure_llm_summaries_for_existing_source_evidence(self, queue_id: str | None = None) -> None:
+        for submission in self._all("submissions", queue_id=queue_id):
+            self._ensure_llm_summary(str(submission["id"]), only_if_missing=True)
+
+    def _ensure_llm_summary(self, submission_id: str, *, only_if_missing: bool = False) -> bool:
+        if self.provider_runtime.llm_assistant is None:
+            return False
+
+        llm_provider = self._get("providers", "llm")
+        if not llm_provider.get("enabled"):
+            return False
+
+        evidence_payloads = self._evidence_by_submission().get(submission_id, [])
+        if only_if_missing and any(
+            _evidence_matches_provider(item, "llm") and _provider_item_has_result(item)
+            for item in evidence_payloads
+        ):
+            return False
+
+        source_evidence = [
+            _domain_evidence_from_ui(item)
+            for item in evidence_payloads
+            if item.get("source") in {"fingerprint", "face", "google", "naver"}
+        ]
+        if not source_evidence:
+            return False
+
+        llm_evidence = self.provider_runtime.llm_assistant.summarize(
+            submission_id,
+            source_evidence,
+        )
+        self._delete_llm_summary_evidence(submission_id)
+        self._put(
+            "evidence",
+            _evidence_id(submission_id, llm_evidence),
+            _evidence_payload(submission_id, llm_evidence),
+        )
+        if llm_evidence.source == EvidenceSource.ENRICHMENT_FAILURE:
+            llm_provider["lastFailure"] = llm_evidence.reason
+        else:
+            llm_provider["lastSuccess"] = _now_label()
+            llm_provider["lastFailure"] = "없음"
+        self._apply_provider_usage_delta("llm", 1, llm_provider)
+        return True
+
+    def _delete_llm_summary_evidence(self, submission_id: str) -> None:
+        with self._connect() as conn:
+            conn.execute(
+                """
+                delete from evidence
+                where submission_id = ?
+                  and (
+                    source = 'llm'
+                    or (
+                      source = 'failure'
+                      and json_extract(payload, '$.title') like 'LLM assistance failed%'
+                    )
+                  )
+                """,
+                (submission_id,),
+            )
+
+    def _manual_search_evidence(
+        self,
+        submission_id: str,
+        provider: str,
+        query: str,
+        image_store: LocalSubmissionImageStore | None,
+    ) -> tuple[list[Evidence], int]:
+        if provider == "naver":
+            if self.provider_runtime.naver_adapter is None:
+                raise ValueError(f"{provider} provider not connected")
+            promoter = SearchResultPromoter()
+            can_compare_search_images = self._can_compare_search_result_images(
+                submission_id,
+                image_store,
+            )
+            domain_evidence = self.provider_runtime.naver_adapter.search(
+                submission_id,
+                query,
+                self.provider_runtime.search_policy,
+            )
+            domain_evidence = promoter.promote(domain_evidence)
+            call_count = 1 if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in domain_evidence) else 0
+            similarity_evidence: list[Evidence] = []
+            if can_compare_search_images and image_store is not None:
+                similarity_evidence = self._sync_search_result_image_similarity(
+                    submission_id,
+                    domain_evidence,
+                    image_store,
+                    status="manual",
+                )
+            page_similarity_evidence: list[Evidence] = []
+            if can_compare_search_images and image_store is not None and not similarity_evidence:
+                page_evidence = self.provider_runtime.naver_adapter.search_pages(
+                    submission_id,
+                    query,
+                    self.provider_runtime.search_policy,
+                )
+                if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in page_evidence):
+                    call_count += 1
+                page_evidence = promoter.promote(page_evidence)
+                domain_evidence.extend(page_evidence)
+                page_similarity_evidence = self._sync_search_result_image_similarity(
+                    submission_id,
+                    page_evidence,
+                    image_store,
+                    status="manual",
+                )
+            if (
+                can_compare_search_images
+                and image_store is not None
+                and not similarity_evidence
+                and not page_similarity_evidence
+            ):
+                web_evidence = self.provider_runtime.naver_adapter.search_web_pages(
+                    submission_id,
+                    query,
+                    self.provider_runtime.search_policy,
+                )
+                if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
+                    call_count += 1
+                web_evidence = promoter.promote(web_evidence)
+                domain_evidence.extend(web_evidence)
+                self._sync_search_result_image_similarity(
+                    submission_id,
+                    web_evidence,
+                    image_store,
+                    status="manual",
+                )
+            return domain_evidence, call_count
+
+        if provider == "google_search":
+            if self.provider_runtime.google_custom_search_adapter is None:
+                raise ValueError(f"{provider} provider not connected")
+            can_compare_search_images = self._can_compare_search_result_images(
+                submission_id,
+                image_store,
+            )
+            domain_evidence = self.provider_runtime.google_custom_search_adapter.search_images(
+                submission_id,
+                query,
+                self.provider_runtime.google_custom_search_policy,
+            )
+            call_count = 1 if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in domain_evidence) else 0
+            similarity_evidence: list[Evidence] = []
+            if can_compare_search_images and image_store is not None:
+                similarity_evidence = self._sync_search_result_image_similarity(
+                    submission_id,
+                    domain_evidence,
+                    image_store,
+                    status="manual",
+                )
+            if can_compare_search_images and image_store is not None and not similarity_evidence:
+                web_evidence = self.provider_runtime.google_custom_search_adapter.search_web_pages(
+                    submission_id,
+                    query,
+                    self.provider_runtime.google_custom_search_policy,
+                )
+                if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
+                    call_count += 1
+                domain_evidence.extend(web_evidence)
+                self._sync_search_result_image_similarity(
+                    submission_id,
+                    web_evidence,
+                    image_store,
+                    status="manual",
+                )
+            return domain_evidence, call_count
+
+        raise ValueError(f"{provider} provider not connected")
+
+    def register_manual_knowledge_entry(self, payload: dict[str, Any]) -> dict[str, Any]:
+        name = str(payload.get("name", "")).strip()
+        if not name:
+            raise ValueError("knowledge name required")
+
+        entry_id = f"kb-manual-{_timestamp_id()}"
+        image_record = self._store_manual_knowledge_image(entry_id, payload.get("image"))
+        sample_fingerprints = [image_record["perceptualFingerprint"]] if image_record else []
+        entry = {
+            "id": entry_id,
+            "name": name,
+            "type": _knowledge_type_value(str(payload.get("type", "other"))),
+            "aliases": _text_list(payload.get("aliases")),
+            "keywords": _text_list(payload.get("keywords")),
+            "memo": str(payload.get("memo", "")).strip(),
+            "provenance": "manual",
+            "active": True,
+            "entryStatus": "confirmed",
+            "sourceDecision": "",
+            "sampleFingerprints": sample_fingerprints,
+            "imageAsset": image_record["asset"] if image_record else "",
+            "imageFacts": image_record["facts"] if image_record else {},
+        }
+        self._put("knowledge_entries", entry_id, entry)
+        self.add_audit_event(
+            "rights.ops",
+            "Knowledge entry manually created",
+            name,
+            "manual image reference" if image_record else "manual text reference",
+        )
+        return entry
+
+    def collect_keyword_candidates(self, query: str, provider: str = "naver") -> dict[str, Any]:
+        query = query.strip()
+        if not query:
+            raise ValueError("collection query required")
+        if provider not in {"naver", "google_search"}:
+            raise ValueError(f"{provider} provider not supported for candidate collection")
+
+        self._sync_provider_payloads()
+        provider_payload = self._get("providers", provider)
+        if not provider_payload["enabled"]:
+            raise ValueError(f"{provider} provider disabled")
+        if provider == "naver" and self.provider_runtime.naver_adapter is None:
+            raise ValueError("naver provider not connected")
+        if provider == "google_search" and self.provider_runtime.google_custom_search_adapter is None:
+            raise ValueError("google_search provider not connected")
+
+        self._clear_collection_candidates()
+        if provider == "google_search":
+            domain_evidence = self.provider_runtime.google_custom_search_adapter.search_images(
+                "candidate-collection",
+                query,
+                self.provider_runtime.google_custom_search_policy,
+            )
+        else:
+            domain_evidence = self.provider_runtime.naver_adapter.search(
+                "candidate-collection",
+                query,
+                self.provider_runtime.search_policy,
+            )
+        collected = 0
+        provider_call_count = 1 if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in domain_evidence) else 0
+        for candidate in self._collection_candidates_from_evidence(query, domain_evidence, provider):
+            self._put("collection_candidates", candidate["id"], candidate)
+            collected += 1
+
+        if provider == "google_search" and collected == 0:
+            web_evidence = self.provider_runtime.google_custom_search_adapter.search_web_pages(
+                "candidate-collection",
+                query,
+                self.provider_runtime.google_custom_search_policy,
+            )
+            if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
+                provider_call_count += 1
+            domain_evidence.extend(web_evidence)
+            for candidate in self._collection_candidates_from_evidence(query, web_evidence, provider):
+                self._put("collection_candidates", candidate["id"], candidate)
+                collected += 1
+        if provider == "naver" and collected == 0:
+            page_evidence = self.provider_runtime.naver_adapter.search_pages(
+                "candidate-collection",
+                query,
+                self.provider_runtime.search_policy,
+            )
+            if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in page_evidence):
+                provider_call_count += 1
+            domain_evidence.extend(page_evidence)
+            for candidate in self._collection_candidates_from_evidence(query, page_evidence, provider):
+                self._put("collection_candidates", candidate["id"], candidate)
+                collected += 1
+        if provider == "naver" and collected == 0:
+            web_evidence = self.provider_runtime.naver_adapter.search_web_pages(
+                "candidate-collection",
+                query,
+                self.provider_runtime.search_policy,
+            )
+            if any(item.source != EvidenceSource.SEARCH_SKIPPED for item in web_evidence):
+                provider_call_count += 1
+            domain_evidence.extend(web_evidence)
+            for candidate in self._collection_candidates_from_evidence(query, web_evidence, provider):
+                self._put("collection_candidates", candidate["id"], candidate)
+                collected += 1
+
+        if any(
+            item.source in {EvidenceSource.SEARCH_SKIPPED, EvidenceSource.ENRICHMENT_FAILURE}
+            for item in domain_evidence
+        ):
+            provider_payload["lastFailure"] = domain_evidence[0].reason if domain_evidence else f"{provider} collection failed"
+        else:
+            provider_payload["lastSuccess"] = _now_label()
+            provider_payload["lastFailure"] = "없음"
+        self._apply_provider_usage_delta(provider, provider_call_count, provider_payload)
+        self.add_audit_event("rights.ops", "Keyword candidates collected", provider, f"{query} · {collected} candidates")
+        payload = self.bootstrap()
+        payload["collected"] = collected
+        return payload
+
+    def promote_collection_candidate(self, candidate_id: str, payload: dict[str, Any]) -> dict[str, Any]:
+        with self._write_lock:
+            candidate = self._get("collection_candidates", candidate_id)
+            # Idempotent: a double-click / retry must not create a second
+            # confirmed knowledge entry for the same candidate.
+            if candidate.get("status") == "promoted" and candidate.get("promotedKnowledgeId"):
+                return self.bootstrap()
+            # Deterministic id so a racing retry upserts the same row instead of
+            # minting a new timestamped id.
+            entry_id = _stable_id("kb-candidate", candidate_id)
+            query = str(candidate.get("query", ""))
+            name = str(payload.get("name", "")).strip() or str(candidate.get("title", "")).strip() or query
+            memo = str(payload.get("memo", "")).strip() or f"키워드 후보 수집에서 편입: {query}"
+            entry = {
+                "id": entry_id,
+                "name": name,
+                "type": _knowledge_type_value(str(payload.get("type", "rejected_reference"))),
+                "aliases": _text_list(payload.get("aliases")) or [query],
+                "keywords": _text_list(payload.get("keywords")) or [query],
+                "memo": memo,
+                "provenance": "manual",
+                "active": True,
+                "entryStatus": "confirmed",
+                "sourceDecision": "",
+                "sourceCandidate": candidate_id,
+                "sampleFingerprints": _text_list(candidate.get("sampleFingerprints")),
+                "imageAsset": str(candidate.get("imageAsset", "")),
+                "imageFacts": candidate.get("imageFacts", {}),
+            }
+            with self._transaction() as conn:
+                self._put("knowledge_entries", entry_id, entry, conn=conn)
+                candidate["status"] = "promoted"
+                candidate["promotedKnowledgeId"] = entry_id
+                self._put("collection_candidates", candidate_id, candidate, conn=conn)
+                self.add_audit_event(
+                    "rights.ops", "Knowledge entry manually created", name,
+                    f"promoted candidate {candidate_id}", conn=conn,
+                )
+        return self.bootstrap()
+
+    def promote_collection_candidates(self, payload: dict[str, Any]) -> dict[str, Any]:
+        candidate_ids = _unique_texts(_text_list(payload.get("candidate_ids", payload.get("candidateIds"))))
+        if not candidate_ids:
+            raise ValueError("candidate_ids required")
+
+        candidates = [self._get("collection_candidates", candidate_id) for candidate_id in candidate_ids]
+        sample_fingerprints = _unique_texts(
+            fingerprint
+            for candidate in candidates
+            for fingerprint in _text_list(candidate.get("sampleFingerprints"))
+        )
+        if not sample_fingerprints:
+            raise ValueError("selected candidates have no sample fingerprints")
+
+        entry_id = f"kb-candidate-{_timestamp_id()}"
+        queries = _unique_texts(str(candidate.get("query", "")) for candidate in candidates)
+        image_assets = _unique_texts(str(candidate.get("imageAsset", "")) for candidate in candidates)
+        image_facts = [
+            candidate.get("imageFacts", {})
+            for candidate in candidates
+            if isinstance(candidate.get("imageFacts", {}), dict) and candidate.get("imageFacts", {})
+        ]
+        fallback_name = next(
+            (
+                str(candidate.get("title", "")).strip() or str(candidate.get("query", "")).strip()
+                for candidate in candidates
+                if str(candidate.get("title", "")).strip() or str(candidate.get("query", "")).strip()
+            ),
+            "Collected reference",
+        )
+        name = str(payload.get("name", "")).strip() or fallback_name
+        memo = str(payload.get("memo", "")).strip() or f"Promoted from collected candidates: {', '.join(queries)}"
+        entry = {
+            "id": entry_id,
+            "name": name,
+            "type": _knowledge_type_value(str(payload.get("type", "rejected_reference"))),
+            "aliases": _text_list(payload.get("aliases")) or queries,
+            "keywords": _text_list(payload.get("keywords")) or queries,
+            "memo": memo,
+            "provenance": "manual",
+            "active": True,
+            "entryStatus": "confirmed",
+            "sourceDecision": "",
+            "sourceCandidate": candidate_ids[0] if len(candidate_ids) == 1 else "",
+            "sourceCandidates": candidate_ids,
+            "sampleFingerprints": sample_fingerprints,
+            "imageAsset": image_assets[0] if image_assets else "",
+            "imageAssets": image_assets,
+            "imageFacts": {
+                "samples": len(candidates),
+                "queries": queries,
+                "items": image_facts,
+            },
+        }
+        self._put("knowledge_entries", entry_id, entry)
+        for candidate in candidates:
+            candidate["status"] = "promoted"
+            candidate["promotedKnowledgeId"] = entry_id
+            self._put("collection_candidates", str(candidate["id"]), candidate)
+        self.add_audit_event(
+            "rights.ops",
+            "Knowledge entry manually created",
+            name,
+            f"promoted {len(candidates)} collected candidates",
+        )
+        return self.bootstrap()
+
--- a/tests/rights_filter/server/test_sqlite_store.py
+++ b/tests/rights_filter/server/test_sqlite_store.py
@ -14,6 +14,7 @@ from rights_filter.server.image_store import LocalSubmissionImageStore
 from rights_filter.server import sqlite_store as sqlite_store_module
 from rights_filter.server import store_enrichment as store_enrichment_module
 from rights_filter.server import store_remote_fetch as remote_fetch_module
+from rights_filter.server import store_serialization as store_serialization_module
 from rights_filter.server.sqlite_store import CopyrighterStore
 from rights_filter.integrations.env_clients import build_provider_runtime

@ -8040,7 +8041,7 @@ def test_record_decision_rolls_back_when_audit_fails(tmp_path: Path, monkeypatch
    # The status change must roll back atomically with the failed audit write.
    assert store._get("submissions", "SUB-1")["decisionStatus"] == "unreviewed"
    with pytest.raises(KeyError):
-        store._get("knowledge_entries", sqlite_store_module._stable_id("kb-watchlist", "SUB-1"))
+        store._get("knowledge_entries", store_serialization_module._stable_id("kb-watchlist", "SUB-1"))


@pytest.mark.parametrize(