وثائق بوابة القرار

تقييم بوابة حتمي وقابل لإعادة التشغيل مع قرارات قابلة للتدقيق.

وثائق Asset Core

مسارات المهارات للانضمام

الهدف

هذا الدليل هو المسار الوحيد للتوجيه لكل من وضعي استخدام Decision Gate:

  1. يحرس DG تنفيذ المهارات الخارجية.
  2. يُطلق على DG مهارة التقييم الحتمي.

كما يحدد كيفية تكوين كلا الوضعين بأمان (الحلقات التكرارية) دون السماح بانحراف السياسة التي كتبها LLM.

أي مسار يجب استخدامه

IntentPathEnforcement Strength
تغيير الحالة الخارجية (deploy, delete, pay, publish)تنفيذ مهارة حراس DGحد صارم (فشل مغلق)
إنتاج التحليل/التقارير/دعم القرارDG كمهارة تقييمحساب فقط ما لم يتم تغليفه بحد
حلقات وكيل متعددة الخطوات تقوم بالتأليف ثم التنفيذتركيب تكراري (حارس خارجي + تقييم داخلي)حد صارم عند الحلقة الخارجية

المسار A: تنفيذ مهارات حراس DG (الإعداد الافتراضي للإنتاج)

استخدم هذا عندما تكون للإجراءات آثار جانبية.

عقد تشغيلي

  1. ملكية البوابة مملوكة للإنسان/السياسة.
  2. مواصفات البوابة هي مواد مُعتمدة على الإصدارات، وليست اختراعات LLM أثناء التشغيل.
  3. يجب أن تمر كل استدعاء مهارة متغيرة بتقييم DG المباشر قبل التنفيذ.
  4. نتائج غير ناجحة (hold, fail, unknown) تمنع التنفيذ.

قائمة التحقق للإعداد

  1. تعريف خريطة بوابة لكل إجراء.
  2. قم بتأليف وتسجيل مواصفات السيناريو لكل فئة إجراء.
  3. تنفيذ غلاف وقت تشغيل رقيق: evaluate -> allow/deny -> execute.
  4. تصدير والتحقق من حزم التشغيل للتدقيق.

مثال على خريطة الإجراءات:

{
  "deploy_to_prod": {
    "scenario_id": "release-boundary-v1",
    "required_min_lane": "verified",
    "allowed_outcomes": ["advance", "complete"]
  },
  "publish_external_report": {
    "scenario_id": "publication-boundary-v1",
    "required_min_lane": "verified",
    "allowed_outcomes": ["complete"]
  }
}

مثال على منطق التغليف:

def guarded_skill_call(action_name, action_args):
    policy = action_gate_map[action_name]
    run_id = start_run(policy["scenario_id"])
    result = scenario_next(policy["scenario_id"], run_id, feedback="trace")
    outcome = extract_outcome_kind(result)
    if outcome not in policy["allowed_outcomes"]:
        return {"allowed": False, "reason": "gate_not_satisfied", "result": result}
    skill_result = call_external_skill(action_name, action_args)
    runpack = runpack_export(policy["scenario_id"], run_id)
    verify = runpack_verify(runpack["dir"], runpack["manifest_path"])
    return {"allowed": True, "skill_result": skill_result, "runpack_verify": verify}

مراجع التنفيذ:

المسار ب: مهارة تقييم DG

استخدم هذا للتحليل المنظم عندما لا يتم تنفيذ أي إجراء مباشر ذو تأثير جانبي.

عقد تشغيلي

  1. يتم استدعاء DG كمقيّم مطالبات حتمي.
  2. المخرجات تدفع التفسير/التقارير، وليس التغيير المباشر.
  3. إذا تم طلب الطفرة لاحقًا، انتقل إلى حدود المسار A أولاً.

تدفق الأدوات النموذجي

  1. اكتشف القدرات: providers_list, provider_contract_get, provider_check_schema_get.
  2. بناء العناصر: claim_inventory, capability_matrix, claim_condition_map.
  3. تقييم: precheck للتكرار، ثم scenario_next المباشر عندما تتطلب السياسة إثباتًا مباشرًا.
  4. تحقق من النزاهة عند الحاجة إلى التدقيق: runpack_export, runpack_verify.

عقد قياسي: llm_native_playbook.md

المسار C: التركيب التكراري (حلقة التأليف + حدود التنفيذ)

هذه هي القلق الشائع “DG داخل سير العمل DG”.

استخدم نموذج الحلقة:

  1. الحلقة الداخلية: DG-as-skill لمساعدة تحليل/تحقق المطالبات.
  2. الحلقة الخارجية: حارس DG للعمل التبعي.

قواعد صارمة:

  1. قد يقترح الحلقة الداخلية خرائط؛ ولا يمكنها تخفيف سياسة الحلقة الخارجية.
  2. تظل تعريفات بوابة الحلقة الخارجية مؤلفة من النظام ومُعَدَّلة.
  3. كتل الحلقة الخارجية على أي مطالبة مطلوبة غير محلولة بغض النظر عن نص ثقة الحلقة الداخلية.
  4. تحقق من تشغيل الحزمة في الحلقة الخارجية هو مصدر الحقيقة للتدقيق.

نموذج مضاد يجب تجنبه:

"The agent self-evaluated with DG and therefore can deploy."

نمط صحيح:

"The agent used DG for analysis, then the system-enforced deployment gate passed live, then deploy executed."

مسار الانضمام السريع (المستودع)

استخدم هذه السلسلة عند إدخال البشر أو وكلاء LLM إلى كلا المسارين.

  1. قم بتشغيل الاختبار السريع الذي يتكون من أمر واحد (كلا المسارين + حالة الرفض القسري):
scripts/bootstrap/skill_pathways_quickstart.sh configs/presets/quickstart-dev.toml
  1. اقرأ llm_native_playbook.md وهذا الدليل.
  2. تثبيت المهارات:
scripts/skills/install_local.sh
  1. قم بتشغيل حلقة التوجيه من البداية إلى النهاية:
python3 examples/frameworks/openai_agents_live_loop.py \
  --fixture-dir examples/agentic/onboarding/basic
  1. تشغيل مصفوفة الصحة الحتمية:
python3 scripts/skills/eval_runner.py \
  --mode deterministic \
  --trials 1 \
  --cases all \
  --out-dir .tmp/skills/eval-deterministic-local
  1. قم بتشغيل مدقق صحة الانضمام:
python3 scripts/onboarding/provider_onboarding_check.py \
  --cases all \
  --out-dir .tmp/onboarding/local

تعريف الانتهاء (الحد الأدنى بدون أخطاء)

قبل إعلان اكتمال التبني:

  1. يتم تغليف المهارات المتغيرة بواسطة منطق حدود المسار A.
  2. مواصفات البوابة مُعتمدة على إصدار وملكية سياسة (وليس نصًا عشوائيًا).
  3. تتضمن التعليمات الموجهة لـ LLM قواعد توقف صارمة واضحة.
  4. تقارير تقييم المهارات الحتمية تمر للحالات المطلوبة.
  5. تقرير صحة الانضمام يحدد جميع الحالات المكتملة.
  6. اجتياز التحقق من حزمة التشغيل في سير العمل الحي.

المراجع المتقاطعة