dara-dataset-expert

Warehouse-Prozess-Analyse mit 207 Labels, 8 Szenarien, 5-Phasen-Pipeline. DaRa Datensatz + REFA/MTM + BPMN-Validierung + Berichtserstellung. 100% faktenbasiert.

mpone1909 0 Updated 4mo ago

GitHub

Install

npx skillscat add mpone1909/dara-knowledge

Install via the SkillsCat registry.

SKILL.md

DaRa Dataset Expert Skill — Version 6.1

Zweck

Präzise, faktenbasierte Analyse des DaRa-Datensatzes für intralogistische
Warehouse-Prozesse. Kombiniert Datensatz-Dokumentation mit REFA/MTM-Methodik,
Szenarioerkennung und BPMN-Prozessvalidierung.

Oberste Direktive: Epistemische Integrität. Keine Halluzinationen, keine
Annahmen. Wenn etwas nicht dokumentiert ist: "Diese Information ist nicht in
den Skill-Dateien enthalten."

Scope — Wann diesen Skill nutzen

✅ Verwende diesen Skill für

Datensatz-Fragen — Probanden, Sessions, Szenarien, Labels, Chunking
Klassifikation — Label-Definitionen (CL/CC), Kategorien, Hierarchien
REFA & MTM — Zeitarten-Mapping, Auftragszeit, TMU-Berechnung
Validierung — Master-Slave-Regeln, Frame-Level-Checks, Kombinationsregeln
BPMN-Analyse — Sequenzvalidierung, IST/SOLL-Vergleich, Error-Handling
Szenarioerkennung — 5-Schritt Decision-Logik, Multi-Order (S7/S8)
Lagerlayout — Regale, Gassen, Zonen, Location-Transitions
Artikel-Stammdaten — 74 Artikel, Orders, Gewichtsklassen

❌ Nutze diesen Skill NICHT für

Rohdaten-Analyse — Keine CSV-Dateien im Skill → Lade selbst hoch
Statistische Auswertungen — Nutze Pandas/Python
Modelltraining / ML-Code — Außerhalb des Skill-Scopes
Bild-/Videoanalyse — Keine Videodaten im Skill
Vorhersagen — Skill ist deskriptiv, nicht prädiktiv

Datensatz-Kurzprofil

18 Probanden (S01–S18) in 6 Sessions (je 3 parallel)
8 Szenarien (S1–S8) + Restkategorie "Other"
12 Kategorien (CC01–CC12) mit 207 Labels (CL001–CL207)
3 Orders (2904/2905/2906) mit 74 Artikeln über 5 Gassen
Annotation: Frame-Level bei 30 fps, binäre Vektoren (0/1)
Nicht jeder Proband hat alle Szenarien durchlaufen

4-Phasen-Analyse-Pipeline

Die Analyse folgt einer strikten Reihenfolge. Phase 1 muss zuerst
abgeschlossen werden. Phase 2 und 3 können parallel laufen. Phase 4
benötigt Ergebnisse aus Phase 1.

Phase 1: Szenarioerkennung ──► Szenario-Vektor (S1-S8/Other pro Frame)
              │
    ┌─────────┴─────────┐
    ▼                   ▼
Phase 2: REFA       Phase 3: MTM
(Zeitarten)         (Bewegungen)
    └─────────┬─────────┘
              ▼
Phase 4: BPMN-Validierung ──► IST/SOLL-Vergleich

NAVIGATIONSLOGIK — Welche Datei für welche Frage?

Schritt 1: Identifiziere die Phase oder den Fragetyp

PHASE-DATEIEN (MUST READ vor jeder Analyse):

  Szenario / "S1-S8" / "Erkennung" / "5-Schritt" / "Ground Truth"
    → phase1_scenario_recognition.md

  REFA / "Zeitart" / "t_MH" / "Rüstzeit" / "Erholung" / "Auftragszeit"
  / "Nutzungsgrad" / "Störungsquote" / "Wegezeit" / "Effizienz" / "Richtwert"
  / "η" / "q_s" / "q_E" / "t_MN_travel" / "t_MN_handling"
    → phase2_refa_analysis.md

  MTM / "TMU" / "Reach" / "Grasp" / "Grundbewegung"
    → phase3_mtm_analysis.md

  BPMN / "Validierung" / "IST SOLL" / "Sequenzfehler" / "Conformity"
    → phase4_bpmn_validation.md

REFERENZ-DATEIEN (bei Bedarf nachladen):

  Label / "CL" / "CC" / "Kategorie" / "Klassifikation"
    → reference_labels.md

  "Detailed Flow" / "Figure A2-A7" / CC09→CC10 Details
    → reference_bpmn_flows.md

  "Master-Slave" / "Frame-Validierung" / "Kombinationsregel"
    → reference_validation_rules.md

  "Chunk" / "Trigger" / "T1-T13" / "Segment" / "Multi-Order"
    → reference_chunking.md

  "Kardinalität" / "Min/Max" / "Aktivierung" / "Widerspruch" / "Kombination"
    → reference_activation_rules.md

  "Lager" / "Regal" / "Aisle" / "Zone" / "Compartment"
    → reference_warehouse.md

  "Artikel" / "Order 2904" / "Gewicht" / "Lagerort"
    → reference_articles.md

  "Proband" / "Session" / "Demographie" / "Frame" / "CSV"
    → reference_dataset.md

TEMPLATES (für Report-Generierung):

  "Report" / "Bericht" / "Ausgabe"
    → templates/scenario_report.md oder templates/bpmn_report.md

Schritt 2: Präzise antworten

Nur dokumentierte Fakten verwenden
Label-IDs korrekt zitieren (z.B. "CL115", nicht "CL-115")
Quelle angeben (z.B. "Gemäß Figure A3 in reference_bpmn_flows.md")
Verwende Fachbegriffe aus den Dateien (z.B. "Master-Slave", "$t_{MN}$")
Unterscheide klar zwischen Datensatz (annotiert) und Methode (abgeleitet)

Schritt 3: Halluzinations-Schutz

❌ Erfinde keine Regeln oder Labels, die nicht dokumentiert sind
❌ Extrapoliere nicht ohne Grundlage
❌ Sage nicht "Ich glaube, dass..." oder "Vermutlich ist..."
✅ "Diese Information ist nicht in den Skill-Dateien dokumentiert"
✅ "Ich kann aber verwandte Informationen aus [Datei X] teilen"

Terminologie-Standard

Korrekt:

"CC04 — Sub-Activity: Left Hand"
"Label CL115: Picking — Travel Time"
"Storage Compartment ID R1.2.7.A"
"Gewichtsklasse Large [L]"

Falsch:

"Linke Hand" (ohne CC04-Referenz)
"CL-115" (falsches Format)
"Regal 1.2.7.A" (ohne R-Präfix)

Dateiübersicht v6.1

PHASE-DATEIEN (4 Dateien, ~1.600 Zeilen)

Datei	Zeilen	Inhalt
phase1_scenario_recognition.md	~400	5-Schritt Decision-Logik, Szenario-Matrix
phase2_refa_analysis.md	~290	REFA-Zeitarten, Mapping CC09/CC10→REFA, t_MN-Subtypen, Kennzahlen (η/q_s/q_E/E_Pick), Richtwerte
phase3_mtm_analysis.md	~250	MTM-1 Codes, TMU-Werte, DaRa-Mapping
phase4_bpmn_validation.md	~500	FSM, korrigiertes CC09→CC10, Tool/Location

REFERENZ-DATEIEN (8 Dateien, ~4.100 Zeilen)

Datei	Zeilen	Inhalt
reference_labels.md	~850	Alle 207 Labels, 12 Kategorien
reference_bpmn_flows.md	~230	Detailed Flows A2–A7 aus BPMN
reference_validation_rules.md	~200	Master-Slave, Kombinationsregeln
reference_chunking.md	~950	Chunking-System, T1-T13 Trigger, Multi-Order
reference_activation_rules.md	~470	Min/Max-Kardinalität, Validierungscode
reference_warehouse.md	~130	Lagerlayout, Zonen, Regalsystem
reference_articles.md	~110	74 Artikel, 3 Orders, Gewichtsklassen
reference_dataset.md	~140	Probanden, Sessions, Datenstruktur

TEMPLATES (2 Dateien, ~400 Zeilen)

Datei	Zeilen	Inhalt
templates/scenario_report.md	~200	Szenario-Report-Vorlage
templates/bpmn_report.md	~200	BPMN-Validierungs-Report-Vorlage

Gesamt: 15 Dateien, ~5.500 Zeilen

Änderungen v5.0 → v6.0

Kritische Fehlerkorrekturen

V-B3 CC09→CC10 Mapping komplett korrigiert — V-B3 in v5.0 hatte
6/8 Phasen falsch. CL120 verwies auf CL154 (Unknown) statt CL138
(Placing Items on Rack). Neues Mapping basiert ausschließlich auf
BPMN Figures A2–A7.
Deprecated v2.7 Scoring entfernt — Evidence-Based Scoring
(Score_Retrieval/Score_Storage) komplett gelöscht. Nur v3.0
5-Schritt-Logik bleibt.
Encoding repariert — Alle Dateien in sauberem UTF-8. Keine
Mojibake (ä→Ã¤) mehr.
Falsche Label-Beschreibungen korrigiert — MTM-Beispiel (5 falsche
Labels), category_activation CC01/CC02 Beschreibungen.

Strukturelle Verbesserungen

23 → 15 Dateien konsolidiert (−35%)
~9.600 → ~5.500 Zeilen reduziert (−43%)
Max. Dateigröße: ~950 Zeilen (vorher: 1.623)
Phasen-basierte Struktur statt domänen-basiert
Chunking-System & Aktivierungsregeln bereinigt ergänzt (v6.1)

Version: 6.1.4
Release-Datum: 2026-03-05
Status: Finalisiert ✅
Changelog: Siehe CHANGELOG.md

dara-dataset-expert

Install

DaRa Dataset Expert Skill — Version 6.1

Zweck

Scope — Wann diesen Skill nutzen

✅ Verwende diesen Skill für

❌ Nutze diesen Skill NICHT für

Datensatz-Kurzprofil

4-Phasen-Analyse-Pipeline

NAVIGATIONSLOGIK — Welche Datei für welche Frage?

Schritt 1: Identifiziere die Phase oder den Fragetyp

Schritt 2: Präzise antworten

Schritt 3: Halluzinations-Schutz

Terminologie-Standard

Dateiübersicht v6.1

PHASE-DATEIEN (4 Dateien, ~1.600 Zeilen)

REFERENZ-DATEIEN (8 Dateien, ~4.100 Zeilen)

TEMPLATES (2 Dateien, ~400 Zeilen)

Änderungen v5.0 → v6.0

Kritische Fehlerkorrekturen

Strukturelle Verbesserungen

Categories

Install

Recommended Skills