🔴 PI Dashboard v2.2 (Stand: 2026-03-26)
Letzte Aktualisierung: —
🟢 CulturaX RESTARTED (26.03.) — v2-Script: Retry+Backoff, Anti-Rate-Limiting. 53/167 Sprachen (3.9 TB) + 15 Sprachen nachladen.
🟢 FineWeb-2 RESTARTED (26.03.) — v2-Script: Auth-Bug gefixt, Timeout 120s→1800s. deu_Latn laeuft (~5 MB/s, 181 Dateien je ~4.8 GB).
🟢 EUR-Lex RESTARTED (26.03.) — v2-Script: SPARQL+curl, Retry. CELEX-IDs werden gesammelt (~2.500/Jahr, 2000-2026).
🔴 V100 Server OFFLINE — Nicht erreichbar via Tailscale. Training/Enrichment blockiert.
✅ NAS = Einziger Speicher — 7.7 GB PI-Daten, Regel in CLAUDE.md verankert.
🔥 BT Website-Scraper blockiert — 105 MdBs unvollstaendig (84%). Bot-Detection aktiv.
🔴 Social Media: 0% produktiv — D9 nicht implementiert.
Übersicht
Downloads
Parlamente (8)
Roadmap (27+)
Bundestag
EU
Andere
D11
NAS
🔍 Health
Kernstatistiken
7.7 GB
Parliament Data (NAS)
3.9 TB
CulturaX (53/167 — FAILED)
136 TB frei
NAS (5.5 TB belegt)
Große Downloads
Download Größe Progress Speed ETA
CulturaX (167 Sprachen) ~12 TB 🟢 RUNNING (v2) ~2-3 Monate
FineWeb-2 (7 Sprachen) ~6 TB 🟢 RUNNING (v2, ~5 MB/s) ~3-4 Monate
EUR-Lex (DE/EN/FR) 50-100 GB 🟢 RUNNING (v2, SPARQL) ~2-4 Wochen
Wikipedia 72 GB — ✓ Fertig
Wikidata 92 GB — ✓ Fertig
27+ Parliaments Roadmap
Cluster 1: Westminster (Q2 2026)
🇨🇦 CA House of Commons
API: ✅ JA | Leicht
🇦🇺 AU Parliament
API: ✅ JA | Leicht
🇳🇿 NZ Parliament
API: ✅ JA | Leicht
🇮🇳 IN Lok Sabha
API: 🟡 TEILWEISE | Mittel
Cluster 2: Continental (Q2/Q3 2026)
🇳🇱 NL Tweede Kamer
API: 🟡 TEILWEISE | Mittel
🇵🇱 PL Sejm
API: ✅ JA | Mittel
🇪🇸 ES Cortes
API: 🟡 TEILWEISE | Mittel
🇮🇹 IT Camera
API: ❌ BEGRENZT | Schwer
🇦🇹 AT Nationalrat
API: 🟡 TEILWEISE | Leicht-Mittel
🇨🇭 CH Bundesversammlung
API: 🟡 TEILWEISE | Leicht-Mittel
Cluster 4: Presidential (Q3/Q4 2026)
🇧🇷 BR Câmara
API: ✅ JA | Leicht
🇲🇽 MX Cámara
API: ❌ BEGRENZT | Mittel
🇰🇷 KR National Assembly
API: 🟡 TEILWEISE | Mittel
Cluster 5: Hybrid (Q4 2026 - Q1 2027)
🇹🇷 TR TBMM
API: ❌ BEGRENZT | Mittel | ⚠️ Risiko
🇿🇦 ZA Parliament
API: 🟡 TEILWEISE | Mittel
Cluster 6: Authoritarian (Q1 2027+)
🇷🇺 RU Duma
API: ❌ NEIN | Sehr schwer | 🔴 RISIKO
🇮🇷 IR Majlis
API: ❌ NEIN | Sehr schwer | 🔴 RISIKO
🇸🇦 SA Shura Council
API: ❌ NEIN | Schwer | ⚠️ RISIKO
Cluster 7: Supranational
🇺🇳 UN General Assembly
API: ✅ JA | Mittel | 6 Sprachen
🇩🇪 Bundestag Details
D Status Quelle Notizen
D1 ✅ 100% DIP API Vollständig
D2 ✅ 100% DIP API 208k Votes
D3 75% Hansard 2013-2024
D4 ✅ 100% DIP Mit Amendments
D5 ✅ 100% DIP Alle Ausschüsse
D6 75% eDIP Ab 2005
D7 ✅ 100% Offenleg. OCR'd
D8 75% Scraper 544/649
D9 0% — Nicht impl.
D10 50% BT.de Metadaten
D11 0% — Planung
D12 50% Wiki Partiell
🇪🇺 EU Parlament Details
D Status Quelle Notes
D1 ✅ 100% ODAB 754 MEPs
D2 ✅ 100% ODAB 9M Votes
D3 75% EUR-Lex Bis 2020
D4 75% EUR-Lex Partiell
D5 ✅ 100% ODAB Alle
D6 50% EUR-Lex Teilw.
D7 75% Reg. Dekl.
D8 50% Scraper Bot 30%
D9 0% — Nicht
D10 75% EBS Videos
D11 0% — Plan
D12 75% Wiki Parteien
Andere Parlamente
Parlament Size Votes Web Social Issues
🇺🇸 US Congress 538 329k 75% 0% Social
🇬🇧 UK Commons 650 12.8k 100% 0% Hansard
🇫🇷 FR Assemblée 578 936k 50% 0% JO
🇮🇱 IL Knesset 139 0 25% 0% API Down
🇯🇵 JP Kokkai ~1400 0 50% 0% Scan
🇨🇳 CN NPC 2991 9 0% 0% Minimal
D11 Psychologisches Profil
D11 Synthese aus D1-D10. Fraktionsdisziplin, Rebel-Score, Domain-Tags, Rhetorik, Drift, Predictability. STATUS: 0/8 Parlamente (0%)
D11-Metriken
Fraktionsdisziplin — 90-100% Soldat, 50-70% Unabhängig, <50% Rebell
Rebel-Score — Inverse: Loyal 0-10%, Moderate 10-30%, Strong >30%
Domain-Spezialisierung — NLP aus D3/D6/D4: Wirtschaft, Soziales, Sicherheit, Klima
Rhetorik-Profil — Sentiment, Framing, Komplexität. vs Fraktionsmittelwert
Gesinnungs-Drift — Zeitliche Analyse: Positions-Veränderung Jahre
Predictability-Score — Konsistenz: nächste Abstimmung vorhersagen? 0-100%
Interessenskonflikte (D7) — D7 vs D2: Korrelation Abstimmung + Nebeneinkünfte
Kompetenz-Alignment — Fachausschuss konsistent abstimmen?
Status
BLOCKIERT: D11-Algorithmus nicht implementiert. Abhängig: (1) D3-NLP, (2) D2-Zeitreihen, (3) D7-Konflikte, (4) ML-Predictability. Aufwand: 40-60h.
NAS-Speicher: Zentraler Datenspeicher
NAS ist EINZIGER Speicherort fuer PI-Daten. Keine lokale Speicherung auf MacBook/iCloud.
NAS-Bestand (Verifiziert 2026-03-26 19:00)
Parlament Groesse Members Status
DE Bundestag 1.8 GB 636 MdBs ✅ NAS
EU EP 3.0 GB 746 MEPs ✅ NAS
FR Assemblee 1.7 GB 578 Deputes ✅ NAS
JP Kokkai 527 MB — ✅ NAS
US Congress 423 MB 539 Members ✅ NAS
UK Commons 317 MB 651 MPs ✅ NAS
CN NPC 4.5 MB 14 🔄 Minimal
IL Knesset 592 KB 139 🔄 Minimal
Gesamt: 7.7 GB | 181.552 Dateien | NAS 136 TB frei
Regel (ab 2026-03-26)
ALLE PI-Daten, Downloads, Korpora → NAS (nas-ai-data, 100.125.222.69)
Ziel: /volume1/data/ml-training-data/politics/
Struktur: parliaments/{land}/{parlament}/{raw|structured|enriched}/
MacBook/iCloud: NUR Obsidian-Vault (Brain). KEINE PI-Rohdaten.
Scraper schreiben direkt auf NAS via Tailscale/SSH.
Offene Punkte
Schritt Status
NAS-Zielstruktur angelegt (8 Parlamente) ✅ Erledigt
PI-Daten auf NAS (7.7 GB, 181k Dateien) ✅ Migriert
Scraper auf NAS-Output umstellen ⏳ Offen
MacBook PI-Daten loeschen (iCloud freigeben) ⏳ Pruefen
MongoDB auf NAS (Docker) ⏳ Geplant
⚙️ Health Monitor
Status wird alle 15 Min. aktualisiert (NAS → politikerportal.de). Letzte Pruefung: —
Prozess-Status
CulturaX ⏳ Warte auf Daten
—
FineWeb-2 ⏳ Warte auf Daten
—
EUR-Lex ⏳ Warte auf Daten
—
Master Runner ⏳ Warte auf Daten
Taeglich 03:00
📊 Tages-Download-Volumen
Tag Volumen Dateien Bewertung
Heute — — —
Gestern — — —
Vorgestern — — —
Warte auf Daten...
NAS Health
Metrik Wert Status
Kapazitaet 142 TB RAID-6 ✅ OK
Belegt — ✅ OK
Frei — ✅ OK