OCR a extrakce z dokumentů
Faktury, smlouvy, formuláře → structured JSON přímo do ERP. Vision modely (GPT-4o) zvládnou i ručně vyplněné PDF, tabulky a razítka.
Tahle stránka není sales prezentace. Je to praktický průvodce tím, kdy AI integrace dává smysl, jak technicky funguje, kde má limity a jak ji nasadit auditovatelně. Konkrétní agenti, řízené runy, audit log. Bez slajdů, bez hype.
Šest reálných use case-ů, které dnes ve firmách běží v produkci. Žádné science fiction, žádné „AI vás nahradí“. Jen místa, kde dobře nastavený agent ušetří hodiny rutiny.
Faktury, smlouvy, formuláře → structured JSON přímo do ERP. Vision modely (GPT-4o) zvládnou i ručně vyplněné PDF, tabulky a razítka.
Příchozí dotazy/tikety se automaticky rozřadí podle obsahu (billing, technical, urgent) a přiřadí správnému týmu.
Týdenní digesty, výtahy z dlouhých e-mailů, překlady interní dokumentace. Šetří týmový čas.
Developer agent vyvíjí podle vzoru: testy, migrace, CRUD endpointy. Návrh se ověří přes CI a projde human review.
Interní knowledge base: firemní směrnice, dokumentace, smlouvy. Zaměstnanec se zeptá v češtině, agent odpoví s citací zdroje.
Logy, metriky, alert noise. Agent detekuje vzorce mimo normál a eskaluje on-call týmu se shrnutím kontextu.
Hype říká „všechno“. Realita je skromnější — a přesto velmi užitečná. Vědět, kde jsou hranice, je půlka úspěchu při nasazení.
AI integrace není „napojení na ChatGPT“. Je to 5 oddělených vrstev s jasnými hranicemi. Každá má svou roli, vlastní auth, vlastní observability.
request orchestrátoru.OpenClaw nebo vlastní .NET runtime.architect, developer, debugger, support, data-analysis, document. Každý má jasné vstupy/výstupy.OpenAI (GPT), Anthropic (Claude), NVIDIA NeMo (self-hosted), lokální Ollama. Routing podle role + cena/latence/citlivost dat.tool use protokol — nikdy ne přímo.Rozdíl mezi ad-hoc promptem a řízeným AI procesem je rozdíl mezi hraním a produkcí. Run = jeden konkrétní řízený běh úkolu, který má vstup, pravidla, roli, výstup a auditní stopu.
vstupDefinovaný úkol s přiřazenou rolí (kdo to dělá), zdroji (jaká data může vidět) a cílem (co je očekávaný výstup). Žádné předpoklady.
workspace stateRealita načtená z workspace — soubory, dokumenty, předchozí runy. Jediný zdroj pravdy pro tento run.
guarded executionWhitelistované akce: čtení souborů, volání API, tool use. Žádný root execution, žádný shell access mimo schválený scope.
structuredVýstup uložený do workspace v definovaném formátu (JSON/markdown/PR diff). Dohledatelný, izolovaný od ostatních runů.
observabilityPlná stopa: kdo, co, kdy, jaký model, kolik tokenů, jaký vstup/výstup, kolik to stálo. TISAX/AI Act ready.
chained runRun může spustit další runy (architect → developer → debugger). Každý je samostatný, audit log se zřetězí.
Otevřu chat, napíšu, dostanu odpověď. Žádný audit. Žádná opakovatelnost. Žádné guard rails. Pro průzkum OK, pro produkci selhává.
Definovaný workflow: input → agent → tool use → output → log. Auditovatelný, opakovatelný, testovatelný. Production-ready.
Agenti se nemají míchat. Každý má specifickou roli, vstupy, výstupy a hranice. Univerzální agent neexistuje — specializace funguje líp.
Navrhuje architekturu — varianty, trade-offy, ADR. Nepíše kód, navrhuje řešení.
Píše kód podle architektova návrhu a vzoru existujícího codebase. Vždy s testy.
Analyzuje chybu, hledá root cause, navrhuje fix. Nezasahuje do kódu bez schválení.
Odpovídá na běžné dotazy podle KB, klasifikuje tikety, eskaluje složité případy.
Píše SQL/Python, generuje charty, identifikuje insights. Výstup vždy s ověřeným kódem.
Extrakce, generování reportů, šablonování. OCR pipeline pro faktury, smlouvy, formuláře.
Konkrétní open-source a komerční nástroje. Zvolené tak, aby byly osvědčené, integrovatelné a auditovatelné. Žádné „vlastní AI“, žádné black-box krabice.
GPT-4o vision · multimodal · default volba pro OCR a reasoning.
200k context · code generation · structured output · sweet spot pro většinu úloh.
Self-hosted LLM platforma. Fine-tuning, RAG, guardrails — vše ve vašem cloudu nebo on-prem.
Runtime pro agentní workflow. Řídí runy, role, audit, tool use. Vendor-agnostic abstrakce.
Embeddings & semantic search pro RAG. EU hosted, plně pod kontrolou.
Hlavní backend platforma. Type-safe, výkonná, cloud + on-prem ready. Production proven.
Tool use, streaming, function calling. Glue mezi modelem a business logikou.
Per-run logging: prompt, output, tokens, cost, latency. TISAX/AI Act ready.
Konkrétní open-source a komerční nástroje, které tvoří funkční AI integraci. Žádné „na to máme něco vlastního“.
Self-hosted LLM framework. Použijeme tehdy, když data nesmí opustit firmu (TISAX, citlivá data, EU-only). Nabízí fine-tuning, RAG, guardrails na úrovni infrastruktury — vše ve vašem cloudu nebo on-prem.
Runtime pro agentní workflow. Řídí runy, role, audit, tool use. Standardizovaná abstrakce nad model providery — agent neví, jestli za ním je GPT, Claude nebo NeMo. Routing určuje config.
Managed reasoning modely. GPT-4o pro multimodální (vision + text), Claude Sonnet/Opus pro dlouhý kontext a code generation. Pay-per-token, rychlé, vysoká kvalita.
Qdrant nebo pgvector pro RAG. Embeddings dokumentů, semantic search, citation grounding. EU hosted, plně pod kontrolou.
Knihovny pro tool use, streaming, function calling. LangChain pro Python pipelines, Vercel AI SDK pro Next.js apps.
Audit log každého runu: prompt, output, tokens, cost, latence. Eval pipeline pro regression testing po změně promptu nebo modelu.
Konkrétní typy úloh s jasným ROI. Klikni na kartu pro detail — problém, řešení, přínos a technologie použité v produkci.
AI není kladivo na všechno. Před pilotem si projděte tyhle dva sloupce. Pokud jste převážně v pravém, pilot vás stáhne víc do mínusu než přidá hodnoty.
AI integrace přidává nový vektor — data tečou do externího modelu, agent vykonává akce. Bezpečnost se řeší před nasazením, ne po incidentu.
Anthropic má EU region. Mistral je EU-native. Pro TISAX/citlivá data: self-hosted NeMo nebo Llama na vlastním infra. Žádný transfer mimo EU bez DPA.
Každý run logguje: kdo (user), co (input), kdy (timestamp), který model, kolik tokenů, jaký output. Retence dle data klasifikace. TISAX-ready.
Před odesláním do modelu projede vstup PII detector (rodná čísla, čísla karet, e-maily, jména). Citlivá pole se maskují nebo blokují.
Každý use case se zařadí dle EU AI Act: minimal / limited / high-risk. High-risk vyžaduje human oversight, eval, transparency.
Agent nemá přístup mimo svůj workspace. Žádný root execution. Tool use přes whitelist. Role-based access kontrolovaný runtime, ne promptem.
Uživatelský vstup se izoluje od system promptu. Output validation. Refusal patterns. Eval suite proti známým injection vektorům (Anthropic + OpenAI dělají research).
Realistický plán: 3–6 měsíců od prvního workshopu po první ověřený produkční use case. Bez slibů, bez agresivních deadlinů.
90 minut zdarma. Identifikujeme 2–3 use case kandidáty, vyhodnotíme ROI, data readiness, risk profile. Výstup: prioritní list a next steps.
2–4 týdny. Jeden use case, jeden agent, jeden run flow. Sbíráme baseline data (manual baseline). Definujeme success metrics — jak poznáme, že to funguje.
1–2 měsíce. Implementace agenta, prompt engineering, tool use integration, eval suite. A/B testy, regression eval po změnách.
1 měsíc. Postupné rolling po týmech. Monitoring, fallback na manual flow, on-call rotace. Audit log + cost tracking.
Po prvním ověřeném: další agenti, další use cases. Sdílená runtime, sdílená evaluace, postupně se buduje agentní kapacita firmy.
Bez sci-fi. Konkrétní technologie, které se přesouvají z laboratoře do produkce a ovlivňují implementační rozhodnutí.
Bez tlaku, bez slajdů. Vyberte si podle toho, kde se ve svém AI rozhodování právě nacházíte.
—
—
Ozveme se do 24 hodin. Žádný call-center spam.