© 2026 Iniciativa pro efektivní zdravotnictví
Tento stav není nutně výsledkem špatné vůle ani nedostatku odbornosti. Je výsledkem absence systémového rámce - institucí, právních nástrojů, technické infrastruktury a společné filozofie pro sdílení dat - které by zodpovědné sdílení dat pro výzkumné účely umožňovaly ve velkém měřítku a s důvěrou veřejnosti. Austrálie tento problém systematicky řeší od 70. let minulého století a dnes provozuje jeden z nejpropracovanějších systémů propojování individuálních zdravotních a sociálních dat pro výzkumné účely na světě.
Níže shrnuji genezi tohoto systému, jeho klíčové principy a to, co z australské zkušenosti plyne pro český kontext.

Australský příběh začíná v roce 1977 v Perthu, kde profesorka Fiona Stanley a její kolegové začali systematicky propojovat záznamy o matkách, novorozencích, hospitalizacích a mortalitě, aby pochopili etiologii vývojových vad u dětí. Tento zdánlivě technický počin měl dalekosáhlé vědecké důsledky: výzkum Stanleyové a jejího týmu přispěl k prokázání příčinné role deficitu kyseliny listové v etiologii defektů neurální trubice, což se stalo jedním z nejvýznamnějších zjištění 20. století a vedlo k zavedení povinné fortifikace potravin kyselinou listovou v řadě zemí.
Klíčovým poučením však není samotný vědecký výsledek, ale podmínky, za nichž bylo dosaženo. Data existovala - v různých registrech, u různých správců, v různých formátech. Bylo je však třeba propojit. A k tomu bylo zapotřebí výzkumníků, kteří chápali jejich analytický potenciál, měli trpělivost vyjednávat přístup, a zároveň dovednosti infrastrukturu vybudovat. Stanleyová a kolegové strávili přibližně dvě dekády budováním důvěry uvnitř státní správy, publikováním důkazů o hodnotě propojených dat a prosazováním legislativních změn.
V roce 1994 získali jejich kolegové grant, díky kterému vznikl první formální systém pro propojování dat v rámci Ministerstva zdravotnictví v Západní Austrálii. Western Australian Data Linkage System (WADLS) byl spuštěn v roce 1995 a dodnes propojuje více než 30 datových souborů pokrývajících populaci 3,7 milionu lidí za posledních čtyřicet let. Šlo o první příklad populačně reprezentativního, mezirezortního propojování zdravotních a demografických dat v Austrálii.
Australská zkušenost jednoznačně ukazuje, že systémová změna v oblasti datové infrastruktury nevzniká politickým rozhodnutím shora. Vzniká kombinací vědeckých výsledků, které demonstrují hodnotu propojených dat, a institucionální trpělivosti výzkumníků a úředníků, kteří jsou ochotni systém postupně budovat.
Australský federální systém přinesl v oblasti datového propojování specifickou výzvu: zdravotní péče je financována federálně — prostřednictvím systému Medicare Benefits Schedule (MBS) pro hrazené výkony a Pharmaceutical Benefits Scheme (PBS) pro léky — ale primárně poskytována na úrovni jednotlivých států a teritorií, které si spravují vlastní nemocniční a registrační systémy. Pro komplexní analýzu zdravotních trajektorií bylo nezbytné tyto vrstvy propojit.
Australská vláda zařadila datové propojování do Národního strategického plánu pro výzkumnou infrastrukturu (NCRIS) v roce 2006. Po třech letech technických konzultací, jednání s jurisdikcemi a přípravy governance rámce vznikla v roce 2009 Population Health Research Network (PHRN) — celoaustrálská síť datových propojovacích jednotek v každém státě a teritoriu, koordinovaná Univerzitou Západní Austrálie. PHRN vyvinula standardizovaný systém pro propojování záznamů (record linkage) s jednotnou metodologií, harmonizovanými přístupovými procesy a sdílenou online aplikační platformou, která výzkumníkům umožňuje podat jednu žádost pro více jurisdikcí. Financování z NCRIS přesáhlo v průběhu let 60–80 milionů AUD; v posledním cyklu obdržela PHRN 26,4 milionu AUD na roky 2023–2028 a dalších 10,24 milionu AUD na rozvoj nových služeb pro klinický výzkum.
Souběžně s tím Australský statistický úřad (ABS) budoval integrovaná datová aktiva kombinující zdravotní data, daňové záznamy, data o sociálních dávkách a výsledky sčítání lidu na úrovni jednotlivce. Projekt začal v roce 2015 z iniciativy skupiny středně postavených úředníků ze čtyř federálních agentur, kteří identifikovali příležitost propojit dosud oddělené administrativní záznamy do koherentního analytického aktiva. Projekt byl pojmenován MADIP (Multi-Agency Data Integration Project) a postupem let - po přijetí přísnějších standardů ochrany soukromí, opakovaných Privacy Impact Assessments a rozšiřování datové základny - přerostl v dnešní PLIDA (Person Level Integrated Data Asset). PLIDA kombinuje záznamy o zdravotní péči (MBS, PBS, AIR), vzdělání, daních z příjmu, sociálních dávkách a sčítání lidu a umožňuje longitudinální analýzu zdravotních a sociálních trajektorií na úrovni celé populace. V dubnu 2024 pracovalo na schválených projektech přes 1 700 analytiků napříč vědeckou komunitou v Austrálii.
Zásadní změna politického statutu datové integrace přišla v roce 2017. Data Integration Partnership for Australia (DIPA) představovala tříletou vládní investici ve výši 130,8 milionu AUD, sdružující přes 20 federálních agentur pod koordinací Ministerstva financí a Australského statistického úřadu. Investice nebyla zaměřena výhradně na technologickou infrastrukturu, ale šla primárně na vybudování kapacit: proškolení analytiků a datových správců ve státní správě, rozvoj governance procesů a interních standardů pro datovou integraci, rozšíření PLIDA o nové datové zdroje a modernizaci ABS DataLabu jako centrálního zabezpečeného analytického prostředí.
DIPA zásadně změnila kulturní vnímání datové integrace v australské veřejné správě: přestala být akademickým projektem s nejistým financováním a stala se standardní součástí analytické práce federálních ministerstev. Seniorní úředníci, kteří do té doby přistupovali ke sdílení dat opatrně, získali institucionální rámec a právní jistotu, která spolupráci umožňovala. Přes dvacet agentur začalo aktivně přispívat daty, sdílet metodologie a koordinovat analytické výstupy.
Pandemie COVID-19 pak představovala čtvrtou a dosud nejintenzivnější fázi rozvoje systému. V dubnu 2022 federální Medical Research Future Fund podpořil Australian Institute of Health and Welfare (agenturu australské vlády podobnou ÚZIS) k vybudování Národní zdravotní datové platformy (National Health Data Hub), která integrovala klíčové zdravotní datové soubory do koherentního propojovacího systému pro potřeby výzkumu v době pandemie. Propojení dat o vakcinaci (AIR), hospitalizacích a mortalitě v domovech pro seniory bylo možné realizovat v řádu týdnů - nikoli let - právě proto, že rámce pro governance, datové standardy, linkage metodologie a zabezpečená analytická prostředí již existovala. COVID-19 demonstroval hodnotu předchozích investic způsobem, který byl politicky bezprecedentní: schopnost rychlé odpovědi na novou krizi ve veřejném zdraví se stala přímou funkcí kvality datové infrastruktury.
Celkový odhad přímých veřejných investic do datové linkage infrastruktury se za čtvrt století pohybuje mezi 400 a 600 miliony AUD, přičemž průměrná roční investice dosahuje 15–25 milionů AUD (tedy jen asi 1–2 AUD na obyvatele ročně). Tento odhad zahrnuje podporu a rozvoj National Collaborative Research Infrastructure Strategy (NCRIS) a Population Health Research Network (PHRN), investici do Data Integration Partnership for Australia (DIPA), provozní náklady AIHW Data Integration Services Centre a rozvoj ABS DataLabu, nezahrnuje však spolufinancování ze strany států a teritorií ani investice do příbuzné infrastruktury (biobanky, klinické registry).
Ekonomické hodnocení návratnosti těchto investic nebylo provedeno v úplnosti, ale dílčí analýzy konzistentně naznačují velmi příznivý poměr nákladů a přínosů: výzkum generovaný propojenými daty vedl k politickým změnám v oblasti prenatální péče, onkologického screeningu, managementu chronických onemocnění a pandemické připravenosti, jejichž hodnota v zdravotních přínosech a úsporách přesahuje investici o několik řádů.
Filosofickým jádrem australského systému není technologie ani legislativa, ale specifická architektura přístupu k datům, která elegantně řeší zdánlivě neslučitelné požadavky: maximální analytická hodnota dat na straně jedné a ochrana soukromí subjektů na straně druhé.
Výzkumníci neobdrží datový soubor k vlastní analýze. Namísto toho jim je umožněn vzdálený přístup do tzv. Trusted Research Environment (TRE): zabezpečeného virtuálního analytického prostředí provozovaného správcem dat. Data v žádné fázi neopouštějí infrastrukturu správce. Výzkumník se přihlásí přes virtuální desktop, pracuje s daty v analytickém prostředí (R, Stata, SAS, Python), ale nemůže data zkopírovat, stáhnout, exportovat, vytisknout ani pořídit snímek obrazovky. Přístup k internetu z prostředí TRE je zakázán nebo přísně omezen, USB porty jsou deaktivovány. Fyzický přístup na pracoviště správce dat je alternativou pro nejcitlivější projekty.
To, co TRE opouští jako výstup, jsou výhradně agregované analytické výsledky: statistické tabulky, regresní koeficienty, grafické výstupy (a ani tyto ne automaticky). Každý výstup prochází kontrolou souladu s pravidly statistické ochrany dat před tím, než smí prostředí opustit. Standardní pravidla zahrnují: minimální velikost statistické buňky (zpravidla 5 nebo 10 osob), zaokrouhlování absolutních počtů, zákaz exportu jakýchkoli individuálních záznamů, tzv. komplementární potlačení sousedních buněk (aby zpětným výpočtem nebylo možné odvodit potlačenou hodnotu), kontrolu grafů a modelových výstupů z hlediska potenciální re-identifikace. V australských zařízeních tuto kontrolu provádí buď specializovaní pracovníci správce dat, nebo automatizované nástroje jako Acro nebo sdcMicro, které identifikují potenciálně problematické výstupy před lidskou kontrolou.
Analytická hodnota tohoto modelu spočívá v tom, co umožňuje: přístup k velmi podrobným, ostrým (ale pseudonymizovaným), propojeným individuálním datům, která by za jiných okolností musela být před zpřístupněním výrazně agregována nebo anonymizována, s nevyhnutelnou ztrátou analytické hodnoty. Právě proto, že je prostředí přísně kontrolované a výzkumníci jsou identifikováni, proškoleni a smluvně vázáni, mohou být data uvnitř TRE velmi granulární. Ochrana soukromí se přesouvá z datové anonymizace na ochranu procesů, prostředí a výstupů. To je konceptuální posun, který australský systém odlišuje od přístupů založených na anonymizovaných datových výpisech, jak se tomu děje zatím v ČR.
Governance celého systému je organizována kolem rámce Five Safes, který vznikl v roce 2003 na britském Národním statistickém úřadu (ONS) a postupně se rozšířil do statistických úřadů a výzkumných institucí na celém světě. V Austrálii byl rámec adoptován ABS v roce 2015 jako organizační princip redesignu celé strategie datového přístupu a zakotven do federálního zákona v roce 2022 pod názvem Pět principů sdílení dat (Five Data Sharing Principles). Dnes ho využívají také NHS Digital, Health Data Research UK, Eurostat, Statistics New Zealand, Statistics Canada a řada dalších institucí.
Rámec strukturuje hodnocení každé žádosti o přístup k datům do pěti vzájemně provázaných dimenzí:
Klíčová analytická vlastnost rámce spočívá v tom, že tyto dimenze nejsou nezávislé. Přísnější kontroly v jedné dimenzi umožňují méně restriktivní přístup v jiné. TRE jako přísně kontrolované prostředí dovoluje práci s velmi podrobnými daty. Akreditovaní výzkumníci s prokazatelnou odborností mohou získat přístup k datovým zdrojům, ke kterým by neakreditovaní žadatelé přístup neobdrželi. Rámec tak nenabízí binární odpověď „přístup ano / přístup ne", ale umožňuje kalibraci podmínek přístupu na základě komplexního posouzení rizik, čímž maximalizuje analytickou hodnotu dat při zachování přiměřené ochrany soukromí.
Technologická sofistikovanost a finanční investice by australský systém samy o sobě nevybudovaly. Klíčovým předpokladem byly konkrétní právní změny, jež vytvořily zákonný rámec pro sekundární využití zdravotních a správních dat.
Centrálním prvkem australského právního řešení jsou sekce 95 a 95A tzv. Privacy Act z roku 1988, které vytvořily regulovanou výjimku z požadavku individuálního souhlasu pro zdravotní výzkum ve veřejném zájmu. Podmínkou aplikace výjimky je schválení výzkumného záměru etickou komisí (Human Research Ethics Committee, HREC), která musí posoudit a doložit, že veřejný zájem výzkumu podstatně převažuje zájem na ochraně soukromí dotčených osob. Tento mechanismus je zásadní: bez zákonné výjimky by rozsáhlé populační studie pracující s administrativními daty bez kontaktu s pacienty nebyly právně proveditelné. National Health and Medical Research Council (NHMRC) vydal na základě těchto ustanovení závazné guidelines, jež konkretizují podmínky, za nichž HRECs mohou takový souhlas udělit.
Tato zákonná výjimka sama o sobě nestačila. Bylo nutné zajistit, aby etické komise v jednotlivých státech rozuměly specifikům datového propojování a dokázaly výzkumné záměry smysluplně posuzovat. Australané proto investovali do vzdělávání HRECs a postupně zavedli systém vzájemného uznávání etického schválení (mutual acceptance of ethical review) napříč jurisdikcemi, čímž odpadla nutnost opakovaných schvalovacích procesů pro jeden výzkumný projekt v různých státech. Pro výzkumníky to představovalo výrazné snížení administrativní zátěže.
Formální akreditace autorit — AIHW a ABS — jako důvěryhodných třetích stran s mandátem zpracovávat identifikovatelná data jménem výzkumníků vytvořila nezbytnou institucionální odpovědnost: správci dat mohli s jistotou sdílet záznamy vědomí, že jsou v rukou organizace s prokazatelnou governance kapacitou, technickým zabezpečením a regulatorním dohledem.
Vrcholem legislativního vývoje byl Data Availability and Transparency Act 2022 (DAT Act), který kodifikoval desetiletí osvědčených praktik do federálního zákona, formalizoval rámec Five Safes jako zákonné principy sdílení dat, zřídil Úřad národního komisaře pro data (ONDC) jako nezávislého regulátora a vytvořil digitální platformu Dataplace jako jednotné místo pro vyhledávání dat, podávání žádostí a správu dohod o sdílení dat.
Vedle právního rámce a technologie australská zkušenost odhaluje několik institucionálních předpokladů, bez nichž systém nemůže fungovat.
Česká republika má lepší institucionální předpoklady pro vybudování systému sdílení dat napříč rezorty, než je v odborné diskusi běžně uznáváno. ÚZIS jako organizační složka státu zřízená Ministerstvem zdravotnictví disponuje mandátem ke správě Národního zdravotnického informačního systému (NZIS) a jeho datovým potenciálem; MPSV v posledních letech výrazně investovalo do digitalizace a analytické infrastruktury; ČSÚ plní funkci srovnatelnou s ABS v řadě oblastí; a rodné číslo v současnosti plní funkci de facto propojovacího klíče napříč zdravotním, sociálním a daňovým systémem. Podobně můžeme pokračovat v kontextu dat o vzdělávání, placení daní či dopravě v ČR (tato témata ale přenechám jiným k analýze).
Klíčové mezery jsou ale identifikovatelné: absence formálně akreditované integrační autority s explicitním meziresorním mandátem; absence tzv. Trusted Research Environment jako standardního modelu přístupu k individuálním datům pro výzkumné účely; nekonzistentní etický rámec pro výzkum na správních datech; a absence národního datového katalogu, který by výzkumníkům umožnil zjistit, jaká data existují, kde jsou uložena a za jakých podmínek jsou dostupná.
Od roku 2025 je tento deficit rámován explicitním evropským mandátem. Nařízení EU o Evropském prostoru zdravotních dat (EHDS), které vstoupilo v platnost 26. března 2025, ukládá každému členskému státu povinnost do roku 2028–2029 designovat Health Data Access Body (HDAB): orgán odpovědný za přijímání a hodnocení žádostí o sekundární využití zdravotních dat, vydávání datových povolení a provozování zabezpečených analytických prostředí splňujících unijní kybernetické a standardy ochrany soukromí. ÚZIS je přirozeným kandidátem na roli HDAB, přičemž jeho ředitel prof. Ladislav Dušek je v relevantních evropských diskuzích aktivně přítomen. Termín 2028 je při souběžném zahájení příprav dosažitelný.
Z praktického hlediska existují čtyři kroky, které nevyžadují čekání na velkou legislativní změnu.
Další propojení skutečných zdravotních a sociálních dat a jejich zpřístupnění pro výzkumníky v maximální možné míře by přineslo analytické poznatky zásadní pro českou zdravotní politiku: pochopení vztahu mezi sociálními determinanty a zdravotními výsledky, hodnocení efektivity různých modelů chronické, akutní či dlouhodobé péče, identifikace populací s vysokým rizikem zbytečných hospitalizací, sledování nákladové efektivnosti zdravotních intervencí napříč celou populací a mnoho dalšího. Infrastrukturu pro tento výzkum je možné technicky vytvořit.
Otázkou tedy není, zda to lze. Otázkou je, kdo se toho ujme a zda-li k tomu dostane dostatečnou politickou podporu, ale i dostatek zdrojů, zejména těch finančních a lidských.
Další čtení: