Fake news poznáme i podle toho, kdo je lajkuje a komentuje, říká vývojář

13. února 2021 11:48

Známá byla na testech, nevydržela čekat ve frontě a šla domů, přesto dostala na mobil zprávu, že je pozitivní na koronavirus...Tak zní dnes snad nejrozšířenější falešná zpráva na sociálních sítích. Systém brněnské firmy Cogniware analyzuje zprávy na sociálních sítích a upozorní na ty, které mohou být dezinformací.

Zvětšit fotografii

Obchodní ředitel firmy Cogniware, jež loni zaujala technologií týkající se fotografií. Čeští policisté dostali program, který v necelé sekundě porovná fotografii s databází, kde jsou miliony snímků, a ušetří jim mnohahodinovou rutinní práci. | foto: Anna Vavríková, MAFRA

Takzvané fake news umí odhalit umělá inteligence z dílny vývojářů české firmy Cogniware se sídlem i v Brně. Jak, to líčí její obchodní ředitel Walter Pavliš.

Říkáte, že jste vyrobili kladivo na fake news. Díky vám se dá tedy většina dezinformací rozbít?
Jde o systém, jehož úkolem je analyzovat sociální sítě a zprávy tam uvedené. A oskórovat je, nakolik může jít o dezinformaci. Systém má samozřejmě nějaká omezení a úskalí spočívající v tom, že ne každá dezinformace je odhalitelná. Ale lze jej naučit pro určitou oblast – třeba kulturní, sociální, zdravotnickou. Pracuje na principu umělé inteligence za využití takzvaných neuronových sítí, což znamená, že systém naučíte, jak fake news vypadají, jaký mají zhruba obsah, jak na ně reagují přispěvatelé na sítích a systém podle vašich parametrů zprávu ohodnotí nějakým skóre, třeba že jde ze 70 procent o dezinformaci, a informuje uživatele. Tím je nějaká státní organizace, nikoli běžný uživatel. Řekne: pozor, tuto zprávu by bylo dobré ověřit, protože má parametry dezinformace.

Existují i falešná videa „známých osobností“, kdy ale reálně mluví někdo jiný. Váš software to umí odhalit zkoumáním hlasu nebo tváře. Jak to funguje? Je pravda, že hlas je jako otisk prstu?
Hlas je skutečně poměrně unikátní a s 99procentní pravděpodobností jsme schopni říct, jestli hlas v nějakém videu patří řečníkovi, za kterého je vydáván. I imitátor se tomu docela přiblíží, ale systém neošálí. Pro vytvoření otisku hlasu potřebujeme zhruba dvacetisekundovou nahrávku. Velice podobně to funguje i u obličejů. Jsme schopni je strojově porovnávat a vysledovat, jestli patří tomu, za koho je řečník vydáván. Dost často dezinformace využívají i už nějaké existující fotografie, třeba jen výřez. A na našem systému je, aby rozpoznal, jestli nejde o zmanipulovaný obrázek, který někdo upravoval.

Co dalšího dokážete analyzovat?
Nejčastěji je to obsah zprávy, přesněji to, jak vypadá, jaké má prvky. Často šířené dezinformace jsou ve formě krátké textové zprávy s obrázkem. A tam je to složitější. Nicméně v tom právě spočívá kouzlo našeho systému, že dokáže rozpoznávat specifické prvky. Nemůžu uvést všechny, ale například to, jak je napsána – jestli dostatečně bombasticky, s kapitálkami, vykřičníky… Druhou oblastí je, jakým způsobem se zpráva šíří, sociální interakce. Kdo ji lajkuje, přeposílá, na jakých webech se objevuje, jaké jsou k ní komentáře.

A jak se to ten systém naučí detekovat?
Vezmete poměrně velké množství zpráv, pravdivých i dezinformací, takzvaný dataset, který pak podsouváte výpočetnímu stroji a označujete – toto je a toto není dezinformace. Neuronová síť se postupně učí rozpoznávat, jak dezinformace vypadají. Když jich systému podsunete tisíce, tak to postupně začne umět. To máte, jako když malé dítě učíte rozlišit psa a kočku. Když je spatří poprvé, samozřejmě si je bude plést. Ale když uvidí sto psů, tak už ne. Samozřejmě hrají roli docela velké kulturní odlišnosti, jinak systém bude fungovat v Asii, jinak v Evropě a na Středním východě. Ať už z jazykového pohledu, nebo toho, na jaký způsob komunikace jsou tamní lidé zvyklí.

Software umí v současnosti fungovat v češtině, angličtině a arabštině?
V arabštině a angličtině. Pro české prostředí ho nemáme natrénován, ale gros systému je hotovo, a stejně tak, jako musíme natrénovat pro různé oblasti, tak bychom natrénovali i pro naše kulturní prostředí. Ale ono to nikdy neskončí tím, že jako tvůrci budeme mít hotovo, je třeba neustále aktualizovat. Útočníci jsou vždycky kreativnější. Vymýšlejí nové a nové způsoby a je to věčný boj mezi těmi, kdo se snaží tyto zprávy šířit a kdo rozpoznávat. Náš systém je něco jako antivir, kdy stahujete aktuální databázi virů, které existují, tak my hledáme aktuální typy dezinformací.

Systém není pro jednotlivce, takže jej využívají státní složky?
Přesně tak. Buď silové složky, které mají za úkol bránit sociální prostor před šířením nebezpečných informací, jež vedou k panice nebo šíření poplašené zprávy. Ty pak dál upozorňují zpravodajské servery. Pokud nasadíte stroj, je rychlejší a generuje skóre zpráv rychleji než člověk a činí tak v okamžiku, kdy se zpráva objeví, ne až když je všude rozšířená.

Je vaším cílem rozklíčovat, kdo konkrétně dezinformaci produkuje a vypouští?
Naším cílem není hledat útočníka. Ale to, kdo informaci šíří, je pro nás poměrně podstatné pro to, abychom zprávu mohli předem označit za nebezpečnou. Protože samozřejmě jsou známy servery, které se živí šířením těchto informací, a pak už je předpoklad, že se na nich dezinformace může vyskytnout. Takže je to jedno z vodítek.

Dá se říct, jakou máte v odhalování fake news úspěšnost?
To je závislé na tom, o jaké oblasti se bavíme. Když jde o politickou zprávu nebo třeba ohledně covidu, tak máme úspěšnost kolem 70–80 procent. Ale je to hrozně odvislé od toho, jak je dezinformace chytře napsaná. Některé jsou jasný podfuk, jiné mohou být na hraně – pisatel píše část pravdy, ale vyvozuje z ní nepravdivý úsudek. A jiné jsou neověřitelné, nedohledatelné.

Jak se na dezinformace díváte, jakou mají míru nebezpečnosti? Jsou hrozbou jako třeba terorismus?
Je to poměrně nebezpečná věc, která se stále ještě nedoceňuje. Drtivá většina vyspělého světa visí na sociálních sítích a čerpá z nich informace. A pokud budete dennodenně nasávat nejrůznější hlouposti a lži, utvoříte si nepravdivý obrázek o svém okolí a světě. Propaganda je postavená na tom, že se stokrát opakovaná lež stává pravdou. Když nějakou lež uvidíte neustále na sítích a nikdo vás neupozorní, že to lež je, tak jí začnete věřit. A když jí uvěří velké množství lidí, má to dopady i do běžného života – podle toho lidé volí, reagují, nakupují, nechávají se očkovat a testovat. Dopady mohou být fatální, i když míra se těžko odhaduje.

Osobně vnímám jako problém, že i když je dezinformace odhalena, tak k těm, kteří ji sdíleli, se tato informace často nedostane. Je něčí role, upozorňovat na to?
Můj názor je, že by mohla existovat nezávislá organizace – typově Transparency International nebo třeba Národní úřad pro kybernetickou bezpečnost nebo ministerstvo obrany – která se bude snažit o označení dezinformace. Aby běžný uživatel u zprávy viděl fajfku – ověřeno. Nebo naopak červený křížek – pozor, dezinformace, nevěnujte jí pozornost. Neříkám, že to situaci zachrání, ale je to asi jediný nástroj, aby lidé nehltali zprávy zjevně zavádějícího charakteru a podle nich reagovali.

Jsou čeští uživatelé sociálních sítí schopní rozlišovat, co je a co není fakt?
Z mého pohledu vůbec. (smích) Když se podívám na některé komentáře zpravodajských webů, tak to je příšerné... Nemyslím, že si u nás lidé ověřují zdroj informací, jestli, co je napsané, je pravda. Na to nemají čas a chuť. Ráno si otevřou nějaký zpravodajský web, přečtou si headline, kouknou se na fotky a vezmou to jako fakt. Pokud by třeba existovala skupina, která by cíleně měla za úkol vypustit nějakou informaci, jež by změnila náhled velké části populace třeba na nějakou politickou stranu, tak je to téměř nezastavitelné. Okamžitě se to rozšíří, s odstupem dní nemáte šanci říct, tohle byla hloupost. To musíte udělat v tu dobu, online.

Je pravda, že váš systém může pomáhat i policejním vyšetřovatelům?
Co se systému pro fake news týče, používají jen určitou část, která slouží k analýze sociálních sítí, kdo s kým komunikuje, co si píše. Ale my především vyrábíme systémy pro analýzu důkazů, které z velkého množství zdrojů, komentářů, textovek, hovorů… hledají souvislosti, jež pomáhají vyšetřovatelům zanalyzovat případ. Používá je hodně Střední východ, na českém trhu teprve systém začínáme nabízet. I software pro fake news aktuálně nabízíme v Evropě a v České republice.

Jsou tyto nástroje pro budoucnost nezbytné?
S tím, jak roste podíl sociálních sítí na informovanosti lidí, se bez nich neobejdeme. Je třeba prevence, ne restrikce. Tedy ne zpětně někoho odhalovat za šíření propagandistických a klamavých informací, zakazovat weby a blokovat, to nikdy fungovat nebude. Útočníci si vždycky najdou cestu, jak informace mezi nás poslat. Některé dezinformační kampaně jsou dnes generovány strojově, což je zajímavé z filozoficko-technologického pohledu, protože v zásadě bojují stroj proti stroji. A do budoucna to bude čím dál víc používaný model, jak šířit nějaké zprávy.

Lidé jsou na psaní příliš drazí. A softwary dnes nejen že vyrobějí fake news na špičkové úrovni, ale dokážou jimi i zahltit svět.
Neuronová síť se učí rozpoznávat, jak dezinformace vypadají. Když jich systému podsunete tisíce, postupně to začne umět.

Autor: Markéta Dušková

Vstoupit do diskuse

zpět na článek

Fake news poznáme i podle toho, kdo je lajkuje a komentuje, říká vývojář

Odkaz na článek