Šesť spôsobov, ako získať popis fotky a obrázka

Obrázkom a fotografiám sa dnes na internete nedá vyhnúť. Často sa stáva, že aj plagáty či jedálne lístky, ktoré obsahujú text, sú uložené ako obrázky. Určite ste už zažili, že vám v chatovacej aplikácii pristál obrázok bez popisu. Môžete zavolať vidiaceho asistenta, alebo obrázok ignorovať. Prípadne požiadať odosielateľa o jeho popis. Počas vianočných sviatkov sa dá obsah obrázka ľahko vytušiť. V nasledujúcom texte sa pozriem na to, ako môžeme z obrázka získať nejaké informácie s pomocou počítača alebo mobilného zariadenia. Z obrázka vieme pomocou OCR získať text. Jeho čitateľnosť závisí od toho, aký typ písma je použitý a tiež farba pozadia. Pri niektorých obrázkoch vďaka umelej inteligencii vieme zistiť, či sú na obrázku osoby a či sa nachádzajú v interiéri alebo exteriéri.

Budem predpokladať, že obrázok viete uložiť na disk napríklad vo formáte PNG alebo JPG. Prípadne viete v mobilnej aplikácii vyvolať možnosť zdieľať a obrázok takto odoslať do inej aplikácie. Na rozpoznávanie obrázkov budeme vo väčšine prípadov používať online služby od Googlu a Microsoftu. Obrázky sú odosielané na servery, preto potrebujeme mať aktívne internetové pripojenie. Na vyvolanie kontextovej ponuky použite príslušný kláves na klávesnici, prípadne skratku Shift+F10.

Popisovanie obrázkov v prehliadači Google Chrome

V prehliadači Google Chrome si môžeme zapnúť automatické popisovanie obrázkov. Funkcia je pôvodne určená na to, aby nám prehliadač popísal obrázky na webových stránkach. Môžeme ju ale využiť aj na obrázky, ktoré nám prišli napríklad e-mailom. Zapnutie funkcie je veľmi jednoduché. Po spustení Google Chrome otvoríme kontextovú ponuku a začiarkneme položku Získavať popisy obrázkov od Googlu. Odteraz sa nám pokúsi Google Chrome popisovať obrázky priamo na webových stránkach.

Ak si chceme nechať popísať ľubovoľný obrázok, postupujeme nasledovne:

  • Obrázok uložíme na disk v počítači.
  • Následne v okne Google Chrome stlačíme klávesovú skratku Ctrl+o, čím vyvoláme štandardný dialóg na otvorenie súboru.
  • Súbor vyhľadáme a otvoríme.
  • Popis potom čítame tak, že stlačíme šípku dole.

Najprv bude pravdepodobne zobrazený text Získavam popis. O pár sekúnd by sa už mal objaviť popis obrázka. Môže to byť text, prípadne opis toho, čo na fotke je. Popisy sú žiaľ v kombinovanej angličtine a Slovenčine resp. češtine.

Ak chcete rozpoznať obrázok, ktorý ste dostali cez Facebook Messenger, môžete sa stretnúť s tým, že obrázok Google Chrome priamo v správe nerozpozná.

  • V tomto prípade je potrebné aktivovať odkaz Otvoriť fotku.
  • Následne šípkami prejdite na text „Nie je k dispozícii žiadny popis“.
  • Vyvolajte kontextovú ponuku a aktivujte položku Otvoriť obrázok na novej karte.
  • Klávesom Ctrl+Tab prejdite na kartu, kde je teraz v plnej veľkosti zobrazený obrázok z chatu. Tu by sa už mal ukázať aj popis.

Popisovanie obrázkov v Microsoft Edge

Aj prehliadač Microsoft Edge podporuje popisovanie obrázkov. Aj v tomto prípade je potrebné funkciu najprv aktivovať.

  • Skratkou Alt+f otvoríme ponuku prehliadača.
  • Šípkou hore prejdeme na položku Nastavenia a aktivujeme ju klávesom Enter.
  • V stromovom zobrazení aktivujeme položku zjednodušenie ovládania.
  • Následne začiarkneme začiarkávacie pole Získať popisy obrázkov od spoločnosti Microsoft pre čítačky obrazovky.
  • Nastavenia zatvoríme skratkou ctrl+f4.

Samotné popisovanie funguje takmer rovnako, ako v Google Chrome. Skratkou Ctrl+O vyvoláme okno s otvorením súboru a zvolíme obrázok, ktorý si chceme nechať popísať. Popis sa však nedá čítať šípkami, môžeme ho ale prečítať skratkou na prečítanie prvku, ktorý je aktuálne zameraný, zvyčajne skratka Insert+Tab. Prípadne môžeme popis obrázka prečítať skratkou na obnovenie obsahu stránky f5.

Získanie textu z obrázka v aplikačnom sete Corvus

Ak používate telefón s operačným systémom Android a v ňom máte nainštalovaný aplikačný set Corvus, môžete získať z obrázkov text. Popisovanie objektov na obrázkoch zatiaľ nie je podporované. Obrázok je potrebné uložiť do pamäte telefónu. Zvyčajne sa v chatovacích aplikáciách po poklepaní na obrázok zobrazí ponuka. V nej zvolíme Ďalšie možnosti a následne uložiť. Ak ukladáte obrázky z Chatovacej aplikácie Messenger, nájdete ich v adresári pictures  messenger, z aplikácie Whatsapp je to priečinok pictures  whatsapp.

  • Z aplikačného setu Corvus teraz spustite z menu ponuka > aplikácie modul Správca súborov.
  • Prejdite do koreňového priečinka telefónu a následne nájdite obrázok. Názvy súborov väčšinou obsahujú dátum prijatia, podľa toho viete, ktorý obrázok sa bude rozpoznávať.
  • Na obrázok poklepte dvoma prstami, čím vyvoláte kontextovú ponuku.
  • Tu aktivujte možnosť Použiť optické rozpoznávanie textu.
  • Následne aktivujte položku náhľad. Corvus potom prečíta a zobrazí text obrázka.

Google Lookout

Na popisovanie obrázkov textu je možné použiť aj aplikáciu Google Lookout. Najprv je potrebné ju Nainštalovať z obchodu Play. Odporúčam aplikáciu aspoň raz spustiť a udeliť jej všetky oprávnenia.

Google Lookout okrem rozpoznávania textu dokáže rozpoznávať aj objekty na obrázku. Obrázok do aplikácie Lookout môžeme odoslať priamo z chatovacej aplikácie. Z menu ďalšie možnosti na obrázku aktivujeme položku Zdieľať a následne vyberieme Lookout. Po chvíli sa nám zobrazí popis obrázka.

TapTapSee

Aplikácia TapTapSee nedokáže rozpoznávať text, ale veľmi dobre rozpoznáva objekty na obrázkoch. Najprv je potrebné ju Nainštalovať z obchodu Google play. Následne odporúčam aplikáciu spustiť, udeliť jej potrebné oprávnenia a odsúhlasiť licenčné podmienky.

Do aplikácie TapTapSee nie je žiaľ možné odoslať obrázok priamo z chatovacej aplikácie, lebo nie je dostupná jej ikona v menu zdieľať. Preto je potrebné obrázok najprv uložiť do pamäte telefónu.

  • V chatovacej aplikácii zvolíme na obrázku ďalšie možnosti, následne potvrdíme položku Uložiť.
  • Priamo z aplikácie TapTapSee teraz aktivujeme tlačidlo Gallery/library.
  • Otvorí sa nám galéria s uloženými obrázkami. Uložený obrázok bude ako prvý s dnešným dátumom. Po poklepaní sa obrázok odošle do aplikácie Taptapsee a čítač obrazovky nám prečíta popis.

Doplnok Cloudvision pre NVDA

Na tomto mieste spomeniem ešte jednu možnosť popisovania obrázkov pre používateľov NVDA. Doplnok Cloudvision pomocou služby visionbot.ru popisuje obrázky a zamerané objekty. Doplnok je najprv potrebné stiahnuť a nainštalovať štandardným spôsobom.

  • Najprv presuňte kurzor na objekt, ktorý chcete rozpoznať, prípadne na obrázok v prehliadači súborov
  • Rozpoznávanie spustíte skratkou nvda+ctrl+i.

Rozpoznávanie je pomalšie, ale pomerne detailné. Odhaduje vek osôb a rozpoznáva aj text.

Klávesovú skratku na spustenie rozpoznávania je možné zmeniť v ponuke nvda > možnosti > klávesové skratky. Samotné nastavenia doplnku je možné meniť v ponuke NVDA > Možnosti > Cloud vision settings. Doplnok zatiaľ nie je lokalizovaný do Češtiny a slovenčiny, preto na tomto mieste uvádzam jeho nastavenia:

  • Play sound during recognition: Oznamuje priebeh rozpoznávania zvukom
  • Recognize text: určuje, či sa má na obrázkoch rozpoznávať aj text
  • Recognize images: Určuje, či má rozpoznávať objekty
  • Read QR / barcode: Určuje, či bude rozpoznávať čiarové kódy
  • Translate text: Určuje, či bude rozpoznaný text a popis prekladaný do zvoleného jazyka
  • Select image description language: Umožňuje zvoliť jazyk, v ktorom budeme získavať popisy obrázkov
  • Open site visionbot.ru: Otvorí stránku služby visionbot.

Záver

Popisy obrázkov sa v tomto štádiu samozrejme nedajú porovnávať s detailným popisom, ktorý nám poskytne vidiaci asistent. Slúžia skôr na orientačnú predstavu o tom, čo na obrázku je a môžeme sa rozhodnúť, či má zmysel sa ním ďalej zaoberať. Rozpoznané texty často môžu obsahovať chyby. Ak je text pre vás dôležitý, Môžete vyskúšať obrázok odoslať do služby Robobraille. V tomto článku som sa nevenoval možnostiam pre používateľov zariadení s operačným systémom IOS, keďže takéto zariadenie nevlastním. Podarilo sa mi ale zistiť, že aplikácia TapTapSee je dostupná aj pre operačný systém IOS. Popisy obrázkov sú často v miešanej angličtine, slovenčine a češtine. V tomto smere treba len dúfať, že sa časom stroje lepšie naučia používať na popisovanie aj naše jazyky.



CloudvisionGoogle ChromeGoogle LookoutMicrosoft EdgePopis obrázkuRoboBrailleRozpoznávání textuTapTapSee


Ondrej Rosík
V súčasnosti pracujem ako redaktor a moderátor v Rádiu Lumen. Venujem sa prekladu NVDA a Som betatesterom setu aplikácií Corvus. Medzi voľnočasové aktivity patrí hudba a čítanie beletrie.