Jak jsem díky inteligentní asistenční aplikaci ke skvělé kávě přišel? Srovnávací test aplikací Envision AI a Seeing AI
Jmenuji se Vladimír Dvořák a zabývám se informačními a komunikačními technologiemi. A protože jsem nevidomý, rád bych se s vámi podělil o zkušenosti s aplikací Envision AI určenou pro chytrý mobilní telefon iPhone firmy Apple.
Milí čtenáři, ne, určitě se nebojte, že bych se v následujícím textu zabýval kulinářskými záležitostmi, od toho tu Pelion určitě není. Ale otázka mi poslouží, abych vám přiblížil, co mne nejvíce motivovalo si aplikaci Envision AI pořídit.
Téměř před půl rokem jsem se rozhodl, že si pořídím kávovar, který bude nejen vařit skvělou kávu, ale nabídne mi v cenové kategorii to nejlepší. Ano, nabídnul, ale k tomu všemu mi nabídnul i svůj aktivní digitální display. A ejhle, problém byl na světě.
Co po mě vlastně chce, co mi říká? No, to byla ta otázka, že?
Několik týdnů jsem zkoušel různé aplikace pro rozpoznávání textů, ale žádná z nich mne nezaujala tak, abych řekl, že prostřednictvím takové aplikace jsem schopen rychle a v reálném čase kávovar používat. Byl jsem z nastalé situace docela rozmrzelý. Po čase se ale na mne usmálo štěstí, když jsem v App Store narazil na aplikaci Envision AI, jež je určena pro chytré telefony firmy Apple.
Srovnávací test aplikací Envision AI a Seeing AI
Datum testu – 21. 01. 2019
testováno:
- operační systém – iOS – 12.1.2
- iPhone XS – vybavený duálním fotoaparátem se stabilizací obrazu
1. Aplikace Envision AI
Prostředí programu je české. Aplikace je plně dostupná pro hlasový výstup Voice Over a má klasické uspořádání. To znamená, že v dolní části obrazovky jsou čtyři záložky, a to tyto:
- Text
- Obecné
- Rozpoznávání předmětů
- Nápověda
Na každé záložce jsou tlačítka pro ovládání.
Níže jsou vypsány jednotlivé funkce, které aplikace nabízí:
- Karta – Text
- Lupa
- Zapnout průběžné čtení textu
- Přečíst rukou psaný text
- Vyfotit a přečíst dokument
- Karta – Obecné
- Popsat scénu
- Rozpoznat barvy
- Naskenovat čárový kód
- Karta – Rozpoznávání předmětů
- Nalézt vlastní předměty
- Najít obecné předměty
- Naučit
- Karta – Nápověda
- Přečíst návod
- Zpětná vazba
- Zažádat o hovor
- Nastavení
Funkce – Lupa
Umožňuje promítání snímané předlohy kamerou telefonu na obrazovku zařízení. Prostřednictvím posuvníku lze volit velikost obrazu. Dále je možné nastavit inverzní barvy.
Zobrazení není moc kvalitní, v průběhu testu nedocházelo k automatickému přisvícení snímané předlohy stran fotoaparátu.
Funkce – Průběžné čtení textu
Funkce dobře odečítá tištěný text, a to v reálném čase. Tedy po namíření kamery telefonu na předlohu začne hlasový výstup téměř okamžitě číst samotný text. Navíc, u telefonů, které mají stabilizaci fotoaparátu, je možné odečítat i text ze vzdálenější plochy, jako jsou tabulky na zdi či dveřích.
Funkce může posloužit v případě odečítání obalů potravin, kosmetiky apod.
Je možné v reálném čase odečítat i aktivní display či text na obrazovce televize nebo monitoru počítače.
Funkce – Přečíst rukou psaný text
Funkce vyfotografuje předlohu a rozpozná…
Jako předlohu jsem měl kvalitně rukou psaný text, aplikace jej rozpoznala v zásadě dobře…
Funkce je schopna rozpoznat také tištěnou předlohu.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Vyfotit a přečíst dokument
Funkce slouží pro rozpoznávání tištěné předlohy. Navíc, je vybavena aktivním sledováním předlohy, tedy, říká uživateli, zda je předloha v zorném poli fotoaparátu. V případě, že předloha není zcela vyditelná, upozorní, jaké rohy jsou skryté.
Platí, že, když je předloha plně vyditelná pro fotoaparát, aplikace automaticky v tu chvíli předlohu vyfotí a začne rozpoznávat. Prostřednictvím funkce je možné fotografovat více dokumentů najednou.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Popsat scénu
Funkce vyfotografuje a popíše scénu.
Dle mého testu byly situace, zachycené na fotografiích, dobře popsány.
Pro dobré rozpoznání je vhodné kvalitní osvětlení.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Rozpoznat barvy
Funkce je určena pro rozpoznání barev. Rozpoznávání probíhá ve dvou možných režimech:
- Základní – zde aplikace rozpoznává barvy z palety 30 odstínů.
- Popisné – zde aplikace rozpoznává barvy v paletě 950 odstínů.
Ovšem, dle mého testování je rozpoznávání opravdu jen hrubě orientační. Můžeme se odvolat na srovnání s jinými aplikacemi, které mají podobnou funkci, kde je úspěšnost přesného určení barvy také jen přibližná.
Faktorem lepšího výsledku je kvalitní osvětlení a výkonnost samotného fotoaparátu.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Naskenovat čárový kód
Funkce je schopna rozpoznat čárové kódy např. na obalech potravin. Je však nutné pro zachycení kódu fotoaparátem pečlivě prozkoumat celou plochu obalu. V případě, že fotoaparát čárový kód zachytí, začne aplikace vydávat zvuk značící viditelnost kódu. Po čase dostaneme informaci o názvu zboží či takovou, že čárový kód nebyl rozpoznán.
Jestliže je kód rozpoznán, mohu si z další nabídky zjistit např. jeho složení, dostupnost či zobrazit produktovou stránku.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Nalézt vlastní předměty
Funkce se využívá pro rozpoznání vlastních předmětů, které lze definovat prostřednictvím funkce – Naučit.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Najít obecné předměty
Funkce se používá pro popis zaměřeného předmětu. Úspěšnost rozpoznání je trochu diskutabilní, protože, např. PC sestavu, označila jako hudební nástroj.
Na druhou stranu, rozpoznání nádobí či popis scény např. místnost apod., toto probíhá uspokojivě.
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Naučit
Funkce nabízí možnost naučení konkrétního obličeje a dále konkrétního předmětu.
Pro naučení obličeje je nutné vyfotografovat cca 10 snímků, zde je možné využít pro záznam zadní či přední fotoaparát.
Po nafocení obličeje či předmětu se výsledek uloží, je nutné poté přidat vlastní popisek. Konkrétní uložený výsledek je dostupný v knihovně předmětů a obličejů, kde je dostupná i jeho editace…
Funkce je dostupná tehdy, kdy je telefon připojen na internet.
Funkce – Nápověda / Přečíst návod
Funkce Přečíst návod je dostupná ve dvou jazycích, a to v Angličtině a Němčině. Dále je zde možnost přepnout se přímo na internetové stránky výrobce.
Funkce – Zpětná vazba
Funkce nabízí prostřednictvím formuláře odeslat komentář výrobci.
Funkce – Zažádat o hovor
Funkce nabízí možnost po vyplnění telefonního čísla uživatele zpětné zavolání od výrobce aplikace.
Volba – Nastavení / Rozpoznávání textu offline
Tuto volbu je možné buď zapnout či vypnout. Při zapnuté volbě je možné rozpoznávat text ve funkci Zapnout průběžné čtení textu bez přístupu na internet.
Volba – Automatické rozpoznání jazyka
Volba umožňuje rozpoznávání v ostatních jazycích. Při mém testu rozpoznávání, ve funkci – Zapnout průběžné čtení textu, však docházelo k občasných chybám, a to takovým, že byl někdy český text čten např. anglicky apod. Problém se vyskytoval u čtení etiket potravin s více jazyčným textem.
Volba – Řeč
Zde je možné nastavit rychlost čtení rozpoznané předlohy a také hlas, který bude výsledek číst.
Pozor, toto nastavení neovlivňuje nastavení samotného Voice overu v operačním systému. Vztahuje se jen a pouze na hlas využívaný pro čtení rozpoznaného textu v aplikaci.
Volba – Rozpoznávání barev
Zde se dá nastavit úroven, dle které bude docházet k určení barvy viz výše… Zda bude barva rozpoznána v 30 nebo 950 odstínech.
Pro samotné využívání programu je nutné se přihlásit uživatelským účtem. Uživatelský účet má podobu mailové schránky. Po stažení aplikace a následném přihlášení prostřednictvím mailového účtu, má uživatel k dispozici 14ti denní zkušební lhůtu na testování. V průběhu této lhůty jsou dostupné všechny výše popsané funkce…
Po naplnění 14ti denní lhůty je možné aplikaci odinstalovat či zakoupit licenci.
Licence může být:
- celoživotní – cca 5 200 Kč
- roční – cca 1 090 Kč
- měsíční – cca 139 Kč
Poznámka – samotnou aplikaci, v plné verzi, jsem zakoupil v čase Vánoc, kdy byla zlevněna přibližně na 3 200 Kč.
Aplikace je dostupná v App Store a instaluje se běžným způsobem, dle pravidel Apple.
Výhody programu
- Dobré odečítání v reálném čase se správnou českou diakritikou.
- Při fotografování předlohy dojde k automatickému vyfocení tehdy, kdy je celý dokument v zorném poli kamery.
- Obstojná knihovna s čárovými kódy výrobků.
- V zásadě rychlé rozpoznání textu.
Nevýhody programu
- Pořizovací cena.
- Program nemá vlastní OCR knihovny pro rozpoznání textu. Vše se odehrává odesláním vyfocené předlohy na server. Toto neplatí pro funkci Průběžné čtení textu, pro které si mohu v nastavení zvolit rozpoznávání offline.
- Pro správné rozpoznání textu je nutné mít předlohu správně směrovanou vůči fotoaparátu. Tedy, když je předloha vzhůru nohama, nedojde k dobrému rozpoznání.
- Neúplně dobré rozpoznávání obecných předmětů.
- Neúplně spolehlivé rozpoznávání barvy předlohy.
Poznámka – pro kvalitní rozpoznávání textů doporučuji fotoaparát se stabilizací obrazu.
Aplikace – Seeing AI
Pro test platí tyto podmínky:
- operační systém – iOS – 12.1.2
- iPhone XS – vybavený duálním fotoaparátem se stabilizací obrazu
Aplikace se nabízí jen v anglické mutaci. Aplikace je plně dostupná pro hlasový výstup Voice Over.
Uspořádání ovládacích prvků aplikace je odlišné vzhledem k aplikaci Envision AI.
Prostředí aplikace vypadá následovně:
- horní část obrazovky – V levé části se nachází tlačítko Menu, v pravé části obrazovky je tlačítko Quick Help.
- střední část – Zde se nachází tlačítko Resume Announcements / Pause Announcements
- spodní část – Zde se nachází přepínač Channel, švihem jedním prstem vzhůru či dolu jím měním funkce, které jsou tyto:
- Short Text
- Document
- Product
- Person
- Currency
- Scene Preview
- Color Preview
- Handwriting Preview
- Light
Funkce – Short Text
Funkce odečítá v reálném čase text, na který namířím fotoaparát telefonu. Odezva je velmi rychlá a v zásadě přesná.
POZOR – funkce není schopna rozpoznávat specifické české znaky. Tedy, jestliže se v textu specifické české znaky vyskytují, dojde k jejich úplnému vynechání a hlasový výstup je nepřečte.
Příklad: Jestliže by mělo dojít k přečtení slova čeština, bude přečteno pouze E tina.
Funkce se spouští a vypíná tlačítkem Resume Announcements / Pause Announcements.
Funkce – Document
Funkce je určena pro vyfocení a následné rozpoznání tištěného textu.
Pro správné focení je zde pomocná hlasová navigace, která v anglickém jazyce sděluje, jestli je dokument zcela vyditelný pro fotoaparát. V případě, že dokument není zcela vyditelný, komentář označí části / rohy, které jsou neviditelné.
V případě, že je dokument zcela vyditelný pro fotoaparát, program automaticky předlohu vyfotografuje.
Výsledek focení je odeslán na server pro samotné rozpoznání.
V této funkci se zdá, že jsou plně zachovány české specifické znaky. Tedy, český text je čten v zásadě správně.
Funkce – Product
Funkce slouží ke skenování produktových značek / kódů. V průběhu testu se mi nepodařilo úspěšně naskenovat značku žádnou.
Zkoušel jsem čajové produkty, u kterých jsem byl v rozpoznání jednou úspěšný s aplikací Envision AI.
Funkce – Person
Funkce slouží k focení obličeje.
Pro fotografování můžeme zvolit přední či zadní fotoaparát.
Po stisku tlačítka Take Picture dojde k vyfocení obličeje. Před fotografováním je uživateli hlasem podána informace, zda se nějaká tvář v zorném poli fotoaparátu nachází.
Po vyfocení obličeje je okomentován věk foceného, dále emoce a případně barva vlasů.
Výsledek je možné uložit do knihovny fotografií.
Funkce – Currency
Funkce slouží k rozpoznávání bankovek. Je možné rozpoznat tyto bankovky:
- Rupie – Indie
- Libra – GB
- Dolar – Kanada
- EURO
- Dolar – USA
Pro test jsem měl EURO bankovky. Ty byly rozpoznány správně.
Funkce – Scene Preview
Funkce slouží k rozpoznání a popsání scény. Zkoušel jsem fotit PC sestavu na stole. Komentář, který je v anglickém jazyce, byl v zásadě přesný. Opět platí, že fotografii scény je možné uložit do knihovny.
Funkce – Color Preview
Funkce je určena pro pojmenování barvy. Po namíření fotoaparátu na předmět dojde k popsání barvy. Opět platí, že určení barvy je velmi orientační a nepřesné.
Funkce – Handwriting Preview
Funkce je označena jako experimentální. Slouží k rozpoznání rukou psaného textu. Tedy, po stisku tlačítka Take Picture, dojde k samotnému rozpoznání. Výsledek byl uspokojivý.
Funkce – Light
Funkce slouží pro určení intenzity světla. Tedy, jestli je světlo aktivní, program jej označí vyšším tónem. Jestliže je světlo vypnuté, program vydává velmi nízký tón.
Položka – Menu
Tato položka zahrnuje nastavení programu, jako je:
- Nastavení
- Nastavení měny pro rozpoznávání bankovek
- Konfigurace 3D Touch jako zkratková klávesa
- Nastavení osvětlení – vypnuto / zapnuto
- Řeč
- Nastavení hlasu – neobsahuje češtinu
- Nastavení rychlosti řeči
- Procházení fotografií
- Zda přednostně ukazovat posledně nafocené snímky
Položka – Quick Help
Obsahuje zkratkové klávesy pro ovládání a videonávod.
Dále je zde možné napsat zpětnou vazbu výrobci a přečíst si nápovědu v anglickém jazyce.
Výhody programu Seeing AI
- program je k dispozici zdarma
- obstojné rozpoznávání textu ve funkci Dokument
- funkce detekce světla
- dobré popisování scén ve funkci – Scene Preview
Nevýhody programu Seeing AI
- Neschopnost rozpoznávat specifické české znaky ve funkci – Short Text
- Anglické prostředí
- Nedobré rozpoznávání předmětů ve funkci Product
- Program neobsahuje OCR knihovny pro rozpoznávání textu
Vážení čtenáři, pokud jste dočetli až sem, děkuji vám velice za váš zájem a přeji vám, ať vám nové technologie usnadňují život třeba tak, jako mně výše popsané aplikace.



[…] Vladimír Dvořák Anotace: Workshop se bude odkazovat na srovnávací test dvou aplikací, tedy aplikace Envision AI + Seeing AI. Do programu bych nejspíše zahrnul ještě aplikace Cash […]
[…] Reader (KNFB Reader – čtečka tištěných předloh v mobilu), Envision AI či Seeing AI (Srovnávací test aplikací Envision AI a Seeing AI) nebo miniaturní kamera Orcam MyEye, kterou bylo při nedávných volbách v Izraeli vybaveno […]