Seeing AI od Microsoftu už aj pre Android

Aplikáciu Seeing AI používatelia operačného systému iOS poznajú už dlhé roky. Pred niekoľkými týždňami ju vývojári konečne sprístupnili aj pre Android. Čo dokáže? Ako sa s ňou na Androide pracuje?

Inštalácia a prvé spustenie

Aplikáciu vyhľadáte a nainštalujete štandardne v Obchode Play. Ešte pred nejakým časom ju bolo pomerne ťažké nájsť, avšak teraz by to už malo byť bez problémov. Je zadarmo, takže vás nič neprekvapí.

Po prvom otvorení sa spustí klasická prezentácia o funkciách SeeingAI. Ihneď zistíte, že prostredie je pre Slovenskú republiku v angličtine. Ak si chcete úvodný krátky tutoriál prejsť, potvrdzujete tlačidlo Next, pre preskočenie poklepete na Skip.

Pozor, na poslednej stránke sa objaví upozornenie, že vývojári aplikácie nenesú zodpovednosť za škody, ktoré by mohli nastať kvôli nesprávnej interpretácii rozpoznaných výsledkov. Okrem toho je potrebné začiarknuť súhlas s podmienkami používania a poklepať na tlačidlo GET STARTED.

Posledným krokom pred spustením samotnej aplikácie je povolenie prístupu ku kamere. Keďže celá SeeingAI je založená na snímaní obrazu, odporúčam toto povolenie udeliť.

Prostredie SeeingAI

Po úspešnom zdolaní všetkých úvodných nastavení sa dostanete do prostredia aplikácie a konkrétnejšie do návodu na prvú jej funkciu, teda Short text. Zavriete ho tlačidlom Close.

Vo vrchnej časti displeja nájdete vľavo tlačidlo Open navigation drawer. Okrem pomocníka (Help), možnosti odoslať spätnú väzbu (Feedback) a informácií o aplikácii (About) tu nájdete aj nástroje (Settings). Tým sa budem venovať nižšie.

V pravom hornom rohu sa nachádza tlačidlo Quick help (rýchla nápoveda), po poklepaní naň sa vám zobrazí krátky návod ku každej funkcii.

Väčšinu displeja zaberá obraz zo zadného fotoaparátu. Je veľká škoda, že sa nedá vypnúť a počase sa začne telefón slušne zahrievať.

V spodnej približne štvrtine sa nachádza pás s takzvanými kanálmi, teda jednotlivými funkciami podobne, ako to má v súčasnej verzii Envision AI.

Zľava sú to:

Short text

Slúži na okamžité prečítanie textu v zábere kamery. Výsledky sú porovnateľné s ostatnými aplikáciami, avšak odporúčam nastaviť jazyk rozpoznávania aspoň na češtinu, slovenčina zatiaľ chýba. Pri defaultnej angličtine sa TalkBack prepína na anglickú výslovnosť, a teda slovenský text je nezrozumiteľný.

Jazyk zvolíte poklepaním na tlačidlo Recognizing English, ktoré nájdete nad kanálom Person, vpravo v spodnej časti dipleja. Stačí potom požadovaný jazyk vyhľadať a poklepaň naň.

Document

Ako už názov napovedá, ide o skenovanie a rozpoznanie celej strany. Aplikácia vás v angličtine naviguje, ako so zariadením hýbať, aby bol výsledok čo najlepší.

Ak by sa nedarilo dokument vyfotiť v automatickom režime, môžete to urobiť ručne tlačidlom Take picture nad kanálom Product.

Výsledky sú o poznanie lepšie ako pri rozpoznávaní v reálnom čase, ani so slovenčinou nemá SeeingAI problém. Pri skenovaní dokumentu už jazyk OCR neviete zmeniť.

Product

SeeingAI dokáže skenovať a rozpoznávať čiarové a takzvané vylepšené (ak sa nemýlim, Envision AI ich nazýva prístupné) QR kódy. Cez nasnímanie čiarového kódu dostanete informácie o názve produktu, vylepšené QR, ak sa ujmú, môžu informovať napríklad o zložení, ako produkt používať a podobne. Zatiaľ som neprišla na to, prečo nemôžu použiť štandardné QR a je potrebné vynachádzať zasa niečo nové.

Typ rozpoznávaného kódu zvolíte poklepaním na tlačidlo Recognizing bar codes opäť nad funkcionalitou Person. V otvorenom dialógu len začiarknete typ kódu, ktorý chcete skenovať.

Spoľahlivosť SeeingAI si pozrite v tabuľke nižšie.

SeeingAI a rozpoznávanie čiarových kódov

Tabuľka obsahuje 2 stĺpce – názov tovaru a rozpoznanie čiarového kódu, ktoré bude hodnotené nasledovne:

  • 0 = produkt nebol rozpoznaný.
  • 1 = produkt bol rozpoznaný správne.
  • X = čiarový kód nebol nájdený, alebo bol rozpoznaný chybne.
Tabuľka spoľahlivosti SeeingAI pri rozpoznávaní čiarových kódov
Názov produktuStav rozpoznania
Kolonáda s tabuľkou horkej čokolády1
Popradský čaj s rakytníkom0
Nescafé Classic bez kofeínu1
Coop slivkový lekvár0
Coop Termix čokoládový0
Rama0
Čokoláda Milka mliečna 100 g1
Magnesia minerálna voda jemne perlivá 1,5 l1
Excipial ULipo Lotio krémX
Tento papierové vreckovky v krabici0
Gumené rukavice QHome0
Vitana Grilovaná zelenina korenie0
Celkový počet rozpoznaných produktov4/12
% rozpoznaných produktov33 %

Ako vidíte z tabuľky, výsledok SeeingAI nie je veľmi uspokojivý, ale nevybočuje z priemeru aplikácií, ktoré tiež túto funkciu majú. Napríklad Envision AI dosiahol 32 %, Supersense 36 % a kamerka Orcam MyEye len 27,3 % správne rozpoznaných čiarových kódov.

Podrobné výsledky nájdete v článku Snímanie čiarových kódov a ľudia so zrakovým znevýhodnením, z ktorého je prevzatá aj metodika hodnotenia.

Scene

Po vyfotení ponúkne stručný opis scény, čo nie je nič výnimočné. Sú tu však dve oveľa zaujímavejšie tlačidlá.

  • Explore photo – po aktivovaní môžete pohybovať prstom po displeji s vyfotenou fotografiou scény a SeeingAI sa pokúsi rozpoznať a pomenovať objekt pod vaším prstom. Podľa môjho názoru je výsledok uspokojivý. Pohyb je sprevádzaný charakteristickým zvukom, rozpoznaný objekt cinknutím. Celkovo mám pocit, že vývojári z Microsoftu majú radi zvukový prejav.
  • More info – týmto tlačidlom aktivujete rozšírený popis scény pomocou umelej inteligencie. Ten je síce kvalitný, ale je v angličtine.

Person

Slúži na rozpoznávanie osôb. Tu mám niekoľko kritických pripomienok:

  • Aplikácia sa snaží popísať aj emóciu človeka na fotografii. V prípade, že má však nejakú tvárovú deformitu, výraz nezodpovedá skutočnosti, čo je zavádzajúce. Dovolím si tvrdiť, že v mnohých prípadoch môže aj dehonestovať takého človeka.
  • Podľa toho, z ktorého uhla osobu odfotíte, SeeingAI je schopná podať vždy iné informácie o jej veku a, pozor, niekedy aj o výraze a pohlaví.

Môže sa ale hodiť, ak potrebujete niekoho rozpoznať konkrétne, napr. poštárku alebo iné známe osoby. Na to použite tlačidlo Face Recognition. Aby rozpoznanie správne fungovalo, je potrebné vyhotoviť 3 fotografie tváre. Môžete ich urobiť buď vy zadnou kamerou, alebo prepnúť na prednú, aby sa daný človek odfotil sám, ak si na to netrúfate.

Po vyfotení človeka pomenujete a poklepete na Add person, čím sa uloží do databázy. Ak potom namierite fotoaparát na uloženú osobu, SeeingAI ju pomenuje vami uloženým menom.

Skúšala som to iba na sebe, ale fungovalo to.

Currency

Takisto známa funkcia už z Google Lookoutu – rozpoznávanie mien. V súčasnosti SeeingAI dokáže rozpoznať 17 mien, medzi ktorými však chýba napríklad česká koruna. Euro, samozrejme, prítomné je.

Ak potrebujete zmeniť menu, poklepete na známe tlačidlo Recognizing €.

Color

Aj túto funkciu už poznáte, tentoraz z Envision AI. Prostredníctvom nej by sa telefón mal zmeniť na color test a pomôcť s rozpoznávaním farieb. Avšak podobne ako v Envisione, aj tu je veľmi nespoľahlivá a závislá od dobrých svetelných podmienok. Myslím, že príklad, keď raz modrý notebook označila za čierny, druhýkrát ako hnedý a na tretí pokus šedý, hovorí za všetko.

Podobne má problém aj s bielou farbou, ktorú konštantne deteguje ako šedú.

Handwriting

Pomocou tejto funkcie by ste mali byť schopní rozpoznať rukopis. Tlačidlom Take photo vyfotíte rukou písaný text a počkáte, kým ho aplikácia analyzuje.

Nerátala som s tým, že by bola veľmi úspešná, ale minimálne rukou písaný nákupný zoznam (hoci tlačeným písmom) rozpoznala na 95 % úspešne. Bohužiaľ, žiadny text napísaný písaným písmom k dispozícii nemám.

Light

Detektor svetla – ak budete mobilným telefónom otáčať, budete počuť vyšší tón, ak sa priblížite k zdroju svetla, nižší, pokiaľ budete smerovať do tmy.

Funguje to, len je potrebné dávať pozor na rýchlosť otáčania, inak z toho budete mať skôr koncert.

Settings

V nastaveniach môžete upravovať nasledujúce položky:

  • Currency – vyberáte predvolene rozpoznávanú menu.
  • Reorder channels – preusporiadate si funkcie podľa vašich predstáv.
  • Configure shortcuts – po podržaní ikony SeeingAI na domovskej obrazovke sa zobrazia najčastejšie používané funkcie či kanály. Tu určujete, ktoré to budú.
  • Manage lighting – povoľujete aplikácii zapnúť pri zlom osvetlení baterku na prisvietenie.
  • Nastavenie reči – vyberáte prevod textu na reč, jeho variant hlasu, ak ich obsahuje viac, a rýchlosť. Toto sa nedotkne používateľov TalkBacku.

Záver

SeeingAI je v súčasnosti už jednou z mnohých podobných aplikácií, ktoré ako nevidiaci používatelia máme k dispozícii. Jej výhodou je, že kombinuje 9 funkcií do jednej appky, nevýhodou, že aspoň podľa môjho názoru ani v jednej neexceluje. Ja osobne odporúčam skôr skombinovať aplikácie Envision AI a Google Lookout, ktoré spolu ponúknu solídny základ v OCR a aj prídavných funkciách ako detektor svetla, skenovanie čiarových kódov či rozpoznávanie mien, scény a ľudí. Pritom sú taktiež zadarmo a preložené do slovenčiny

Je však na vás, čo preferujete. V každom prípade si myslím, že SeeingAI pre slovenských používateľov bude konkurencieschopná až vtedy, keď pribudne slovenčina.


Článek původně vyšel na webu technologiebezzraku.sk.



Seeing AI


Michaela Dlhá
Volám sa Michaela Dlhá. Som prakticky nevidiaca. Asistenčné technológie využívam už od základnej školy. V súčasnosti som zamestnaná v Únii nevidiacich a slabozrakých Slovenska. Skúšaniu a testovaniu hardwaru a softwaru z hľadiska prístupnosti sa venujem už asi 10 rokov, ale...