Google
Фото: PC World

Од комерцијален аспект, најголемиот предизвик со кој се соочуваат компаниите кои развиваат лични AI асистенти е бојата на гласот. Општо познато е дека компаниите кои стојат зад AI асистентите мака мачат нивните апликации да звучат што поприродно.

Голем исчекор на ова поле направи Google со својот Tacotron 2. Се работи за програм кој трансформира текст во говор. Принципот на кој работи е составен од две компоненти. Едната текстот го претвора во спектрограм, односно визуелна презентација на звук. Втората пак, спектрограмот го трансформира во звук. Најинтересното во врска со Tacotron 2 е тоа што звукот кој го произведува е невозможно да се разликува од вистински човечки глас.

Успехот на овој проект бил докажан преку тестирања. Програмот успеал со неверојатна точност да интерпретира комплицирани фрази и реченици со одлична дикција и интерпункција. Како партнер на овој проект се јавува компанијата Alphabet.

Имитацијата на звукот е она што примарно ќе падне во очи кај публиката. Меѓутоа, вистинската генијалност зад овој проект е вештачката неурална мрежа. Технологијата буквално го имитира она што природата го направила преку милиони години еволуција за луѓето да можат да комуницираат меѓусебно со помош на говор.

Извори: Futurism, TalkAndroid

Претходна статијаGalaxy Note 8 има најдобра оптичка стабилизација на сликата споредено со конкурентите
Следна статијаKengoro и Kenshiro се првите роботи-атлети