Tha an àireamh de thagraidhean agus cudromachd eadar-aghaidh guth a’ fàs gu luath
de theicneòlas

Tha an àireamh de thagraidhean agus cudromachd eadar-aghaidh guth a’ fàs gu luath

Dh'ionnsaich teaghlach Ameireaganach ann am Portland, Oregon o chionn ghoirid gun do chlàraich neach-cuideachaidh guth Alex na còmhraidhean prìobhaideach aca agus gun do chuir iad gu caraid iad. Thuirt sealbhadair an taighe, ris an canar Danielle leis na meadhanan, ri luchd-aithris nach biodh i “gu bràth a’ cuir a-steach an inneal sin a-rithist leis nach urrainn earbsa a bhith ann. ”

Alexa, air a thoirt seachad le luchd-labhairt Echo (1) agus innealan eile ann an deichean de mhilleanan de dhachaighean na SA, a’ tòiseachadh a ’clàradh nuair a chluinneas e ainm no“ facal gairm ”air a labhairt leis an neach-cleachdaidh. Tha seo a 'ciallachadh ged a tha am facal "Alexa" air ainmeachadh ann an sanas TBh, faodaidh an inneal tòiseachadh air clàradh. Is e sin dìreach a thachair sa chùis seo, arsa Amazon, an neach-cuairteachaidh bathar-cruaidh.

“Chaidh an còrr den chòmhradh a mhìneachadh leis an neach-cuideachaidh guth mar àithne airson teachdaireachd a chuir," thuirt a’ chompanaidh ann an aithris. “Aig àm air choreigin, dh’ fhaighnich Alexa gu làidir, “Cò?” Bu chòir don inneal leantainn air adhart le còmhradh an teaghlaich mu fhiodh cruaidh a bhith air fhaicinn mar nì air liosta conaltraidh an neach-ceannach.” Co-dhiù is e sin a tha Amazon a’ smaoineachadh. Mar sin, tha an t-eadar-theangachadh air a lùghdachadh gu sreath de thubaistean.

Tha an dragh fhathast, ge-tà. Air sgàth adhbhar air choireigin, ann an taigh far an robh sinn fhathast a’ faireachdainn aig fois, feumaidh sinn seòrsa de “modh guth” a chuir a-steach, coimhead air na chanas sinn, na tha an telebhisean a’ craoladh agus, gu dearbh, na tha an neach-labhairt ùr seo air a’ bhroilleach. tha luchd-tarraing ag ràdh. sinn.

Ach, A dh’ aindeoin neo-fhoirfeachdan teicneòlais agus draghan mu dhìomhaireachd, leis an àrdachadh ann an mòr-chòrdte innealan mar an Amazon Echo, tha daoine a’ tòiseachadh a’ fàs cleachdte ris a’ bheachd a bhith ag eadar-obrachadh le coimpiutairean a’ cleachdadh an guth..

Mar a thug Werner Vogels, CTO de Amazon, fa-near rè an AWS aige mu: Invent seisean aig deireadh 2017, tha teicneòlas gu ruige seo air ar comas eadar-obrachadh le coimpiutairean a chuingealachadh. Bidh sinn a’ sgrìobhadh prìomh fhaclan a-steach do Google a’ cleachdadh a’ mheur-chlàr, oir is e seo fhathast an dòigh as cumanta agus as fhasa air fiosrachadh a chuir a-steach don inneal.

Thuirt Vogels. -

ceithir mòr

Nuair a bhios sinn a’ cleachdadh einnsean sgrùdaidh Google air a’ fòn, is dòcha gun do mhothaich sinn soidhne microfòn le gairm airson bruidhinn o chionn fhada. Seo Google a-nis (2), a dh'fhaodar a chleachdadh gus iarrtas rannsachaidh òrdachadh, cuir a-steach teachdaireachd le guth, msaa. Anns na bliadhnachan mu dheireadh, tha Google, Apple, agus Amazon air leasachadh gu mòr teicneòlas aithneachaidh guth. Bidh luchd-cuideachaidh gutha leithid Alexa, Siri, agus Cuidiche Google chan ann a-mhàin a’ clàradh do ghuth, ach cuideachd a’ tuigsinn na chanas tu riutha agus a’ freagairt cheistean.

Tha Google Now ri fhaighinn an-asgaidh don h-uile neach-cleachdaidh Android. Faodaidh an tagradh, mar eisimpleir, inneal-rabhaidh a shuidheachadh, sùil a thoirt air ro-aithris na sìde agus sùil a thoirt air an t-slighe air mapaichean Google. Leudachadh còmhraidh air stàitean Google Now Neach-taic Google () - taic brìgheil do neach-cleachdaidh an uidheim. Tha e ri fhaighinn sa mhòr-chuid air innealan gluasadach agus smart dachaigh. Eu-coltach ri Google Now, faodaidh e pàirt a ghabhail ann an iomlaid dà-shligheach. Thàinig an neach-cuideachaidh gu crìch sa Chèitean 2016 mar phàirt den app teachdaireachdan Google Allo, a bharrachd air ann an neach-labhairt guth Google Home (3).

3. Dachaigh Ghoogle

Tha an neach-cuideachaidh brìgheil fhèin aig an t-siostam IOS cuideachd, Siri, a tha na phrògram air a ghabhail a-steach le siostaman obrachaidh Apple iOS, watchOS, tvOS homepod, agus macOS. Thàinig Siri gu crìch le iOS 5 agus an iPhone 4s san Dàmhair 2011 aig co-labhairt Let's Talk iPhone.

Tha am bathar-bog stèidhichte air eadar-aghaidh còmhraidh: tha e ag aithneachadh cainnt nàdarra an neach-cleachdaidh (le iOS 11 tha e comasach cuideachd òrdughan a chuir a-steach le làimh), a’ freagairt cheistean agus a’ crìochnachadh ghnìomhan. Taing do thoirt a-steach ionnsachadh innealan, neach-cuideachaidh thar ùine mion-sgrùdadh roghainnean pearsanta an neach-cleachdaidh gus toraidhean agus molaidhean nas buntainniche a thoirt seachad. Feumaidh Siri ceangal eadar-lìn seasmhach - is e Bing agus Wolfram Alpha na prìomh thùsan fiosrachaidh an seo. Thug iOS 10 a-steach taic airson leudachadh treas-phàrtaidh.

Fear eile de na ceithir mòr Cortana. Tha e na neach-cuideachaidh pearsanta tuigseach air a chruthachadh le Microsoft. Tha e a’ faighinn taic Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, àrd-ùrlaran Android, agus iOS. Chaidh Cortana a thoirt a-steach an toiseach aig Co-labhairt Luchd-leasachaidh Microsoft Build sa Ghiblean 2014 ann an San Francisco. Tha ainm a’ phrògram a’ tighinn bho ainm caractar bhon t-sreath geama Halo. Tha Cortana ri fhaighinn ann am Beurla, Eadailtis, Spàinntis, Fraingis, Gearmailtis, Sìonais agus Seapanais.

Luchd-cleachdaidh a 'phrògraim a chaidh ainmeachadh mar-thà Alexa feumaidh iad cuideachd beachdachadh air cuingealachaidhean cànain - chan eil an neach-cuideachaidh didseatach a’ bruidhinn ach Beurla, Gearmailtis, Fraingis agus Seapanais.

Chaidh an Amazon Virtual Assistant a chleachdadh an toiseach anns na luchd-labhairt smart Amazon Echo agus Amazon Echo Dot a chaidh a leasachadh le Amazon Lab126. Bidh e a’ comasachadh eadar-obrachadh guth, ath-chluich ciùil, cruthachadh liosta ri dhèanamh, suidheachadh rabhaidh, sruthadh podcast, ath-chluich leabhraichean claistinn, agus sìde fìor-ùine, trafaic, spòrs, agus fiosrachadh naidheachdan eile leithid naidheachdan (4). Faodaidh Alexa smachd a chumail air grunn innealan snasail gus siostam fèin-ghluasaid dachaigh a chruthachadh. Faodar a chleachdadh cuideachd airson ceannach goireasach a dhèanamh ann an stòr Amazon.

4. Na bhios luchd-cleachdaidh a’ cleachdadh Echo Airson (A rèir Rannsachadh)

Faodaidh luchd-cleachdaidh eòlas Alexa a leasachadh le bhith a’ stàladh Alexa “sgilean” (), feartan a bharrachd air an leasachadh le treas phàrtaidhean, ris an canar mar as trice aplacaidean leithid sìde agus prògraman claisneachd ann an suidheachaidhean eile. Leigidh a’ mhòr-chuid de dh’ innealan Alexa leat an neach-cuideachaidh brìgheil agad a chuir an gnìomh le facal-faire dùisg, ris an canar .

Tha Amazon gu cinnteach a’ faighinn smachd air a’ mhargaidh luchd-labhairt smart an-diugh (5). Tha IBM, a thug a-steach seirbheis ùr sa Mhàrt 2018, a 'feuchainn ri dhol a-steach do na ceithir as àirde Neach-cuideachaidh Watson, air a dhealbhadh airson companaidhean a tha airson na siostaman aca fhèin de luchd-cuideachaidh brìgheil a chruthachadh le smachd guth. Dè a’ bhuannachd a tha ann am fuasgladh IBM? A rèir riochdairean bhon chompanaidh, an toiseach, air cothroman fada nas motha airson pearsanachadh agus dìon prìobhaideachd.

An toiseach, chan eil Neach-taic Watson air a bhranndadh. Faodaidh companaidhean na fuasglaidhean aca fhèin a chruthachadh air an àrd-ùrlar seo agus an comharrachadh leis a’ bhrannd aca fhèin.

San dàrna h-àite, is urrainn dhaibh na siostaman cuideachaidh aca a thrèanadh a’ cleachdadh na seataichean dàta aca fhèin, a tha IBM ag ràdh a tha ga dhèanamh nas fhasa feartan agus òrdughan a chuir ris an t-siostam sin na teicneòlasan VUI eile (eadar-aghaidh cleachdaiche guth).

San treas àite, chan eil Neach-taic Watson a’ toirt seachad fiosrachadh do IBM mu ghnìomhachd luchd-cleachdaidh - chan urrainn do luchd-leasachaidh fuasglaidhean air an àrd-ùrlar ach dàta luachmhor a chumail dhaibh fhèin. Aig an aon àm, bu chòir do dhuine sam bith a thogas innealan, mar eisimpleir le Alexa, a bhith mothachail gum bi an dàta luachmhor aca a 'tighinn gu crìch air Amazon.

Tha grunn chuir an gnìomh aig Neach-taic Watson mu thràth. Chaidh an siostam a chleachdadh, mar eisimpleir, le Harman, a chruthaich neach-cuideachaidh guth airson càr bun-bheachd Maserati (6). Aig Port-adhair Munich, tha neach-cuideachaidh IBM a 'toirt cumhachd do inneal-fuadain Pepper gus luchd-siubhail a chuideachadh a' gluasad timcheall. Is e an treas eisimpleir Chameleon Technologies, far a bheil teicneòlas guth air a chleachdadh ann am meatair dachaigh smart.

6. Neach-cuideachaidh Watson ann an càr bun-bheachd Maserati

Is fhiach a chur ris nach eil an teicneòlas bunaiteach an seo cuideachd ùr. Tha Neach-taic Watson a’ toirt a-steach comasan crioptachaidh airson toraidhean IBM a th’ ann mar-thà, Watson Conversation, agus Watson Virtual Agent, a bharrachd air APIan airson mion-sgrùdadh cànain agus cabadaich.

Chan e a-mhàin gu bheil Amazon na stiùiriche ann an teicneòlas guth snasail, ach tha e ga thionndadh gu bhith na ghnìomhachas dìreach. Ach, tha cuid de chompanaidhean air eòlas fhaighinn air amalachadh Echo fada na bu thràithe. Thug Sisense, companaidh anns a’ ghnìomhachas BI agus anailis, a-steach amalachadh Echo san Iuchar 2016. Aig an aon àm, cho-dhùin Roxy tòiseachaidh am bathar-bog agus bathar-cruaidh guth fhèin a chruthachadh airson gnìomhachas an aoigheachd. Na bu thràithe am-bliadhna, thug Synqq a-steach app gabhail notaichean a bhios a’ cleachdadh giollachd guth is cànan nàdarra gus notaichean agus inntrigidhean mìosachain a chuir ris gun a bhith gan sgrìobhadh air meur-chlàr.

Tha àrd-amasan aig na gnìomhachasan beaga sin uile. Gu sònraichte, ge-tà, dh’ ionnsaich iad nach eil a h-uile neach-cleachdaidh ag iarraidh an dàta aca a ghluasad gu Amazon, Google, Apple no Microsoft, a tha nan cluicheadairean as cudromaiche ann a bhith a’ togail àrd-ùrlaran conaltraidh guth.

Tha Ameireaganaich ag iarraidh ceannach

Ann an 2016, bha sgrùdadh guth a’ dèanamh suas 20% de gach sgrùdadh gluasadach Google. Bidh daoine a bhios a’ cleachdadh an teicneòlais seo bho latha gu latha a’ toirt iomradh air a ghoireasachd agus ioma-obair am measg nam buannachdan as motha a th’ ann. (mar eisimpleir, an comas einnsean sgrùdaidh a chleachdadh fhad ‘s a tha thu a’ draibheadh ​​​​càr).

Tha luchd-anailis Visiongain a’ dèanamh tuairmse air luach margaidh gnàthach luchd-cuideachaidh didseatach smart aig $1,138 billean.Tha barrachd is barrachd uidheamachdan mar sin ann. A rèir Gartner, ro dheireadh 2018 mu thràth 30% de na h-eadar-obrachaidhean againn le teicneòlas tro chòmhraidhean le siostaman gutha.

Tha a’ chompanaidh rannsachaidh Breatannach IHS Markit den bheachd gun ruig a’ mhargaidh airson luchd-cuideachaidh didseatach le cumhachd AI 4 billean inneal ro dheireadh na bliadhna seo, agus gum faodadh an àireamh sin èirigh gu 2020 billean ro 7.

A rèir aithisgean bho eMarketer agus VoiceLabs, chleachd 2017 millean Ameireaganaich smachd guth co-dhiù aon uair sa mhìos ann an 35,6. Tha seo a’ ciallachadh àrdachadh de cha mhòr 130% air a’ bhliadhna roimhe. Thathas an dùil gum fàs a’ mhargaidh luchd-cuideachaidh didseatach leis fhèin 2018% ann an 23. Tha seo a’ ciallachadh gum bi thu gan cleachdadh mu thràth. 60,5 millean Ameireaganaich, a bheir gu buil airgead concrait dha na riochdairean aca. Tha RBC Capital Markets a’ dèanamh a-mach gun cruthaich an eadar-aghaidh Alexa suas ri $ 2020 billean ann an teachd-a-steach airson Amazon ro 10.

Nigh, fuine, glan!

Tha eadar-aghaidh guth a’ sìor fhàs dàna a’ dol a-steach do mhargaidhean innealan dachaigh agus electronics luchd-cleachdaidh. Dh'fhaodadh seo fhaicinn mar-thà aig taisbeanadh IFA 2017 an-uiridh. Thug a 'chompanaidh Ameireaganach Neato Robotics a-steach, mar eisimpleir, inneal-glanaidh inneal-fuadain a tha a' ceangal ri aon de ghrunn àrd-ùrlaran dachaigh smart, a 'gabhail a-steach siostam Amazon Echo. Le bhith a’ bruidhinn ris an neach-labhairt smart Echo, faodaidh tu stiùireadh a thoirt don inneal an taigh gu lèir agad a ghlanadh aig amannan sònraichte den latha no den oidhche.

Chaidh toraidhean eile le guth a thaisbeanadh aig an taisbeanadh, bho telebhiseanan snasail air an reic fo bhrannd Toshiba leis a’ chompanaidh Turcach Vestel gu plaideachan teasachaidh leis a’ chompanaidh Gearmailteach Beurer. Faodar mòran de na h-innealan dealanach sin a chuir an gnìomh air astar le bhith a’ cleachdadh fònaichean sgairteil.

Ach, a rèir riochdairean Bosch, tha e ro thràth a ràdh dè na roghainnean neach-cuideachaidh dachaigh a gheibh làmh an uachdair. Aig IFA 2017, sheall buidheann teignigeach Gearmailteach innealan nighe (7), àmhainnean agus innealan cofaidh a tha a’ ceangal ri Echo. Tha Bosch cuideachd ag iarraidh gum bi na h-innealan aige co-chòrdail ri àrd-ùrlaran guth Google agus Apple san àm ri teachd.

7. Inneal nighe Bosch a tha a 'ceangal ri Amazon Echo

Tha companaidhean leithid Fujitsu, Sony agus Panasonic a’ leasachadh am fuasglaidhean cuideachaidh guth fhèin stèidhichte air AI. Tha Sharp a’ cur an teicneòlas seo ri àmhainnean agus innealan-fuadain beaga a’ tighinn a-steach don mhargaidh. Tha Nippon Telegraph & Telephone a’ fastadh luchd-dèanaidh bathar-cruaidh is dèideagan gus siostam inntleachd fuadain le guth atharrachadh.

Seann bhun-bheachd. A bheil an ùine aice air tighinn mu dheireadh?

Gu dearbh, tha bun-bheachd Eadar-aghaidh Cleachdaiche Guth (VUI) air a bhith timcheall airson deicheadan. Is dòcha gu robh dùil aig duine sam bith a choimhead Star Trek no 2001: Odyssey Space o chionn bhliadhnaichean gum biodh sinn uile timcheall air a’ bhliadhna 2000 a’ cumail smachd air coimpiutairean le ar guthan. Cuideachd, cha b’ e dìreach sgrìobhadairean ficsean saidheans a chunnaic comas an seòrsa eadar-aghaidh seo. Ann an 1986, dh’ fhaighnich luchd-rannsachaidh Nielsen do phroifeiseantaich IT dè bha iad a’ smaoineachadh a bhiodh mar an atharrachadh as motha ann an eadar-aghaidh luchd-cleachdaidh ron bhliadhna 2000. Mar bu trice thug iad iomradh air leasachadh eadar-aghaidh guth.

Tha adhbharan ann airson a bhith an dòchas a leithid de fhuasgladh. Is e conaltradh beòil, às deidh a h-uile càil, an dòigh as nàdarra dha daoine a bhith ag iomlaid smuaintean gu mothachail, agus mar sin tha e coltach gur e a bhith ga chleachdadh airson eadar-obrachadh inneal-daonna am fuasgladh as fheàrr gu ruige seo.

Aon de na ciad VUIn, ris an canar bogsa bhròg, a chruthachadh tràth anns na 60an le IBM. B’ e seo ro-ruithear siostaman aithne guth an latha an-diugh. Ach, bha leasachadh innealan VUI cuingealaichte le crìochan cumhachd coimpiutaireachd. Feumaidh parsadh agus eadar-mhìneachadh cainnt daonna ann an àm fìor, agus thug e còrr is leth-cheud bliadhna gus faighinn chun na h-ìre far an robh e comasach.

Thòisich innealan le eadar-aghaidh guth a 'nochdadh ann am mòr-chinneasachadh ann am meadhan nan 90an, ach cha do dh'fhàs iad mòr-chòrdte. B 'e a' chiad fòn le smachd guth (dialing). Phillips Sparkfhoillseachadh ann an 1996. Ach, cha robh an inneal ùr-ghnàthach agus furasta a chleachdadh seo saor bho chuingealachaidhean teicneòlach.

Bidh fònaichean eile le uidheamachd eadar-aghaidh guth (air an cruthachadh le companaidhean leithid RIM, Samsung no Motorola) gu cunbhalach a’ bualadh air a’ mhargaidh, a’ leigeil le luchd-cleachdaidh fònadh le guth no teachdaireachdan teacsa a chuir. Bha iad uile, ge-tà, ag iarraidh òrdughan sònraichte a chuimhneachadh agus am fuaimneachadh ann an cruth èigneachail, fuadain, a rèir comasan innealan na h-ùine sin. Dh'adhbhraich seo àireamh mhòr de mhearachdan, a dh'adhbhraich sin, an uair sin, mì-riarachas luchd-cleachdaidh.

Ach, tha sinn a-nis a’ dol a-steach do àm ùr de choimpiutaireachd, far a bheil adhartasan ann an ionnsachadh innealan agus leasachadh inntleachd fuadain a’ fuasgladh comas còmhraidh mar dhòigh ùr air eadar-obrachadh le teicneòlas (8). Tha an àireamh de dh'innealan a tha a 'toirt taic do eadar-obrachadh guth air fàs gu bhith na fheart cudromach a thug buaidh mhòr air leasachadh VUI. An-diugh, tha faisg air 1/3 de shluagh an t-saoghail mar-thà aig a bheil fònaichean sgairteil a dh'fhaodar a chleachdadh airson an seòrsa giùlan seo. Tha e coltach gu bheil a’ mhòr-chuid de luchd-cleachdaidh deiseil mu dheireadh gus an eadar-aghaidh guth atharrachadh.

8. Eachdraidh ùr-nodha mu leasachadh an eadar-aghaidh guth

Ach, mus urrainn dhuinn bruidhinn gu saor ri coimpiutair, mar a rinn na gaisgich A Space Odyssey, feumaidh sinn faighinn thairis air grunn dhuilgheadasan. Chan eil innealan fhathast fìor mhath air làimhseachadh nuances cànanach. A bharrachd air sin tha mòran dhaoine fhathast a’ faireachdainn mì-chofhurtail a’ toirt òrdughan gutha do einnsean sgrùdaidh.

Tha staitistigean a’ sealltainn gu bheil luchd-cuideachaidh guth air an cleachdadh gu sònraichte aig an taigh no am measg charaidean dlùth. Cha do dh’aidich gin den fheadhainn a chaidh an agallamh gun do chleachd iad sgrùdadh guth ann an àiteachan poblach. Ach, tha coltas ann gun tèid am bacadh seo à sealladh le sgaoileadh an teicneòlais seo.

ceist duilich gu teicnigeach

Is e an duilgheadas a tha mu choinneimh siostaman (ASR) a bhith a’ toirt a-mach dàta feumail bho chomharradh cainnt agus ga cheangal ri facal sònraichte aig a bheil brìgh sònraichte dha neach. Tha na fuaimean a thèid a dhèanamh eadar-dhealaichte gach turas.

Caochlaideachd chomharran cainnt Is e an t-seilbh nàdarra a th 'ann, leis a bheil sinn, mar eisimpleir, ag aithneachadh stràc no cainnt. Tha gnìomh sònraichte aig gach eileamaid den t-siostam aithne cainnte. Stèidhichte air a 'chomharra giullachd agus na crìochan aige, tha modail fuaimneach air a chruthachadh, a tha co-cheangailte ris a' mhodail cànain. Faodaidh an siostam aithneachaidh obrachadh air bunait àireamh bheag no mhòr de phàtranan, a tha a 'dearbhadh meud a' bhriathrachais leis a bheil e ag obair. Faodaidh iad a bhith faclairean beaga ann an cùis shiostaman a dh’ aithnicheas faclan no àitheantan fa leth, a bharrachd air stòran-dàta mòra anns a bheil co-ionann ris an t-seata cànain agus a’ toirt aire don mhodail cànain (gràmar).

Duilgheadasan a tha mu choinneamh eadar-aghaidh guth sa chiad àite tuig cainnt gu ceart, anns a bheil, mar eisimpleir, gu tric air am fàgail a-mach à sreathan gràmair slàn, bidh mearachdan cànanach is fònaidheach, mearachdan, dearmad, lochdan cainnte, homonyms, ath-aithris neo-iomchaidh, msaa. Co-dhiù is iad sin na dùilean.

Is e stòr dhuilgheadasan cuideachd comharran fuaimneach a bharrachd air an òraid aithnichte a thig a-steach do chuir a-steach an t-siostam aithneachaidh, i.e. a h-uile seòrsa eadar-theachd agus fuaim. Anns a 'chùis as sìmplidh, feumaidh tu iad sìoladh a-mach. Tha e coltach gu bheil an obair seo àbhaisteach agus furasta - às deidh a h-uile càil, tha grunn chomharran air an sìoladh agus tha fios aig a h-uile innleadair dealanach dè a nì iad ann an suidheachadh mar sin. Ach, feumar seo a dhèanamh gu faiceallach agus gu faiceallach ma tha toradh aithne cainnte gu bhith a’ coinneachadh ris na bha sinn an dùil.

Tha an sìoltachan a thathas a’ cleachdadh an-dràsta ga dhèanamh comasach a thoirt air falbh, còmhla ris a’ chomharra cainnt, am fuaim a-muigh a thog am micreofon agus feartan a-staigh a’ chomharra cainnt fhèin, a tha ga dhèanamh duilich aithneachadh. Ach, tha duilgheadas teicnigeach mòran nas iom-fhillte ag èirigh nuair a tha an casg air a’ chomharra cainnt sgrùdaichte ... comharra cainnt eile, is e sin, mar eisimpleir, còmhraidhean àrda mun cuairt. Tha a’ cheist seo aithnichte ann an litreachas mar an rud ris an canar . Feumaidh seo mar-thà cleachdadh dhòighean iom-fhillte, ris an canar. tiomnadh (fuasgladh) an comharra.

Chan eil na duilgheadasan le aithneachadh cainnt a’ tighinn gu crìch an sin. 'S fhiach toirt fa-near gu bheil cainnt a' giùlan iomadh diofar sheòrsaichean fiosrachaidh. Tha guth an duine a 'moladh gnè, aois, caractaran eadar-dhealaichte an neach-seilbh no staid a shlàinte. Tha roinn fharsaing de innleadaireachd bith-mheidigeach ann a tha a’ dèiligeadh ri bhith a’ lorg diofar ghalaran stèidhichte air na feartan fuaimneach a lorgar anns a’ chomharra cainnte.

Tha tagraidhean ann cuideachd far a bheil prìomh adhbhar mion-sgrùdadh fuaimneach air comharra cainnte an neach-labhairt aithneachadh no dearbhadh gur e esan a tha e ag ràdh a bhith (guth an àite iuchair, facal-faire no còd PUK). Faodaidh seo a bhith cudromach, gu sònraichte airson teicneòlasan togail snasail.

Is e a’ chiad phàirt de shiostam aithneachaidh cainnt микрофон. Ach, mar as trice chan eil mòran feum air a’ chomharra a thog am micreofon. Tha sgrùdaidhean a 'sealltainn gu bheil cruth agus cùrsa an fhuaim fuaim ag atharrachadh gu mòr a rèir an neach, astar na cainnte, agus gu ìre faireachdainnean an neach-conaltraidh - agus gu ìre bheag tha iad a' nochdadh fìor shusbaint nan òrdughan labhairteach.

Mar sin, feumaidh an comharra a bhith air a phròiseasadh gu ceart. Tha fuaimneachadh an latha an-diugh, fonaigs agus saidheans coimpiutaireachd còmhla a’ toirt seachad seata beairteach de dh’ innealan a dh’fhaodar a chleachdadh gus comharra cainnte a phròiseasadh, a mhion-sgrùdadh, aithneachadh agus a thuigsinn. Tha speactram fiùghantach a’ chomharra, ris an canar spectrograms fiùghantach. Tha iad gu math furasta an lorg, agus tha cainnt air a thaisbeanadh ann an cruth spectrogram fiùghantach gu ìre mhath furasta aithneachadh le bhith a’ cleachdadh dhòighean coltach ris an fheadhainn a thathas a’ cleachdadh ann an aithneachadh ìomhaighean.

Faodar eileamaidean sìmplidh de chainnt (mar eisimpleir, àitheantan) aithneachadh leis cho sìmplidh ‘s a tha spectrograms slàn. Mar eisimpleir, chan eil ann am faclair fòn-làimhe le guth ach beagan dheich gu beagan cheudan faclan is abairtean, mar as trice air a chruachadh ro-làimh gus an tèid an aithneachadh gu furasta agus gu h-èifeachdach. Tha seo gu leòr airson gnìomhan smachd sìmplidh, ach tha e gu mòr a’ cuingealachadh an tagraidh iomlan. Bidh siostaman a chaidh a thogail a rèir an sgeama, mar riaghailt, a 'toirt taic do luchd-labhairt sònraichte a-mhàin airson a bheil guthan air an trèanadh gu sònraichte. Mar sin ma tha cuideigin ùr ann a tha airson an guth a chleachdadh gus smachd a chumail air an t-siostam, is coltaiche nach tèid gabhail riutha.

Canar toradh an obrachaidh seo spectrogram 2-W, is e sin, speactram dà-thaobhach. Tha gnìomhachd eile sa bhloc seo as fhiach aire a thoirt dha - dealachadh. San fharsaingeachd, tha sinn a 'bruidhinn mu bhith a' briseadh suas comharra cainnt leantainneach gu pàirtean a dh'fhaodar aithneachadh air leth. Is ann a-mhàin bho na breithneachadh fa leth sin a tha an aithneachadh gu lèir air a dhèanamh. Tha feum air a 'mhodh-obrachaidh seo oir chan eil e comasach òraid fhada agus iom-fhillte a chomharrachadh aig an aon àm. Chaidh leabhraichean slàn a sgrìobhadh mu thràth mu dè na h-earrannan a bu chòir a chomharrachadh ann an comharra cainnt, agus mar sin cha bhith sinn a’ co-dhùnadh a-nis am bu chòir na roinnean cliùiteach a bhith nam phonemes (co-ionann fuaim), lidean, no is dòcha allophones.

Bidh am pròiseas aithneachaidh fèin-ghluasadach an-còmhnaidh a’ toirt iomradh air cuid de fheartan nithean. Chaidh na ceudan de sheataichean de pharamadairean eadar-dhealaichte a dhearbhadh airson a ‘chomharra cainnt Tha an comharra cainnt air a roinn ann am frèamaichean aithnichte agus aig a bheil feartan taghtefar a bheil na frèaman sin air an taisbeanadh sa phròiseas aithneachaidh, is urrainn dhuinn coileanadh (airson gach frèam fa leth) seòrsachadh, i.e. a 'sònrachadh aithnichear don fhrèam, a bhios ga riochdachadh san àm ri teachd.

An ath cheum cruinneachadh frèamaichean ann am faclan fa leth - mar as trice stèidhichte air a 'cho-ainm. modail de mhodailean iom-fhillte Markov (HMM-). An uairsin thig montage nam faclan seantansan iomlan.

Faodaidh sinn a-nis tilleadh gu siostam Alexa airson mionaid. Tha an eisimpleir aige a 'sealltainn pròiseas ioma-ìre de "thuigsinn" inneal neach - nas mionaidiche: òrdugh a thug e no ceist fhaighneachd.

Tha tuigse fhaclan, tuigse air brìgh, agus tuigse air rùn luchd-cleachdaidh nan rudan gu tur eadar-dhealaichte.

Mar sin, is e an ath cheum obair modal NLP (), agus is e an obair aige aithneachadh rùn neach-cleachdaidh, i.e. brìgh na h-àithne/ceist anns a’ cho-theacsa anns an deach a ràdh. Ma tha an rùn air a chomharrachadh, an uairsin sònrachadh sgilean agus comasan ris an canar, ie am feart sònraichte le taic bhon neach-cuideachaidh snasail. Ann an cùis ceist mun t-sìde, canar tobraichean dàta sìde, a tha fhathast ri bhith air a phròiseasadh gu cainnt (TTS - inneal). Mar thoradh air an sin, cluinnidh an neach-cleachdaidh freagairt na ceiste a chaidh fhaighneachd.

Guth? Ealain grafaigeach? No 's dòcha an dà chuid?

Tha a’ mhòr-chuid de shiostaman eadar-obrachaidh ùr-nodha stèidhichte air eadar-mheadhanair ris an canar eadar-aghaidh cleachdaiche grafaigeach (eadar-aghaidh grafaigeach). Gu mì-fhortanach, chan e an GUI an dòigh as follaisiche air eadar-obrachadh le toradh didseatach. Feumaidh seo gun ionnsaich luchd-cleachdaidh an toiseach mar a chleachdas iad an eadar-aghaidh agus gun cuimhnich iad am fiosrachadh seo le gach eadar-obrachadh às deidh sin. Ann an iomadh suidheachadh, tha guth tòrr nas goireasaiche, oir faodaidh tu eadar-obrachadh leis an VUI dìreach le bhith a’ bruidhinn ris an inneal. Tha eadar-aghaidh nach toir air luchd-cleachdaidh òrdughan sònraichte no dòighean eadar-obrachaidh a chuimhneachadh agus a chuimhneachadh ag adhbhrachadh nas lugha de dhuilgheadasan.

Gu dearbh, chan eil leudachadh VUI a’ ciallachadh a bhith a’ trèigsinn eadar-aghaidh nas traidiseanta - an àite sin, bidh eadar-aghaidh tar-chinealach rim faighinn a bhios a’ cothlamadh grunn dhòighean air eadar-obrachadh.

Chan eil an eadar-aghaidh guth freagarrach airson a h-uile gnìomh ann an co-theacsa gluasadach. Leis, cuiridh sinn fios gu caraid a tha a 'dràibheadh ​​​​càr, agus eadhon cuiridh sinn SMS thuige, ach faodaidh e a bhith ro dhoirbh sùil a thoirt air na gluasadan as ùire - air sgàth na tha de dh'fhiosrachadh air a ghluasad chun an t-siostaim () agus air a chruthachadh leis an t-siostam (siostam). Mar a tha Rachel Hinman a’ moladh anns an leabhar aice Mobile Frontier, bidh cleachdadh VUI nas èifeachdaiche nuair a bhios tu a’ coileanadh ghnìomhan far a bheil an ìre de dh’ fiosrachadh cuir a-steach is toraidh beag.

Tha fòn cliste ceangailte ris an eadar-lìn goireasach ach cuideachd mì-ghoireasach (9). Gach uair a tha neach-cleachdaidh ag iarraidh rudeigin a cheannach no seirbheis ùr a chleachdadh, feumaidh iad app eile a luchdachadh sìos agus cunntas ùr a chruthachadh. Tha raon airson cleachdadh agus leasachadh eadar-aghaidh guth air a chruthachadh an seo. An àite a bhith a’ toirt air luchd-cleachdaidh mòran aplacaidean eadar-dhealaichte a chuir a-steach no cunntasan fa-leth a chruthachadh airson gach seirbheis, tha eòlaichean ag ràdh gun gluais VUI eallach nan gnìomhan trom sin gu neach-cuideachaidh guth le cumhachd AI. Bidh e goireasach dha gnìomhan dìcheallach a dhèanamh. Cha toir sinn ach òrdughan dha.

9. Guth eadar-aghaidh tro fòn 'smart'

An-diugh, tha barrachd air dìreach fòn agus coimpiutair ceangailte ris an eadar-lìon. Tha teirmeastait snasail, solais, coireagan agus mòran innealan aonaichte IoT eile cuideachd ceangailte ris an lìonra (10). Mar sin, tha innealan gun uèir timcheall oirnn a lìonas ar beatha, ach chan eil iad uile a’ freagairt gu nàdarra ris an eadar-aghaidh cleachdaiche grafaigeach. Cuidichidh cleachdadh VUI thu gu furasta am filleadh a-steach don àrainneachd againn.

10. Eadar-aghaidh guth le eadar-lìn nan rudan

Bidh cruthachadh eadar-aghaidh cleachdaiche guth gu bhith na phrìomh sgil dealbhaidh a dh’ aithghearr. Is e fìor dhuilgheadas a tha seo - brosnaichidh an fheum air siostaman guth a chuir an gnìomh thu gus barrachd fòcas a chuir air dealbhadh for-ghnìomhach, is e sin, a ’feuchainn ri rùintean tùsail an neach-cleachdaidh a thuigsinn, a’ sùileachadh na feumalachdan agus na dùilean aca aig gach ìre den chòmhradh.

Tha guth na dhòigh èifeachdach air dàta a chuir a-steach - leigidh e le luchd-cleachdaidh òrdughan a chuir a-mach gu sgiobalta chun t-siostam a rèir an teirmean fhèin. Air an làimh eile, tha an sgrion a 'toirt seachad dòigh èifeachdach air fiosrachadh a thaisbeanadh: leigidh e le siostaman tòrr fiosrachaidh a thaisbeanadh aig an aon àm, a' lùghdachadh an eallach air cuimhne luchd-cleachdaidh. Tha e loidsigeach gu bheil e brosnachail a bhith gan cur còmhla ann an aon shiostam.

Chan eil luchd-labhairt snasail mar an Amazon Echo agus Google Home a’ tabhann taisbeanadh lèirsinneach idir. A 'leasachadh gu mòr air neo-mhearachdachd aithne guth aig astaran meadhanach, bidh iad a' ceadachadh obrachadh gun làmhan, a tha an uair sin a 'meudachadh an sùbailteachd agus an èifeachdas - tha iad ion-mhiannaichte eadhon dha luchd-cleachdaidh aig a bheil fònaichean sgairteil le smachd guth mar-thà. Ach, tha dìth sgrion na chuingealachadh mòr.

Chan urrainnear ach beeps a chleachdadh gus fios a thoirt do luchd-cleachdaidh mu òrdughan a dh’ fhaodadh a bhith ann, agus bidh leughadh an toraidh a-mach a ’fàs sgìth ach a-mhàin na gnìomhan as bunaitiche. Tha e math a bhith a’ suidheachadh timer le àithne guth fhad ‘s a tha thu a’ còcaireachd, ach chan eil feum air toirt ort faighneachd dè an ùine a tha air fhàgail. Bidh a bhith a’ faighinn ro-aithris sìde cunbhalach gu bhith na dheuchainn cuimhne don neach-cleachdaidh, a dh’ fheumas èisteachd agus gabhail ri sreath de fhìrinnean fad na seachdain, seach a bhith gan togail bhon sgrion sa bhad.

Tha an luchd-dealbhaidh mu thràth fuasgladh tar-chinealach, Echo Show (11), a chuir scrion taisbeanaidh ris an neach-labhairt smart bunaiteach Echo. Tha seo gu mòr a’ leudachadh comas-gnìomh an uidheamachd. Ach, chan eil an Echo Show fhathast cho comasach air na gnìomhan bunaiteach a tha air a bhith rim faighinn o chionn fhada air fònaichean sgairteil agus clàran a choileanadh. Chan urrainn dha (fhathast) surfadh air an lìon, lèirmheasan a nochdadh, no susbaint cairt bhùthan Amazon a thaisbeanadh, mar eisimpleir.

Tha taisbeanadh lèirsinneach na dhòigh nas èifeachdaiche air beairteas fiosrachaidh a thoirt do dhaoine na dìreach fuaim. Faodaidh dealbhadh le prìomhachas guth leasachadh mòr a thoirt air eadar-obrachadh guth, ach san fhad-ùine, gu neo-riaghailteach bidh gun a bhith a’ cleachdadh a’ chlàr lèirsinneach airson eadar-obrachadh mar a bhith a’ sabaid le aon làmh ceangailte air cùl do dhruim. Mar thoradh air cho iom-fhillte ‘s a tha eadar-aghaidh guth is taisbeanaidh tùrail deireadh-gu-deireadh, bu chòir do luchd-leasachaidh beachdachadh gu mòr air dòigh-obrach tar-chinealach a thaobh eadar-aghaidh.

Le bhith ag àrdachadh èifeachdas agus astar siostaman gineadh cainnt agus aithneachaidh tha e comasach an cleachdadh ann an tagraidhean agus raointean mar, mar eisimpleir:

• armachd (àitheantan gutha ann am plèanaichean no heileacoptairean, mar eisimpleir, F16 VISTA),

• tar-sgrìobhadh teacsa fèin-ghluasadach (cainnt gu teacsa),

• siostaman fiosrachaidh eadar-ghnìomhach (Prime Speech, puirt guth),

• innealan-làimhe (fònaichean, fònaichean sgairteil, clàran),

• robotics (Cleverbot - siostaman ASR còmhla ri inntleachd fuadain),

• càraichean (smachd gun làmhan air co-phàirtean càr, leithid Blue & Me),

• iarrtasan dachaigh (siostaman dachaigh smart).

Thoir an aire airson sàbhailteachd!

Tha càraichean, innealan dachaigh, siostaman teasachaidh / fuarachaidh agus tèarainteachd dachaigh, agus grunn innealan dachaigh a’ tòiseachadh a ’cleachdadh eadar-aghaidh guth, gu tric stèidhichte air AI. Aig an ìre seo, thèid an dàta a gheibhear bho mhilleanan de chòmhraidhean le innealan a chuir gu sgòthan coimpiutaireachd. Tha e soilleir gu bheil ùidh aig luchd-margaidh annta. Agus chan e a-mhàin iad.

Tha aithisg o chionn ghoirid bho eòlaichean tèarainteachd Symantec a’ moladh nach bi smachd aig luchd-cleachdaidh àithne guth air feartan tèarainteachd leithid glasan dorais, gun luaidh air siostaman tèarainteachd dachaigh. Tha an aon rud fìor airson faclan-faire no fiosrachadh dìomhair a stòradh. Cha deach sgrùdadh gu leòr a dhèanamh fhathast air tèarainteachd inntleachd fuadain agus toraidhean snasail.

Nuair a bhios innealan air feadh an dachaigh ag èisteachd ris a h-uile facal, bidh an cunnart bho bhith a’ slaodadh is a’ mì-chleachdadh an t-siostaim gu bhith na chùis air leth cudromach. Ma gheibh neach-ionnsaigh cothrom air an lìonra ionadail no na seòlaidhean puist-d co-cheangailte ris, faodar na roghainnean inneal snasail atharrachadh no ath-shuidheachadh gu suidheachadh factaraidh, a lean gu call fiosrachadh luachmhor agus cuir às do eachdraidh luchd-cleachdaidh.

Ann am faclan eile, tha eagal air proifeiseantaich tèarainteachd nach eil AI agus VUI le guth fhathast tapaidh gu leòr gus ar dìon bho chunnartan a dh’ fhaodadh a bhith ann agus ar beul a chumail dùinte nuair a dh’ iarras coigreach rudeigin.

Cuir beachd ann