मुखपृष्ठ » कैसे » एलेक्सा, सिरी, और Google एक शब्द नहीं समझे जो आप कहते हैं

    एलेक्सा, सिरी, और Google एक शब्द नहीं समझे जो आप कहते हैं

    वीरांगना

    एलेक्सा, गूगल असिस्टेंट और सिरी जैसे वॉयस असिस्टेंट ने पिछले कुछ सालों में एक लंबा सफर तय किया है। लेकिन, उनके सभी सुधारों के लिए, एक चीज उन्हें वापस रखती है: वे आपको नहीं समझते हैं। वे विशिष्ट वॉइस कमांड पर बहुत अधिक भरोसा करते हैं.

    स्पीच रिकॉग्निशन सिर्फ एक मैजिक ट्रिक है

    वीरांगना

    वॉयस असिस्टेंट आपको समझ नहीं पाते हैं। वास्तव में, वैसे भी नहीं। जब आप Google होम या अमेज़ॅन इको से बात करते हैं, तो यह अनिवार्य रूप से आपके शब्दों को टेक्स्ट स्ट्रिंग में बदल देता है और फिर उसकी तुलना अपेक्षित कमांड से करता है। यदि यह एक सटीक मिलान पाता है, तो यह निर्देशों के एक सेट का अनुसरण करता है। यदि ऐसा नहीं होता है, तो यह इस बात का विकल्प तलाशता है कि उसके पास क्या जानकारी है, उसके आधार पर क्या करना है, और अगर वह काम नहीं करता है तो आपको विफलता संदेश नहीं मिलता है जैसे कि "मुझे क्षमा करें, लेकिन मुझे नहीं पता है कि । "यह आपको समझने में चकरा देने के लिए हाथ के जादू से बहुत कम है.

    यह सबसे अच्छा अनुमान लगाने के लिए प्रासंगिक सुराग का उपयोग नहीं कर सकता है, या यहां तक ​​कि अपने निर्णयों को सूचित करने के लिए समान विषयों की समझ का उपयोग कर सकता है। आवाज सहायकों को यात्रा करना कठिन नहीं है। जब आप एलेक्सा से पूछ सकते हैं "क्या आप एनएसए के लिए काम करते हैं?" और एक उत्तर प्राप्त करें, यदि आप पूछते हैं कि "क्या आप गुप्त रूप से एनएसए का हिस्सा हैं?" तो आपको "मुझे नहीं पता है कि एक" प्रतिक्रिया (कम से कम) इस लेखन का समय).

    मनुष्य, जो वास्तव में भाषण को समझते हैं, इस तरह से काम नहीं करते हैं। मान लीजिए कि आप एक मानव से पूछते हैं, '' आकाश में वह कलवर्न क्या है? वह जो धनुषाकार है, और लाल, नारंगी, पीला और नीला जैसे धारीदार रंगों से भरा हुआ है। ”कलवर्न का बना-बनाया शब्द होने के बावजूद, आपके द्वारा पूछा गया व्यक्ति संभवतः उस संदर्भ से समझ सकता है जिसे आप इंद्रधनुष का वर्णन कर रहे हैं।.

    जब आप यह तर्क दे सकते हैं कि एक मानव विचारों को भाषण में परिवर्तित कर रहा है, तो एक मानव एक उत्तर को समाप्त करने के लिए ज्ञान और समझ को लागू कर सकता है। यदि आप किसी मानव से पूछते हैं कि क्या वे गुप्त रूप से एनएसए के लिए काम करते हैं, तो वे आपको हाँ या कोई जवाब नहीं देंगे, भले ही वह उत्तर झूठ हो। एक मानव यह नहीं कहेगा कि "मुझे नहीं पता है कि एक" उस तरह का सवाल है। मनुष्य झूठ बोल सकता है जो वास्तविक समझ के साथ आता है.

    आवाज सहायक उनके प्रोग्रामिंग से परे नहीं जा सकते

    वॉयस असिस्टेंट अंततः प्रोग्राम किए गए अपेक्षित मापदंडों तक ही सीमित हैं, और उनके बाहर भटकने से प्रक्रिया टूट जाएगी। यह तथ्य दिखाता है कि तीसरे पक्ष के उपकरण कब खेलने के लिए आते हैं। आमतौर पर, उन लोगों के साथ बातचीत करने का आदेश बहुत ही लापरवाह है, "वैकल्पिक तर्क को बताने के लिए डिवाइस निर्माता को बताएं।" इसका एक सटीक उदाहरण होगा: "ड्रायर को रोकने के लिए व्हर्लपूल को बताएं।" कौशल कुछ GE ओवन को नियंत्रित करता है। कौशल के एक उपयोगकर्ता को "जिनेवा को बताने के लिए" याद करने की आवश्यकता है "जीई को न बताएं" फिर शेष कमांड। और जब आप इसे ओवन को 350 डिग्री तक गर्म करने के लिए कह सकते हैं, तो आप तापमान को 50 डिग्री तक बढ़ाने के अनुरोध के साथ पालन नहीं कर सकते। एक मानव हालांकि इन अनुरोधों का पालन कर सकता है.

    अमेज़न और Google ने इन बाधाओं को दूर करने के लिए बहुत मेहनत की है, और यह दिखाता है। जहां एक बार आपको स्मार्ट लॉक को नियंत्रित करने के लिए उपरोक्त अनुक्रम का पालन करना था, अब आप इसके बजाय "सामने के दरवाजे को लॉक" कह सकते हैं। अलेक्सा "मुझे एक कुत्ता चुटकुला बताओ" से भ्रमित हुआ करता था, लेकिन आज एक के लिए पूछें, और यह काम करेगा। उन्होंने आपके द्वारा उपयोग किए जाने वाले आदेशों में विविधताएं जोड़ी हैं, लेकिन अंततः आपको अभी भी कहने के लिए सही आदेश जानना होगा। आपको सही क्रम में, सही सिंटैक्स का उपयोग करने की आवश्यकता है.

    और अगर आपको लगता है कि एक कमांड लाइन की तरह लगता है, तो आप गलत नहीं हैं.

    वॉयस असिस्टेंट एक फैंसी कमांड लाइन है

    एक कमांड लाइन को सरल कार्यों को करने के लिए संकीर्ण रूप से परिभाषित किया गया है, लेकिन केवल तभी जब आप उचित वाक्यविन्यास जानते हों। यदि आप उस सही सिंटैक्स से बाहर निकलते हैं और dir के बजाय dyr टाइप करते हैं, तो कमांड प्रॉम्प्ट आपको एक त्रुटि संदेश देगा। आप कमांड को याद रखने के लिए उपनामों का उपयोग आसानी से कर सकते हैं, लेकिन आपको इस बात का अंदाजा है कि मूल कमांड क्या थे, वे कैसे काम करते हैं, और कुशलता से उपनाम का उपयोग कैसे करें। यदि आप कमांड लाइन के ins और out सीखने के लिए समय नहीं लेते हैं, तो आप कभी भी इससे बाहर नहीं निकलेंगे.

    वॉइस असिस्टेंट अलग नहीं हैं। आपको कमांड कहने या कोई प्रश्न पूछने का सही तरीका पता होना चाहिए। और आपको यह जानने की आवश्यकता है कि Google और एलेक्सा के लिए समूह कैसे सेट करें, आपके उपकरणों का समूह बनाना क्यों आवश्यक है, और अपने स्मार्ट उपकरणों का नाम कैसे दिया जाए। यदि आप इन आवश्यक कदमों का पालन नहीं करते हैं, तो आप अपने वॉयस असिस्टेंट से केवल अध्ययन को बंद करने के लिए कहे जाने की हताशा महसूस करेंगे, यह पूछे जाने पर कि "कौन सा अध्ययन" बंद किया जाना चाहिए.

    जब आप सही क्रम में सही सिंटैक्स का उपयोग करते हैं, तब भी प्रक्रिया विफल हो सकती है। या तो गलत प्रतिक्रिया के साथ जारी किया गया या एक आश्चर्यजनक परिणाम। एक ही घर में दो Google होम थोड़ा अलग स्थानों के लिए मौसम दे सकते हैं, भले ही उनके पास एक ही उपयोगकर्ता खाता जानकारी और इंटरनेट कनेक्शन हो.

    उपरोक्त उदाहरण में, कमांड "आधे घंटे के लिए एक टाइमर सेट करें" दिया गया है। Google होम हब ने "आवर" नाम का एक टाइमर बनाया और फिर पूछा कि टाइमर कितने समय के लिए होना चाहिए। और फिर भी उसी आदेश को दोहराते हुए तीन बार सही तरीके से काम किया और 30 मिनट का टाइमर बनाया। कमांड "30 मिनट के लिए टाइमर सेट करें" का उपयोग करना अधिक सुसंगत आधार पर सही ढंग से काम करता है.

    जबकि Google होम या इको में बोलना अधिक तरल हो सकता है, हूड वॉयस असिस्टेंट के तहत और कमांड लाइन उसी तरह काम करते हैं। आपको एक नई भाषा सीखने की आवश्यकता नहीं हो सकती है, लेकिन आपको एक नई बोली सीखने की आवश्यकता है.

    आवाज सहायकों की संकीर्ण समझ विकास को सीमित करेगी

    इनमें से कोई भी Google असिस्टेंट और एलेक्सा जैसे वॉयस असिस्टेंट को अच्छी तरह से काम करने से रोकता है (हालाँकि Cortana एक अलग कहानी है)। Google सहायक और एलेक्सा और प्रश्नों के लिए ऑनलाइन खोज करते हैं, हालांकि आश्चर्यजनक रूप से Google खोज में बेहतर नहीं है, और माप रूपांतरण और सरल गणित जैसे बुनियादी सवालों का जवाब दे सकता है। स्मार्ट होम और अच्छी तरह से प्रशिक्षित उपयोगकर्ता को सही ढंग से सेट करने के साथ, अधिकांश स्मार्ट होम कमांड इरादा के अनुसार काम करेंगे। लेकिन यह काम और प्रयास से आया, बौद्धिक समझ से नहीं.

    टाइमर और अलार्म सरल हुआ करते थे। समय के साथ नामकरण जोड़ा गया, फिर टाइमर में समय जोड़ने की क्षमता। वे सरलीकृत से अधिक जटिल हो गए। वॉयस असिस्टेंट अधिक प्रश्नों का उत्तर दे सकता है, और प्रत्येक दिन नए कौशल और विशेषताएं लाता है। लेकिन यह आत्म-विकास का उत्पाद नहीं है जो सीखने और समझने से आता है.

    और जो अज्ञात में पहुंचने के लिए जाना जाता है, उसका उपयोग करने की अंतर्निहित क्षमता का उद्धार नहीं करता है। काम करने वाले हर आदेश और प्रश्न के लिए, हमेशा तीन नहीं होंगे। बिना किसी सफलता के ए.आई. यह समझने की क्षमता मानव जैसी है, वॉयस असिस्टेंट सहायक नहीं हैं। वे सही परिदृश्य में केवल वॉयस कमांड लाइन-उपयोगी हैं, लेकिन उन परिदृश्यों तक सीमित हैं जिन्हें उन्हें समझने के लिए प्रोग्राम किया गया है.

    दूसरे शब्दों में: मशीनें चीजें सीख रही हैं, लेकिन उन्हें समझ नहीं सकते हैं.