कैट स्पीच ट्रांसलेशन ऐप्स कैसे काम करते हैं?

कैट स्पीच ट्रांसलेशन ऐप्स कैसे काम करते हैं?

आपने शायद ऐसे ऐप्स देखे होंगे जो आपकी बिल्ली जो कह रहे हैं उसका अनुवाद करने का दावा करते हैं। लेकिन क्या वे वास्तव में आपकी बिल्ली की म्याऊ का अंग्रेजी में अनुवाद कर सकते हैं? संक्षिप्त उत्तर हां, तरह का है। यह मुश्किल है क्योंकि प्रत्येक बिल्ली की 'भाषा' कितनी अनोखी है, लेकिन वे आधुनिक तकनीक के साथ काफी करीब आ सकते हैं।





MeowTalk जैसे कैट ट्रांसलेशन ऐप्स स्पीच रिकग्निशन के एक रूप का उपयोग करते हैं जो मशीन लर्निंग पर जोर देता है। आइए करीब से देखें।





वाक् पहचान और मशीन लर्निंग

मैरी थेरेसा मैकलीन/ पिक्साबे





वाक् पहचान भाषण रिकॉर्ड करके और ऑडियो को डिजिटल डेटा फ़ाइल में बदलकर काम करती है। यह पिच और वॉल्यूम जैसे डेटा को डेटा पॉइंट के रूप में एन्कोड करता है जिसका ऐप विश्लेषण कर सकता है और अर्थ के साथ मेल खा सकता है। डीपीए माइक्रोफोन बताते हैं कि ये डेटा बिंदु पृष्ठभूमि ध्वनियों और किसी शब्द को कैसे बोला जाता है, के आधार पर बहुत भिन्न दिख सकते हैं।

हम कभी-कभी आवाज की पहचान को हल्के में लेते हैं, लेकिन यह तकनीक का एक अविश्वसनीय कारनामा है। विशेष रूप से यह देखते हुए कि मानव भाषण कितना जटिल है। जैसा वैज्ञानिक बताते हैं, प्रत्येक शब्द में एक दूसरे में मिश्रित ध्वनि या 'स्वनिम' की एक विस्तृत श्रृंखला शामिल होती है। भाषण को समझने के लिए कंप्यूटर प्राप्त करना बहुत कठिन है। बिल्ली की आवाज़ की नई सीमा और भी कठिन होगी।



वाक् पहचान का उपयोग करने वाले ऐप्स को शब्दों की 'शब्दावली' के साथ प्रोग्राम किया जाता है जिसे डेटासेट कहा जाता है। ऐप तब आपके भाषण को अपने डेटा-शब्दावली में निकटतम विकल्प से मिलाता है।

जब यह कोई गलती करता है, तो आप उसे सुधारते हैं, और यह उस डेटा को अगली बार सहेजता है। यह मशीन लर्निंग का हिस्सा है। इस तरह एक प्रोग्राम भाषण को पहचानना सीखता है, भले ही वह उस डेटासेट के समान न हो, जिसके साथ उसने शुरुआत की थी।





सम्बंधित: मशीन लर्निंग एल्गोरिदम क्या हैं? यहां बताया गया है कि वे कैसे काम करते हैं

आवाज पहचान में अभी भी समस्याएं हैं, खासकर भाषण बाधाओं और उच्चारण के साथ। हालांकि, कुछ कंपनियां इन मुद्दों को दूर करने के लिए मशीन लर्निंग में सुधार कर रही हैं। समय के साथ, मशीन लर्निंग वाक् पहचान को एक शक्तिशाली उपकरण में बदल सकता है।





मेरे आस-पास कुत्ते बेचने वाली जगहें

इसी तरह वाक् पहचान मनुष्यों के लिए काम करती है। लेकिन क्या यह बिल्लियों के लिए काम करता है?

वाक् पहचान बनाम म्याऊ पहचान

एरियाना सुआरेज़ / unsplash

सबसे पहले, हमें यह समझने की जरूरत है कि एक खास तरह की म्याऊ का 'मैं भूखा हूं' के रूप में अनुवाद करना मानव भाषण के विश्लेषण से अलग क्यों है। समस्या ज्यादातर यह है कि बिल्ली संचार मुद्रा जैसे अशाब्दिक संकेतों पर अधिक निर्भर करता है। एक अन्य समस्या एक सार्वभौमिक 'बिल्ली भाषा' का अभाव है।

के अनुसार एएसपीसीए , वयस्क जंगली बिल्लियाँ कभी एक दूसरे पर म्याऊ नहीं करतीं, केवल लोगों पर। द्वारा अन्य शोध मानवीय समाज जोड़ता है कि वे ध्वनियाँ 'निर्वात में नहीं होती हैं।' हमें उनकी बॉडी लैंग्वेज और अन्य संदर्भों के साथ व्याख्या करनी चाहिए। कई मामलों में, ये मूक संकेत एक म्याऊ के बीच का एकमात्र अंतर है जिसका अर्थ है 'मुझे भूख लगी है' और एक जिसका अर्थ है 'मैं खेलना चाहता हूं।'

इस समस्या को जोड़ते हुए, किसी भी दो बिल्लियों की भाषा समान नहीं होती है। बिल्लियाँ अपने मालिकों के लिए व्यक्तिगत 'भाषाएँ' विकसित करती हैं। ये आंशिक रूप से मालिक की आवाज की नकल पर और आंशिक रूप से बिल्ली के व्यक्तित्व पर आधारित होते हैं। कोई भी दो बिल्लियाँ एक जैसी नहीं बोलतीं, भले ही एक ही इच्छा या आवश्यकता को व्यक्त कर रही हों। तो एक ऐप की भाषण शब्दावली उन सभी के लिए कैसे अनुवाद कर सकती है?

बिल्लियों के लिए लचीली मशीन लर्निंग

ध्वनि का उपयोग करने के लिए नि: शुल्क / unsplash

हालांकि कुछ वर्चुअल असिस्टेंट पसंद करते हैं ऑटो स्वर और भावना को समझने का प्रयास, अशाब्दिक संकेतों पर वाक् पहचान अभी भी भयानक है। लेकिन इसका मतलब यह नहीं है कि उनकी व्याख्या करना असंभव है।

एंड्रॉइड पर टेक्स्ट मैसेज कैसे फॉरवर्ड करें

MeowTalk इन मुद्दों को दूर करने में मदद करने के लिए अधिक लचीली प्रकार की मशीन लर्निंग का उपयोग करता है।

डाउनलोड: म्याऊटॉक फॉर एंड्रॉयड | आईओएस (नि: शुल्क)

Meowtalk को जेवियर सांचेज ने बनाया था, जिन्होंने एलेक्सा टीम में भी काम किया था। उन्होंने ऐप को स्मार्ट कॉलर की ओर एक कदम के रूप में देखा। ये कॉलर बिल्ली की आवाज़ को मानव भाषण में अनुवाद करेंगे, जटिल मशीन सीखने की रणनीतियों पर चित्रण करेंगे ताकि मनुष्यों को उनकी बिल्लियों को बेहतर ढंग से समझने और उनकी देखभाल करने में मदद मिल सके।

MeowTalk टीम ने प्रत्येक बिल्ली के लिए अधिक विशिष्ट प्रोफाइल बनाकर विशिष्टता के मुद्दों के लिए मुआवजा दिया। ऐप में, आप प्रत्येक बिल्ली को अलग से पंजीकृत करते हैं। विज्ञान नॉर्वे रिपोर्ट करता है कि बिल्ली के बच्चे वयस्क बिल्लियों की तुलना में अलग तरह से म्याऊ करते हैं, इसलिए ऐप बिल्ली के जन्मदिन के बारे में भी पूछता है। प्रत्येक प्रोफ़ाइल बिल्ली के लिए एक अद्वितीय डेटा नेटवर्क उत्पन्न करती है, जिसमें मशीन सीखने में थोड़ी सी गहरी शिक्षा शामिल होती है।

संबंधित: डीप लर्निंग बनाम मशीन लर्निंग बनाम एआई: वे एक साथ कैसे चलते हैं?

शब्दावली के लिए, MeowTalk अपने डेटासेट में 10 ध्वनि प्रोफाइल के साथ शुरू होता है। प्रत्येक का एक अलग अर्थ जुड़ा होता है, जैसे 'खुश' या 'शिकार'। जब ऐप कोई ध्वनि सुनता है और गलत हो जाता है, तो आप या तो उसे ठीक कर सकते हैं या एक नई व्याख्या बना सकते हैं।

CATSOUNDS डेटा . से एकत्र किया गया एक्वेलोन

सुधार ऐप को मूल शब्दावली को नई ध्वनि से बदलने के लिए कहता है।

बाहरी यूएसबी ड्राइव दिखाई नहीं दे रहा है

उदाहरण के लिए, आप ऐप को 'हंटिंग' का मिलान लंबी चिल्लाहट के बजाय छोटी चिड़ियों से करने के लिए कह सकते हैं। इस तरह का सुधार एक अर्थ के साथ मेल खाने के लिए कई ध्वनियों को जोड़ने से अधिक उपयोगी है जिस तरह से वाक् पहचान डो, जो ऐप को यह बताने जैसा होगा कि एक लंबी चिल्लाहट और छोटी चहकती है दोनों मतलब 'मदर कॉल।'

स्पीच रिकग्निशन ऐप्स में मशीन लर्निंग आमतौर पर इस प्रकार की ओवरराइटिंग का विरोध करता है। यह सिरी को सिखाने की कोशिश करने जैसा होगा कि जब आप 'प्रौद्योगिकी ब्लॉग' कहते हैं, तो आपका वास्तव में 'नाशपाती' होता है। लेकिन मशीन लर्निंग का अधिक लचीला रूप जिसका उपयोग मेवटॉक करता है, इस सुधार को अधिक आसानी से संभाल सकता है।

एक नई व्याख्या बनाने से एक ऐसा अर्थ जुड़ जाता है जो पहले एन्कोड नहीं किया गया था। उदाहरण के लिए, यदि आपकी बिल्ली के पास एक विशिष्ट कॉल है जब वह अपना पसंदीदा खिलौना चाहती है, तो आप एक विकल्प के रूप में 'आई वांट माई माउस' जोड़ सकते हैं। यह आपके स्वत: सुधार शब्दकोश में एक शब्द जोड़ने के समान है।

सम्बंधित: Android पर अपने स्वयं के स्वत: सुधार शब्दों को कैसे परिभाषित करें

समय के साथ, आप अपनी बिल्ली के लिए एक अत्यधिक व्यक्तिगत भाषण प्रोफ़ाइल विकसित कर सकते हैं। आखिरकार, यह पालतू जानवरों के लिए उपयोगी होने या व्यवहार संबंधी मुद्दों को हल करने के लिए पर्याप्त परिष्कृत भी हो सकता है। यदि और कुछ नहीं, तो यह बिल्ली के मालिकों को अपने पालतू जानवरों के प्रति अधिक चौकस रहने में मदद करता है।

फैसले: क्या कैट ट्रांसलेशन ऐप्स काम करते हैं?

अंत में, 'कैट ट्रांसलेशन' अभी भी ऐप को सिखाने वाले उपयोगकर्ता पर निर्भर करता है कि उनकी बिल्ली कैसे बात करती है। यह शायद हमेशा ऐसा ही होगा क्योंकि प्रत्येक बिल्ली का संचार कितना अनूठा होता है।

लेकिन यह तथ्य कि मशीन लर्निंग इतनी आगे आ गई है कि डेवलपर्स आंशिक रूप से भी इसमें सफल हो सकते हैं, अविश्वसनीय है। मशीन लर्निंग और एआई ब्रेकनेक गति से आगे बढ़ रहे हैं, और हम यह देखने के लिए इंतजार नहीं कर सकते कि वे आगे कहां जाते हैं।

साझा करना साझा करना कलरव ईमेल संबंधित विषय
  • प्रौद्योगिकी की व्याख्या
  • भाषा सीखने
  • मशीन लर्निंग
लेखक के बारे में नताली स्टीवर्ट(47 लेख प्रकाशित)

नताली स्टीवर्ट MakeUseOf की लेखिका हैं। वह पहली बार कॉलेज में प्रौद्योगिकी में रुचि रखने लगीं और विश्वविद्यालय में मीडिया लेखन के लिए एक जुनून विकसित किया। नताली का ध्यान ऐसी तकनीक पर है जो सुलभ और उपयोग में आसान है, और उसे ऐसे ऐप्स और डिवाइस पसंद हैं जो साधारण लोगों के जीवन को आसान बनाते हैं।

नताली स्टीवर्ट की अन्य फ़िल्में-टीवी शो

हमारे न्यूज़लेटर की सदस्यता लें

तकनीकी युक्तियों, समीक्षाओं, निःशुल्क ई-पुस्तकों और अनन्य सौदों के लिए हमारे न्यूज़लेटर से जुड़ें!

सब्सक्राइब करने के लिए यहां क्लिक करें