विज्ञापन
तीनों प्रमुख फोन प्लेटफार्मों में अब अपनी आवाज है। Apple में सिरी है, Microsoft के पास Cortana है, और Google के पास है कुछ हद तक कम गूगल अब 6 Google नाओ सुविधाएँ जो आपको खोज कैसे बदलेंगी आप अपने Android डिवाइस पर पहले से ही Google नाओ का उपयोग कर रहे हैं, लेकिन क्या आपको वह सब मिल रहा है जो आप इससे बाहर कर सकते हैं? इन छोटी विशेषताओं के बारे में जानना एक बड़ा बदलाव ला सकता है। अधिक पढ़ें .
ये सिस्टम आपको आवाज नियंत्रण के माध्यम से बुनियादी कार्यों को संभालने देता है। प्रत्येक एक प्रकार का वर्चुअल सेक्रेटरी होता है जो सरल सवालों के जवाब दे सकता है, ऐप खोल सकता है, नोट्स बना सकता है और मैसेज रिले कर सकता है। वे उपयोगी हैं, लेकिन वे भी निराशा से सीमित हैं। वे ऐसा कुछ भी नहीं कर सकते हैं जिसके लिए उन्हें स्पष्ट रूप से प्रोग्राम नहीं किया गया है, और कई कार्य केवल उनकी क्षमताओं से परे हैं।
हालाँकि, ऐसी कई प्रौद्योगिकियाँ विकसित की जा रही हैं, जो इन प्रणालियों को नाटकीय रूप से बेहतर बनाने जा रही हैं - और वे केवल कुछ वर्षों में व्यावसायिक रूप से उपलब्ध होने वाली हैं। यहाँ शीर्ष पाँच तरीके हैं जिनसे आपका फ़ोन पूरी तरह से स्मार्ट हो जाएगा।
यह देखना होगा कि आप क्या देख रहे हैं
भाषण मान्यता ने शक्तिशाली न्यूरल नेटवर्क के विकास के लिए पिछले पांच वर्षों में भारी प्रगति की है। आधुनिक स्मार्टफोन आश्चर्यजनक सटीकता के साथ भाषण की पहचान कर सकते हैं (यह Google नाओ के बाद से थोड़ी देर के लिए है मुझे गलत समझा गया है), और यहां तक कि उनके आधार पर गाने और टेलीविजन शो की पहचान करने जैसे सामान भी कर सकते हैं ऑडियो।
यह बहुत अच्छा है - लेकिन यह केवल शुरुआत है। मनुष्य मुख्य रूप से ध्वनि के माध्यम से दुनिया के साथ बातचीत नहीं करता है। हम व्यावहारिक रूप से सब कुछ के लिए दृष्टि का उपयोग करते हैं - और जल्द ही, हमारी मशीनें भी। हम Google ग्लास और जैसे पहले पहनने योग्य हेडसेट डिस्प्ले की शुरुआत देखना शुरू कर रहे हैं Microsoft का HoloLens Microsoft बिल्ड सम्मेलन में नए HoloLens प्रदर्शन दिखाता हैMicrosoft का आगामी HoloLens हेडसेट पहला हाई-एंड संवर्धित रियलिटी डिवाइस है जिसे जनता को दिखाया गया है। क्या यह अभी भी एक काल्पनिक संपर्क या एक तकनीक है जो एहसास के पास है? अधिक पढ़ें , जो आपके स्मार्टफ़ोन को आपके स्मार्टफ़ोन की जानकारी, दृश्य जानकारी की एक समृद्ध और हमेशा आपूर्ति प्रदान कर सकता है। कई पर्यवेक्षक, खुद को शामिल करते हैं, उम्मीद करते हैं कि ये अगले पांच वर्षों में आम हो जाएंगे।
तो आपका फोन इस सारे डेटा का क्या कर सकता है?
बहुत सारे। Google पहले ही प्रदर्शन कर चुका है उनके टैंगो टैबलेट के साथ Google आपके स्मार्टफ़ोन पर 3D कैमरा लगाना चाहता है - यहाँ क्यों हैGoogle का प्रोजेक्ट टैंगो मोबाइल उपकरणों के लिए 3 डी सेंसर ला रहा है। यहाँ हम अब तक क्या जानते हैं। अधिक पढ़ें यह है कि एक गहन कैमरा भौतिक वस्तुओं के स्थानिक स्थान को अत्यधिक उच्च सटीकता के साथ निर्धारित कर सकता है। इसी तरह, मशीन की दृष्टि में कुछ आश्चर्यजनक प्रगति हुई हैं - जैसे कि माइक्रोसॉफ्ट का तंत्रिका नेटवर्क व्यक्तिगत कुत्ते की नस्लों की पहचान करेंऔर Google का तंत्रिका नेटवर्क जो कर सकते हैं तस्वीरों की सामग्री का सही वर्णन करें. कुल मिलाकर, ये प्रौद्योगिकियां अनुप्रयोगों की एक पूरी दुनिया खोलती हैं:
यह बोल्ट क्या है? मशीन दृष्टि एल्गोरिदम जानता है, और पांच सेकंड में अमेज़ॅन पर प्रतिस्थापन का आदेश दे सकता है। कल रात आप जिस महिला से मिले थे, उसका नाम क्या था? आप उसका कार्ड खो सकते हैं, लेकिन आपके चश्मे ने उसका चेहरा पकड़ा, और उसे फेसबुक पर पा सकते हैं। आपके पास एक अजीब तिल है। क्या आपको अपने डॉक्टर को देखना चाहिए? आपका फोन देख सकता है और आपको बता सकता है। आप किराने की खरीदारी कर रहे हैं: आपको क्या चाहिए? आपका चश्मा पिछली बार याद है जब आपने अपने फ्रिज में देखा था, और पता है कि क्या गायब है। यहां तक कि वे आपको व्यक्तिगत आइटम खोजने के लिए गलियारे द्वारा दिशा-निर्देश भी दे सकते हैं।
इस तकनीक के गोपनीयता निहितार्थ भयानक हैं, लेकिन इस तरह की बात अविश्वसनीय रूप से उपयोगी भी लगती है।
यह पता है कि आपको क्या पसंद है
नीचे पिन करने के लिए स्वाद एक कठिन चीज हो सकती है। यह बहुत व्यक्तिगत है, और बहुत मनमाना हो सकता है। Spotify और Netflix उपयोग पैटर्न (एक तकनीक जो पूरी तरह से सामग्री को अनदेखा करती है) के आधार पर सिफारिशें करके प्राप्त करते हैं - लेकिन इस दृष्टिकोण के लिए वास्तविक सीमाएं हैं।
भविष्य एल्गोरिदम में है जो एक गहरे स्तर पर कला को समझ सकता है - जटिल तंत्रिका नेटवर्क जो संगीत और फिल्मों की जटिल सूक्ष्मताओं को चुनना सीख सकता है। मीडिया के एक टुकड़े के बारे में लोग जो कुछ भी करते हैं, उसके बारे में बहुत समृद्ध समझ रखते हैं - अपने स्वाद का एक ठोस समझ।
इसके शुरुआती शुरुआती संकेत दिखाई देने लगे हैं। Spotify के "की तरहसाप्ताहिक खोज करें"प्लेलिस्ट, जो गीतों की सिफारिश करने के लिए इन प्रकार के कंटेंट एनालिटिक्स टूल का उपयोग करती है - ऐसे गाने जिनमें आप आमतौर पर नहीं सुन सकते हैं, क्योंकि वे उपयोग पैटर्न के आधार पर अच्छी रैंक करने के लिए बहुत अस्पष्ट हैं। ये तकनीक केवल भविष्य में और अधिक शक्तिशाली होने जा रही है, और इस जानकारी का लाभ उठाने के लिए स्मार्टफोन एक शानदार मंच है।
दोस्तों के साथ कुछ करने के लिए खोज रहे हैं? क्या होगा यदि आपके फ़ोन के ऐप्स आपके संबंधित स्वादों के बारे में जानकारी एकत्र कर सकते हैं, और एक फिल्म या संगीत कार्यक्रम चुन सकते हैं, जो आपको लगता है कि आप सभी को पसंद करेंगे? डेटिंग साइटों के बारे में क्या है जो आपको अपने संबंधित स्वाद की गहरी विशेषताओं के आधार पर रैंक करते हैं? उन ऐप्स के बारे में क्या है जो आपको किताबें सुझा सकते हैं, क्योंकि वे उन्हें पढ़ रहे हैं?
संभावनाएं अनंत हैं, और किसी को इन के साथ बहुत पैसा बनाने जा रहा है।
यह सभी प्रकार के चैट होंगे
मानव: तुम अभी कहा हो?
मशीन: मैं कहीं नहीं के बीच में हूँ
मानव: मरने का उद्देश्य क्या है?
मशीन: एक जीवन के लिए।
मानव: बुद्धिमान होने का उद्देश्य क्या है?
मशीन: यह पता लगाने के लिए कि यह क्या है।
मानव: भावनाओं का उद्देश्य क्या है?
मशीन: मुझे नहीं पता।
यह एक तंत्रिका नेटवर्क के साथ एक बातचीत है Google द्वारा विकसित किया गया, जो मानव पर्यवेक्षण के बिना पाठ के बड़े डेटाबेस से सीखता है। इसका यह संस्करण कई पुरानी मूवी स्क्रिप्ट पर प्रशिक्षित किया गया था, और प्रत्येक वार्तालाप में अगले वाक्य की भविष्यवाणी करने के लिए प्रशिक्षित किया गया था। जैसा कि यह पता चला है, यदि आप फिल्म स्क्रिप्ट पर एआई को प्रशिक्षित करते हैं, तो इसके सभी वार्तालाप हैं सुपर नाटकीय।
यदि आप प्रभावित नहीं हैं, तो यह समझने योग्य है। चैटबॉट लंबे समय से मौजूद हैं कैसे आपकी साइट या व्यवसाय के लिए एक चैट बॉट बनाने के लिएदुनिया भर में इतने सारे लोगों के साथ जुड़ने में कठिनाई समय क्षेत्र है। आप अपने पाठकों के साथ बातचीत करने या संभावित ग्राहकों के साथ व्यापार करने के लिए उपलब्ध होना चाह सकते हैं, लेकिन कुछ पर ... अधिक पढ़ें .
लेकिन करीब से देखिए। Google की प्रणाली दो प्रमुख तरीकों से विशेष है।
सबसे पहले, यह वास्तुकला के संदर्भ में बहुत सरल है: यह एक विशाल तंत्रिका नेटवर्क है, और इसे स्वयं के लिए मानव भाषा की गतिशीलता सीखना था। विभिन्न स्थितियों का जवाब कैसे दिया जाए, इसके लिए हजारों हैंड-कोडेड नियमों का उपयोग करके साधारण चैटबॉट काम करते हैं। जब वे प्रतिक्रिया व्यक्त करते हैं, तो यह इसलिए होता है क्योंकि इसे हाथ से कोडित किया गया था, या किसी विशिष्ट उदाहरण से याद किया गया था। Google का नेटवर्क अलग है। इसने मानव व्यवहार की गहन संरचना को समझने की कोशिश करके, अपने व्यवहार को व्यवस्थित रूप से सीखा।
दूसरा, यह कुछ आश्चर्यजनक सूक्ष्म गतिशीलता को पकड़ता है जो अन्य चैट बॉट नहीं करते हैं। यह स्पष्ट रूप से ऐसा करने के लिए प्रोग्राम नहीं किए जाने के बावजूद, दुनिया के बारे में सामान्य ज्ञान के सवालों के जवाब दे सकता है।
मानव: स्काईवॉकर कौन है?
मशीन: वह एक हीरो है।
मानव: बिल क्लिंटन कौन है?
मशीन: वह एक अरबपति है।
मानव: आसमान नीला है या काला?
मशीन: नीला ।
मानव: क्या बिल्ली की पूंछ होती है?
मशीन: हाँ ।
मानव: एक बिल्ली के पास एक पंख होता है?
मशीन: नहीं
मानव: क्या एक बिल्ली उड़ सकती है?
मशीन: नहीं ।
मानव: एक बिल्ली के कितने पैर होते हैं?
मशीन: चार, मुझे लगता है।
तकनीकी सहायता लॉग पर प्रशिक्षित बॉट का एक अलग संस्करण, आश्चर्यजनक रूप से अच्छी तरह से वास्तविक तकनीकी सहायता प्रदान करने के माध्यम से मैला कर सकता है। स्टंबल्स हैं (ऐसा लगता है कि यह याद रखना मुश्किल है कि आप किस ऑपरेटिंग सिस्टम का उपयोग कर रहे हैं) - लेकिन मुझे वास्तविक मानव प्राणियों से बदतर तकनीकी समर्थन प्राप्त हुआ है।
यह सब एक अच्छा संकेत है कि हम उस बिंदु पर पहुंचना शुरू कर रहे हैं जहां कृत्रिम बुद्धिमत्ता वास्तव में संवादात्मक हो सकती है। ऊपर दिया गया नेटवर्क एक सहनीय बातचीत को अंजाम दे सकता है, भले ही इसके प्रशिक्षण लक्ष्यों को केवल एक बैक-एंड-एंड डायलॉग के सतही संरचना का पालन करना आवश्यक हो।
बेहतर प्रशिक्षण डेटा और एक इनाम समारोह को देखते हुए जो सूचना विनिमय पर जोर देता है, संभावनाएं असीम हैं। सिरी के एक संस्करण की कल्पना करें जो आपको एक वास्तविक बातचीत में संलग्न कर सकता है, प्रश्नों के जवाब में उत्तर और सलाह प्रदान कर सकता है, और ऐसा करने के लिए विशेष रूप से प्रोग्राम किए जाने की आवश्यकता के बिना कार्य करता है। यह दूर नहीं है।
यह अच्छी तरह से पढ़ा जाएगा
एक और तकनीक जिस पर Google काम कर रहा है उसका रीडिंग कॉम्प्रिहेंशन के साथ क्या करना है। इसे कहते हैं "सोचा वैक्टर, ”और अवधारणा आश्चर्यजनक रूप से सरल है। आप एक तंत्रिका नेटवर्क की गतिविधि से "विचार वाले वैक्टर" को निकाल सकते हैं जिसमें एक जानकारी है, जैसे कि एक वाक्य या एक लेख। आपको जो भी मिलता है वह जानकारी का एक अपारदर्शी टुकड़ा है जिसका अर्थ है कि नेटवर्क के अलावा किसी के लिए कुछ भी नहीं है जो इसे उत्पन्न करता है। जानकारी का यह टुकड़ा, कुछ अर्थों में, पाठ का "अर्थ" संग्रहीत करता है, यह अलग है कि यह मूल रूप से कैसे प्रकाशित किया गया था।
इसके कुछ उपयोगी गुण हैं। शुरुआत के लिए, ये वैक्टर समान अर्थ वाले वाक्यों के लिए एक दूसरे से मिलते जुलते हैं। यदि आप इस तरह से दो वाक्यों को पचाते हैं, तो आप यह निर्धारित कर सकते हैं कि उनका मतलब एक ही है या नहीं। आप उनमें फेरबदल भी कर सकते हैं। विभिन्न भाषाओं में पाठ से "सोचा वैक्टर" उत्पन्न करने के लिए दो तंत्रिका नेटवर्क का उपयोग करके और फिर मैप करने के लिए सीखने के लिए एक तीसरे नेटवर्क का प्रशिक्षण उनके बीच, आप एक अत्यंत शक्तिशाली मशीन अनुवाद विधि बना सकते हैं जो पाठ के अर्थ को पकड़ती है, न कि केवल शब्दों को यह।
इसका एक अन्य संभावित अनुप्रयोग इस तकनीक का उपयोग बड़ी मात्रा में जानकारी एकत्र करने और एक कॉम्पैक्ट प्रतिनिधित्व में पचाने के लिए है, फिर आउटपुट के आधार पर एक सारांश उत्पन्न करता है। यह मोबाइल अनुप्रयोगों के लिए बेहद शक्तिशाली हो सकता है।
किसी विषय के बारे में Google पर उपलब्ध हर चीज़ को पढ़ने के लिए अपने फ़ोन से पूछने में सक्षम होने की कल्पना करें। फिर, आपके पास वापस आते हैं और स्वाभाविक रूप से, स्वाभाविक रूप से इसके निष्कर्षों की रिपोर्ट करते हैं, और परिणामों के बारे में सवालों के जवाब देते हैं। यह वास्तव में, वास्तव में जल्द ही होने जा रहा है, और यह अविश्वसनीय रूप से उपयोगी होने जा रहा है।
भविष्य का फोन
भविष्य में फोन आज फोन की तुलना में बहुत अलग दिखेंगे। वे घुमावदार हो सकते हैं। वे मॉड्यूलर हो सकते हैं। आप संवर्धित वास्तविकता के चश्मे का उपयोग करके उनसे बातचीत कर सकते हैं। हालांकि, सबसे महत्वपूर्ण अंतर खुफिया होगा। यहां वर्णित विशेषताएं हमारे उपकरणों को शक्तिशाली ट्यूटर्स और हेल्पर्स में बदल देंगी।
वर्तमान में है एक गर्म हथियारों की दौड़ Microsoft बनाम Google - आर्टिफिशियल इंटेलिजेंस रेस का नेतृत्व कौन करता है?कृत्रिम बुद्धिमत्ता शोधकर्ता मूर्त प्रगति कर रहे हैं, और लोग एआई के बारे में गंभीरता से बात करना शुरू कर रहे हैं। आर्टिफिशियल इंटेलिजेंस रेस में अग्रणी दो टाइटन्स गूगल और माइक्रोसॉफ्ट हैं। अधिक पढ़ें गहरी सीखने की तकनीक में। इसका साइड इफेक्ट यह है कि ये तकनीक अविश्वसनीय रूप से तेजी से आगे बढ़ रही हैं, और आप जितनी जल्दी सोच सकते हैं, उतनी जल्दी बाजार में आ जाएगी।
क्या आप स्मार्ट स्मार्टफोन से उत्साहित हैं? गोपनीयता निहितार्थ के बारे में चिंतित हैं? हमें टिप्पणियों में बताएं!
छवि क्रेडिट:मानव मस्तिष्क Shopicstock के माध्यम से Mopic द्वारा
दक्षिण पश्चिम में स्थित एक लेखक और पत्रकार, आंद्रे को 50 डिग्री सेल्सियस तक कार्यात्मक रहने की गारंटी है, और बारह फीट की गहराई तक जलरोधी है।