एआई के निर्माण पर कोवैरिएंट के सीईओ जो रोबोट को सीखने में मदद करते हैं

0
25


सहपरिवर्ती स्थापित किया गया था 2017 में एक साधारण लक्ष्य के साथ: रोबोट को वस्तुओं को बेहतर ढंग से उठाने का तरीका सीखने में मदद करना। गोदामों को स्वचालित करने की चाहत रखने वालों के लिए यह एक बड़ी आवश्यकता है, और जो दिखने में जितना जटिल लगता है उससे कहीं अधिक जटिल है। हमारे द्वारा सामना किए जाने वाले अधिकांश सामान किसी बिंदु पर एक गोदाम के माध्यम से यात्रा कर चुके हैं। यह आकार, आकार, बनावट और रंगों की एक असंभव विस्तृत श्रृंखला है।

बे एरिया फर्म ने एक एआई-आधारित प्रणाली का निर्माण किया है जो नेटवर्क रोबोटों को चुनने में सुधार करने के लिए प्रशिक्षित करती है। इस वर्ष के प्रोमैट में फर्श पर एक डेमो दिखाता है कि कितनी जल्दी एक जुड़ा हुआ हाथ विभिन्न वस्तुओं की एक विस्तृत श्रृंखला को पहचानने, चुनने और रखने में सक्षम है।

सह-संस्थापक और सीईओ पीटर चेन पिछले हफ्ते शो में टेकक्रंच के साथ रोबोट सीखने, मूलभूत मॉडल बनाने और स्वाभाविक रूप से चैटजीपीटी पर चर्चा करने के लिए बैठे थे।

टेकक्रंच: जब आप स्टार्टअप होते हैं, तो जितना संभव हो उतना ऑफ-द-शेल्फ हार्डवेयर का उपयोग करना समझ में आता है।

पीसी: हाँ। Covariant एक बहुत ही अलग जगह से शुरू हुआ। हमने शुद्ध सॉफ्टवेयर और शुद्ध एआई के साथ शुरुआत की। कंपनी के लिए पहली भर्ती सभी एआई शोधकर्ता थे। हमारे पास कोई मैकेनिकल इंजीनियर नहीं था, रोबोटिक्स में कोई नहीं था। इसने हमें किसी और की तुलना में एआई में बहुत गहराई तक जाने की अनुमति दी। यदि आप अन्य रोबोटिक कंपनियों को देखें [at ProMat]वे शायद कुछ ऑफ-द-शेल्फ मॉडल या ओपन सोर्स मॉडल का उपयोग कर रहे हैं – ऐसी चीजें जिनका उपयोग अकादमिक क्षेत्र में किया गया है।

आरओएस की तरह।

हाँ। आरओएस या ओपन सोर्स कंप्यूटर विजन लाइब्रेरी, जो बहुत अच्छे हैं। लेकिन हम जो कर रहे हैं वह मौलिक रूप से अलग है। हम देखते हैं कि अकादमिक एआई मॉडल क्या प्रदान करते हैं और यह पर्याप्त शांत नहीं है। अकादमिक एआई एक प्रयोगशाला वातावरण में बनाया गया है। वे वास्तविक दुनिया के परीक्षणों का सामना करने के लिए नहीं बने हैं – विशेष रूप से कई ग्राहकों के परीक्षण, लाखों कौशल, लाखों विभिन्न प्रकार की वस्तुएं जिन्हें एक ही एआई द्वारा संसाधित करने की आवश्यकता होती है।

बहुत सारे शोधकर्ता सीखने के लिए बहुत सारे अलग-अलग तरीके अपना रहे हैं। आपके बारे में क्या अलग है?

बहुत सारी संस्थापक टीम OpenAI से थी – जैसे चार सह-संस्थापकों में से तीन। यदि आप देखते हैं कि OpenAI ने पिछले तीन से चार वर्षों में भाषा के क्षेत्र में क्या किया है, तो यह मूल रूप से भाषा के लिए एक बुनियादी मॉडल दृष्टिकोण ले रहा है। हाल ही के चैटजीपीटी से पहले, बहुत सारे नेचुरल लैंग्वेज प्रोसेसिंग एआई मौजूद थे। खोज, अनुवाद, भावना का पता लगाना, स्पैम का पता लगाना – वहाँ बहुत सारी प्राकृतिक भाषा AI थी। GPT से पहले का दृष्टिकोण प्रत्येक उपयोग के मामले के लिए है, आप डेटा के एक छोटे उपसमुच्चय का उपयोग करके एक विशिष्ट AI को प्रशिक्षित करते हैं। अब परिणाम देखें, और GPT मूल रूप से अनुवाद के क्षेत्र को समाप्त कर देता है, और यह अनुवाद के लिए प्रशिक्षित भी नहीं है। नींव मॉडल दृष्टिकोण मूल रूप से है, एक स्थिति के लिए विशिष्ट डेटा की छोटी मात्रा का उपयोग करने या एक मॉडल को प्रशिक्षित करने के बजाय जो एक परिस्थिति के लिए विशिष्ट है, आइए बहुत अधिक डेटा पर एक बड़े फाउंडेशन-सामान्यीकृत मॉडल को प्रशिक्षित करें, इसलिए एआई अधिक सामान्यीकृत है।

आप चुनने और रखने पर ध्यान केंद्रित कर रहे हैं, लेकिन क्या आप भविष्य के अनुप्रयोगों की नींव भी रख रहे हैं?

निश्चित रूप से। लोभी क्षमता या लेने और रखने की क्षमता निश्चित रूप से पहली सामान्य क्षमता है जो हम रोबोट दे रहे हैं। लेकिन अगर आप पर्दे के पीछे देखते हैं, तो बहुत सारी 3डी समझ या वस्तु समझ है। बहुत सारे संज्ञानात्मक आदिम हैं जो भविष्य के रोबोटिक अनुप्रयोगों के लिए सामान्य हैं। कहा जा रहा है, पकड़ना या चुनना इतना विशाल स्थान है कि हम इस पर थोड़ी देर के लिए काम कर सकते हैं।

आप पहले चुनने और रखने के बाद जाते हैं क्योंकि इसकी स्पष्ट आवश्यकता है।

इसकी स्पष्ट आवश्यकता है, और इसके लिए प्रौद्योगिकी की स्पष्ट कमी भी है। मजे की बात यह है कि अगर आप 10 साल पहले इस शो में आए होते तो आपको पिकिंग रोबोट्स मिल जाते। वे काम नहीं करेंगे। उद्योग लंबे समय से इससे जूझ रहा है। लोगों ने कहा कि यह एआई के बिना काम नहीं कर सकता है, इसलिए लोगों ने विशिष्ट एआई और ऑफ-द-शेल्फ एआई की कोशिश की, और वे काम नहीं कर पाए।

आपके सिस्टम एक केंद्रीय डेटाबेस में फीड कर रहे हैं और हर पिक मशीनों को सूचित कर रही है कि भविष्य में कैसे चुनना है।

हाँ। मजेदार बात यह है कि हमारे द्वारा स्पर्श की जाने वाली लगभग हर वस्तु किसी न किसी बिंदु पर एक गोदाम से होकर गुजरती है। यह लगभग भौतिक दुनिया में हर चीज का एक केंद्रीय समाशोधन स्थान है। जब आप गोदामों के लिए AI का निर्माण शुरू करते हैं, तो यह AI के लिए एक बढ़िया आधार है जो गोदामों से बाहर जाता है। मान लें कि आप एक सेब को खेत से बाहर निकालते हैं और इसे एक कृषि संयंत्र में लाते हैं – इसने पहले एक सेब देखा है। स्ट्रॉबेरी को पहले भी देखा है।

वह एक-से-एक है। मैं एक पूर्ति केंद्र में एक सेब चुनता हूं, इसलिए मैं एक सेब एक खेत में चुन सकता हूं। अधिक संक्षेप में, इन सीखों को जीवन के अन्य पहलुओं पर कैसे लागू किया जा सकता है?

यदि हम विशेष रूप से कोवैरिएंट से एक कदम पीछे हटना चाहते हैं, और सोचते हैं कि प्रौद्योगिकी का रुझान कहां जा रहा है, तो हम एआई, सॉफ्टवेयर और मेक्ट्रोनिक्स का एक दिलचस्प अभिसरण देख रहे हैं। परंपरागत रूप से, ये तीनों क्षेत्र एक दूसरे से कुछ अलग हैं। मेक्ट्रोनिक्स वह है जो आप इस शो में आने पर पाएंगे। यह दोहराने योग्य आंदोलन के बारे में है। अगर आप सेल्सपर्सन से बात करें तो वे आपको विश्वसनीयता के बारे में बताते हैं कि कैसे यह मशीन एक ही काम को बार-बार कर सकती है।

पिछले 15 से 20 वर्षों में हमने सिलिकन वैली से वास्तव में आश्चर्यजनक विकास सॉफ्टवेयर पर देखा है। लोगों ने वास्तव में जटिल और अत्यधिक बुद्धिमान दिखने वाले सॉफ़्टवेयर को कैसे बनाया जाए, इस पर कोड को क्रैक किया है। हम जिन ऐप्स का उपयोग कर रहे हैं, वे वास्तव में सॉफ्टवेयर की क्षमताओं का उपयोग करने वाले लोग हैं। अब हम सभी अद्भुत प्रगति के साथ एआई की अग्रिम सीट पर हैं। जब आप मुझसे पूछते हैं कि गोदामों से परे क्या है, तो मैं देख रहा हूं कि यह वास्तव में कहां जा रहा है, यह दुनिया में अत्यधिक स्वायत्त भौतिक मशीनों के निर्माण के लिए इन तीन प्रवृत्तियों का अभिसरण है। आपको सभी तकनीकों के अभिसरण की आवश्यकता है।

आपने उल्लेख किया कि चैटजीपीटी आ रहा है और अनुवाद सॉफ्टवेयर बनाने वाले लोगों को अंधा कर रहा है। यह कुछ ऐसा है जो तकनीक में होता है। क्या आप एक GPT के आने और Covariant द्वारा किए जा रहे कार्य को प्रभावी ढंग से अंधा कर देने से डरते हैं?

बहुत से लोगों के लिए यह एक अच्छा सवाल है, लेकिन मुझे लगता है कि हमें इसमें एक अनुचित लाभ हुआ था कि हमने लगभग उसी विश्वास के साथ शुरुआत की थी जो कि OpenAI के मूलभूत मॉडल के निर्माण के साथ था। विशिष्ट एआई के निर्माण की तुलना में सामान्य एआई एक बेहतर दृष्टिकोण है। पिछले पांच साल से हम यही कर रहे हैं। मैं कहूंगा कि हम बहुत अच्छी स्थिति में हैं, और हमें बहुत खुशी है कि OpenAI ने प्रदर्शित किया कि यह दर्शन वास्तव में अच्छी तरह से काम करता है। हम रोबोटिक्स की दुनिया में ऐसा करने के लिए बहुत उत्साहित हैं।



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here