सहपरिवर्ती स्थापित किया गया था 2017 में एक साधारण लक्ष्य के साथ: रोबोट को वस्तुओं को बेहतर ढंग से उठाने का तरीका सीखने में मदद करना। गोदामों को स्वचालित करने की चाहत रखने वालों के लिए यह एक बड़ी आवश्यकता है, और जो दिखने में जितना जटिल लगता है उससे कहीं अधिक जटिल है। हमारे द्वारा सामना किए जाने वाले अधिकांश सामान किसी बिंदु पर एक गोदाम के माध्यम से यात्रा कर चुके हैं। यह आकार, आकार, बनावट और रंगों की एक असंभव विस्तृत श्रृंखला है।
बे एरिया फर्म ने एक एआई-आधारित प्रणाली का निर्माण किया है जो नेटवर्क रोबोटों को चुनने में सुधार करने के लिए प्रशिक्षित करती है। इस वर्ष के प्रोमैट में फर्श पर एक डेमो दिखाता है कि कितनी जल्दी एक जुड़ा हुआ हाथ विभिन्न वस्तुओं की एक विस्तृत श्रृंखला को पहचानने, चुनने और रखने में सक्षम है।
सह-संस्थापक और सीईओ पीटर चेन पिछले हफ्ते शो में टेकक्रंच के साथ रोबोट सीखने, मूलभूत मॉडल बनाने और स्वाभाविक रूप से चैटजीपीटी पर चर्चा करने के लिए बैठे थे।
टेकक्रंच: जब आप स्टार्टअप होते हैं, तो जितना संभव हो उतना ऑफ-द-शेल्फ हार्डवेयर का उपयोग करना समझ में आता है।
पीसी: हाँ। Covariant एक बहुत ही अलग जगह से शुरू हुआ। हमने शुद्ध सॉफ्टवेयर और शुद्ध एआई के साथ शुरुआत की। कंपनी के लिए पहली भर्ती सभी एआई शोधकर्ता थे। हमारे पास कोई मैकेनिकल इंजीनियर नहीं था, रोबोटिक्स में कोई नहीं था। इसने हमें किसी और की तुलना में एआई में बहुत गहराई तक जाने की अनुमति दी। यदि आप अन्य रोबोटिक कंपनियों को देखें [at ProMat]वे शायद कुछ ऑफ-द-शेल्फ मॉडल या ओपन सोर्स मॉडल का उपयोग कर रहे हैं – ऐसी चीजें जिनका उपयोग अकादमिक क्षेत्र में किया गया है।
आरओएस की तरह।
हाँ। आरओएस या ओपन सोर्स कंप्यूटर विजन लाइब्रेरी, जो बहुत अच्छे हैं। लेकिन हम जो कर रहे हैं वह मौलिक रूप से अलग है। हम देखते हैं कि अकादमिक एआई मॉडल क्या प्रदान करते हैं और यह पर्याप्त शांत नहीं है। अकादमिक एआई एक प्रयोगशाला वातावरण में बनाया गया है। वे वास्तविक दुनिया के परीक्षणों का सामना करने के लिए नहीं बने हैं – विशेष रूप से कई ग्राहकों के परीक्षण, लाखों कौशल, लाखों विभिन्न प्रकार की वस्तुएं जिन्हें एक ही एआई द्वारा संसाधित करने की आवश्यकता होती है।
बहुत सारे शोधकर्ता सीखने के लिए बहुत सारे अलग-अलग तरीके अपना रहे हैं। आपके बारे में क्या अलग है?
बहुत सारी संस्थापक टीम OpenAI से थी – जैसे चार सह-संस्थापकों में से तीन। यदि आप देखते हैं कि OpenAI ने पिछले तीन से चार वर्षों में भाषा के क्षेत्र में क्या किया है, तो यह मूल रूप से भाषा के लिए एक बुनियादी मॉडल दृष्टिकोण ले रहा है। हाल ही के चैटजीपीटी से पहले, बहुत सारे नेचुरल लैंग्वेज प्रोसेसिंग एआई मौजूद थे। खोज, अनुवाद, भावना का पता लगाना, स्पैम का पता लगाना – वहाँ बहुत सारी प्राकृतिक भाषा AI थी। GPT से पहले का दृष्टिकोण प्रत्येक उपयोग के मामले के लिए है, आप डेटा के एक छोटे उपसमुच्चय का उपयोग करके एक विशिष्ट AI को प्रशिक्षित करते हैं। अब परिणाम देखें, और GPT मूल रूप से अनुवाद के क्षेत्र को समाप्त कर देता है, और यह अनुवाद के लिए प्रशिक्षित भी नहीं है। नींव मॉडल दृष्टिकोण मूल रूप से है, एक स्थिति के लिए विशिष्ट डेटा की छोटी मात्रा का उपयोग करने या एक मॉडल को प्रशिक्षित करने के बजाय जो एक परिस्थिति के लिए विशिष्ट है, आइए बहुत अधिक डेटा पर एक बड़े फाउंडेशन-सामान्यीकृत मॉडल को प्रशिक्षित करें, इसलिए एआई अधिक सामान्यीकृत है।
आप चुनने और रखने पर ध्यान केंद्रित कर रहे हैं, लेकिन क्या आप भविष्य के अनुप्रयोगों की नींव भी रख रहे हैं?
निश्चित रूप से। लोभी क्षमता या लेने और रखने की क्षमता निश्चित रूप से पहली सामान्य क्षमता है जो हम रोबोट दे रहे हैं। लेकिन अगर आप पर्दे के पीछे देखते हैं, तो बहुत सारी 3डी समझ या वस्तु समझ है। बहुत सारे संज्ञानात्मक आदिम हैं जो भविष्य के रोबोटिक अनुप्रयोगों के लिए सामान्य हैं। कहा जा रहा है, पकड़ना या चुनना इतना विशाल स्थान है कि हम इस पर थोड़ी देर के लिए काम कर सकते हैं।
आप पहले चुनने और रखने के बाद जाते हैं क्योंकि इसकी स्पष्ट आवश्यकता है।
इसकी स्पष्ट आवश्यकता है, और इसके लिए प्रौद्योगिकी की स्पष्ट कमी भी है। मजे की बात यह है कि अगर आप 10 साल पहले इस शो में आए होते तो आपको पिकिंग रोबोट्स मिल जाते। वे काम नहीं करेंगे। उद्योग लंबे समय से इससे जूझ रहा है। लोगों ने कहा कि यह एआई के बिना काम नहीं कर सकता है, इसलिए लोगों ने विशिष्ट एआई और ऑफ-द-शेल्फ एआई की कोशिश की, और वे काम नहीं कर पाए।
आपके सिस्टम एक केंद्रीय डेटाबेस में फीड कर रहे हैं और हर पिक मशीनों को सूचित कर रही है कि भविष्य में कैसे चुनना है।
हाँ। मजेदार बात यह है कि हमारे द्वारा स्पर्श की जाने वाली लगभग हर वस्तु किसी न किसी बिंदु पर एक गोदाम से होकर गुजरती है। यह लगभग भौतिक दुनिया में हर चीज का एक केंद्रीय समाशोधन स्थान है। जब आप गोदामों के लिए AI का निर्माण शुरू करते हैं, तो यह AI के लिए एक बढ़िया आधार है जो गोदामों से बाहर जाता है। मान लें कि आप एक सेब को खेत से बाहर निकालते हैं और इसे एक कृषि संयंत्र में लाते हैं – इसने पहले एक सेब देखा है। स्ट्रॉबेरी को पहले भी देखा है।
वह एक-से-एक है। मैं एक पूर्ति केंद्र में एक सेब चुनता हूं, इसलिए मैं एक सेब एक खेत में चुन सकता हूं। अधिक संक्षेप में, इन सीखों को जीवन के अन्य पहलुओं पर कैसे लागू किया जा सकता है?
यदि हम विशेष रूप से कोवैरिएंट से एक कदम पीछे हटना चाहते हैं, और सोचते हैं कि प्रौद्योगिकी का रुझान कहां जा रहा है, तो हम एआई, सॉफ्टवेयर और मेक्ट्रोनिक्स का एक दिलचस्प अभिसरण देख रहे हैं। परंपरागत रूप से, ये तीनों क्षेत्र एक दूसरे से कुछ अलग हैं। मेक्ट्रोनिक्स वह है जो आप इस शो में आने पर पाएंगे। यह दोहराने योग्य आंदोलन के बारे में है। अगर आप सेल्सपर्सन से बात करें तो वे आपको विश्वसनीयता के बारे में बताते हैं कि कैसे यह मशीन एक ही काम को बार-बार कर सकती है।
पिछले 15 से 20 वर्षों में हमने सिलिकन वैली से वास्तव में आश्चर्यजनक विकास सॉफ्टवेयर पर देखा है। लोगों ने वास्तव में जटिल और अत्यधिक बुद्धिमान दिखने वाले सॉफ़्टवेयर को कैसे बनाया जाए, इस पर कोड को क्रैक किया है। हम जिन ऐप्स का उपयोग कर रहे हैं, वे वास्तव में सॉफ्टवेयर की क्षमताओं का उपयोग करने वाले लोग हैं। अब हम सभी अद्भुत प्रगति के साथ एआई की अग्रिम सीट पर हैं। जब आप मुझसे पूछते हैं कि गोदामों से परे क्या है, तो मैं देख रहा हूं कि यह वास्तव में कहां जा रहा है, यह दुनिया में अत्यधिक स्वायत्त भौतिक मशीनों के निर्माण के लिए इन तीन प्रवृत्तियों का अभिसरण है। आपको सभी तकनीकों के अभिसरण की आवश्यकता है।
आपने उल्लेख किया कि चैटजीपीटी आ रहा है और अनुवाद सॉफ्टवेयर बनाने वाले लोगों को अंधा कर रहा है। यह कुछ ऐसा है जो तकनीक में होता है। क्या आप एक GPT के आने और Covariant द्वारा किए जा रहे कार्य को प्रभावी ढंग से अंधा कर देने से डरते हैं?
बहुत से लोगों के लिए यह एक अच्छा सवाल है, लेकिन मुझे लगता है कि हमें इसमें एक अनुचित लाभ हुआ था कि हमने लगभग उसी विश्वास के साथ शुरुआत की थी जो कि OpenAI के मूलभूत मॉडल के निर्माण के साथ था। विशिष्ट एआई के निर्माण की तुलना में सामान्य एआई एक बेहतर दृष्टिकोण है। पिछले पांच साल से हम यही कर रहे हैं। मैं कहूंगा कि हम बहुत अच्छी स्थिति में हैं, और हमें बहुत खुशी है कि OpenAI ने प्रदर्शित किया कि यह दर्शन वास्तव में अच्छी तरह से काम करता है। हम रोबोटिक्स की दुनिया में ऐसा करने के लिए बहुत उत्साहित हैं।