Connect with us

विज्ञान

How the DeepSeek-R1 AI model was taught to teach itself to reason | Explained

Published

on

How the DeepSeek-R1 AI model was taught to teach itself to reason | Explained

अब तक कहानी: कई दशकों के लिए, एक महान चुनौतियों में से एक कृत्रिम होशियारी (Ai) तर्क देने के लिए मशीनों को पढ़ा रहा है। तर्क तथ्यों को याद करने या वाक्यों को पूरा करने से परे है। यह चरणों का पालन करने, गलतियों को प्रतिबिंबित करने और सही उत्तर मिलने तक रणनीतियों को समायोजित करने की क्षमता है।

मनुष्य गणित की समस्याओं को हल करने से लेकर कंप्यूटर प्रोग्राम लिखने के लिए सब कुछ के लिए तर्क का उपयोग करते हैं, अपने दैनिक जीवन पर बातचीत करने से लेकर यह तय करने के लिए कि किसके लिए वोट करना है। GPT-4 या DEEPSEEK-V3 जैसे बड़े भाषा मॉडल (LLMS) ने बड़े आकारों में स्केल किए जाने पर तर्क के संकेत दिखाकर वैज्ञानिकों को आश्चर्यचकित किया है। एक अन्य विधि, जिसे चेन-ऑफ-थॉट प्रॉम्प्टिंग कहा जाता है, जहां मॉडल को “स्टेप बाय स्टेप” के बारे में बताया गया है, ने भी प्रदर्शन को बढ़ावा दिया है।

लेकिन ये दोनों दृष्टिकोण सीमाओं के साथ आते हैं। प्रशिक्षण मॉडल आमतौर पर मानव निर्मित उदाहरणों की मांग करते हैं। जैसे लोग एक एआई मॉडल दिखाते हैं कि समस्याओं को कैसे हल किया जाए और एआई विधि को कॉपी करना सीखता है। यह धीमा, महंगा है, और मानव पूर्वाग्रहों का परिचय देता है। यह एआई की रचनात्मकता को भी कैपिट करता है क्योंकि मॉडल समस्या को सुलझाने के तरीकों का पता नहीं लगा सकता है जो मनुष्यों ने नहीं सोचा था।

में प्रकाशित एक पेपर में प्रकृति 17 सितंबर को, दीपसेक-एआई टीम ने बताया कि यह अपने मॉडल तक पहुंचने में सक्षम था, जिसे सिर्फ आर 1 कहा जाता है, एक महत्वाकांक्षी प्रश्न पूछकर कारण: क्या होगा अगर हमने मॉडल को पहले मानव उदाहरणों को दिखाए बिना खुद को सिखाने की अनुमति दी? यही है, उन्होंने पाया कि आर 1 सुदृढीकरण सीखने का उपयोग करके तर्क के नए रूपों को विकसित कर सकता है, परीक्षण की एक विधि और केवल सही उत्तर के लिए पुरस्कारों द्वारा निर्देशित त्रुटि।

सुदृढीकरण सीखने क्या है?

टीम का उद्देश्य गणित और कोडिंग में मॉडल को स्मार्ट बनाने के साथ -साथ यह बताना था कि जब किसी मशीन को उचित प्रोत्साहन दिया जाता है तो तर्क व्यवहार स्वाभाविक रूप से कैसे उभर सकता है।

दीपसेक शोधकर्ताओं ने वी 3 बेस के साथ शुरू किया, जो अन्य अत्याधुनिक प्रणालियों के समान एक बड़ी भाषा मॉडल है। सामान्य पर्यवेक्षित फाइन-ट्यूनिंग का उपयोग करने के बजाय, जहां मनुष्य तर्कपूर्ण कदम प्रदान करते हैं, उन्होंने ‘समूह सापेक्ष नीति अनुकूलन’ लागू किया, एक सुदृढीकरण सीखने की विधि जो दक्षता के लिए डिज़ाइन की गई है।

इस सेटअप में, मॉडल, जिसे पहली बार आर 1-जीरो कहा जाता है, को गणितीय और एल्गोरिथम समस्याओं को हल करने के लिए कहा गया था। प्रत्येक प्रयास के लिए, इसे दो भागों का उत्पादन करना था: `के अंदर एक तर्क प्रक्रिया`टैग और एक अंतिम उत्तर के अंदर``टैग। एकमात्र इनाम से आया कि क्या अंतिम उत्तर सही था, उत्तर कुंजी या कोड संकलक जैसे नियम-आधारित प्रणालियों द्वारा आंका गया था। किसी ने भी मॉडल को नहीं बताया कि इसका तर्क कैसा दिखना चाहिए।

हजारों प्रशिक्षण चरणों में, मॉडल ने परीक्षण और त्रुटि से सीखा। यदि कोई उत्तर गलत था, तो जिस मार्ग का नेतृत्व किया गया था, वह हतोत्साहित था; यदि यह सही था, तो मार्ग को प्रबलित किया गया था। महत्वपूर्ण रूप से, शोधकर्ताओं ने यह भी ट्रैक किया कि मॉडल की सोच का समय कैसे, यानी इसके तर्क अनुभाग में इसका उपयोग किए गए टोकन की संख्या बदल गई। हड़ताली, मॉडल ने अपने आप में लंबे समय तक और अधिक चिंतनशील तर्क श्रृंखला लिखना शुरू कर दिया, कभी-कभी “प्रतीक्षा” या “चलो फिर से कोशिश करते हैं” जैसे वाक्यांशों को शामिल किया गया, जो आत्म-सही करने की क्षमता का खुलासा करता है।

क्या मानव हस्तक्षेप था?

कमजोरियों को संबोधित करने के लिए जैसे कि खराब पठनीयता और चीनी के साथ अंग्रेजी मिश्रण करने के लिए, टीम ने R1-Zero से R1 का निर्माण किया। इस प्रक्रिया में एक भाषा का उपयोग करके लगातार एक भाषा का उपयोग करने के लिए प्रोत्साहन जोड़ना शामिल है, जो तर्क और गैर-पुनर्जीवित डेटा दोनों के साथ ठीक-ठाक-ट्यूनिंग है। इस प्रकार अंतिम मॉडल को आर 1-जीरो की कच्ची तर्क शक्ति विरासत में मिली, जबकि उपयोग और सुरक्षित भी आसान हो गई।

परिणाम हड़ताली थे। अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (Aime) 2024 पर, एक कठिन प्रतियोगिता जो आमतौर पर सबसे स्मार्ट हाई-स्कूल के छात्रों का प्रयास करती है, R1-Zero की सटीकता प्रशिक्षण की शुरुआत में केवल 15.6% से बढ़कर 77.9% हो गई। अधिक ट्यूनिंग के साथ, यह मानव छात्रों के औसत प्रदर्शन को पार करते हुए, 86.7%तक पहुंच गया।

एक निश्चित चरण में, आर 1-जीरो ने अपने तर्क में “प्रतीक्षा” शब्द का उपयोग करना शुरू कर दिया, जैसे कि एक मानव की गलती हो सकती है। शोधकर्ताओं ने कहा कि इसका मतलब था कि मॉडल नेत्रहीन रूप से एक मार्ग का अनुसरण नहीं कर रहा था, लेकिन जब कुछ बंद लग रहा था तो सक्रिय रूप से कदमों पर पुनर्विचार कर रहा था। वास्तव में, सुदृढीकरण सीखने ने एआई को व्यवहारों में सह -समाक्षता और सत्यापन के दोनों तत्वों के साथ व्यवहार में शामिल किया था।

अंतिम R1 मॉडल और भी मजबूत था: यह गणित और कोडिंग में अच्छा था और साथ ही सामान्य ज्ञान के लिए बेंचमार्क पर, सवालों के जवाब देने और निम्नलिखित निर्देशों के लिए। अपने पूर्ववर्तियों की तुलना में, आर 1 भी भाषा की अपनी पसंद के साथ अधिक सुसंगत था और मदद से मदद के लिए मानव वरीयताओं के साथ संरेखित किया गया था। जब Alpacaeval 2.0 और Arena-Hard जैसे फ्रेमवर्क के साथ मूल्यांकन किया जाता है, तो यह परीक्षण करता है कि एक मॉडल कितनी अच्छी तरह से निर्देशों का पालन करता है, R1 में क्रमशः 25% और 17% में सुधार हुआ, जो बड़े माना जाता है।

तर्क और तर्क के विपक्ष क्या हैं?

कई बड़े भाषा मॉडल, जिनमें व्यापक रूप से उपयोग किए जाने वाले सिस्टम जैसे CHATGPT, अक्सर परीक्षण के दौरान बड़ी मात्रा में कम्प्यूटेशनल संसाधनों की मांग करते हैं। दूसरी ओर, R1, कार्य की कठिनाई के आधार पर “सोचा” कितना अनुकूलित कर सकता है। सरल समस्याओं को छोटी तर्क श्रृंखलाओं के साथ पूरा किया गया, जबकि कठिन लोगों ने लंबी, अधिक विस्तृत श्रृंखलाओं का नेतृत्व किया। इस गतिशील आवंटन ने उन सवालों पर शक्ति की मांग से परहेज किया जो इसे वारंट नहीं करते थे। हालांकि, सुदृढीकरण सीखना स्वयं ऊर्जा-गहन है।

एक साथ लिया गया, निष्कर्ष पुष्टि करते हैं कि सुदृढीकरण सीखने (सही डिजाइन के साथ) तर्क व्यवहार का उत्पादन कर सकता है जो पहले मानव उदाहरणों की आवश्यकता के लिए सोचा गया था। इससे हम सोच सकते हैं कि कृत्रिम प्रणालियों में बुद्धि कैसे बढ़ सकती है, इसके बारे में हम सोच सकते हैं। उदाहरण के लिए, भविष्य में, शोधकर्ता वेरिफायर का निर्माण कर सकते हैं जो उत्तर की जांच करते हैं और मॉडल को अपनी रणनीतियों का पता लगाने देते हैं। यदि गणित की समस्या का जवाब, एक कंप्यूटर प्रोग्राम या एक तथ्यात्मक प्रश्न को मज़बूती से जांचा जा सकता है, तो सुदृढीकरण सीखना बाकी को कर सकता है। यह मानव श्रम और पूर्वाग्रह को कम करते हुए प्रगति को गति दे सकता है।

वास्तव में, पारंपरिक एलएलएम प्रशिक्षण पाइपलाइनों को बड़े मानव-लेबल वाले डेटासेट पर भारी बैंक-प्रश्न-उत्तर जोड़े, तर्क कदम, वरीयता निर्णय आदि लिखने वाले लोग महंगे हैं और अक्सर शोषणकारी श्रम स्थितियों के तहत इकट्ठे होते हैं। यदि मशीनों को सुदृढीकरण सीखने का उपयोग करके तर्क के लिए सिखाया जा सकता है, तो मानव-एनोटेट डेटा की मांग कम हो सकती है, इस प्रकार दुनिया भर में सस्ते श्रम के लिए दबाव भी कम हो सकता है। हालांकि, अध्ययन पत्र यह भी स्वीकार करता है कि स्पष्ट ग्राउंड-ट्रूथिंग के बिना कार्य अभी भी इनाम मॉडल के लिए मानव-लेबल वाले डेटा पर निर्भर हैं। इसलिए मानव इनपुट को समाप्त नहीं किया गया है; केवल इसका दायरा उन क्षेत्रों में सिकुड़ सकता है जहां कोई विश्वसनीय सत्यापनकर्ता नहीं बनाया जा सकता है।

एक मॉडल जो तर्क के लिए सीखता है, वह लेखन जैसे ओपन-एंडेड कार्यों के लिए बेहतर इनाम संकेतों की भी मांग करेगा, जो मुश्किल है, साथ ही साथ मजबूत सुरक्षा उपायों के रूप में यह खतरनाक या जोड़ तोड़ सामग्री उत्पन्न करने में सक्षम हो जाता है। वास्तव में, एक मशीन को देखने से चिंतनशील व्यवहार विकसित होता है (रोकना, जाँच करना, संशोधित करना, आदि) इस बारे में सवाल उठाता है कि ऐसी प्रणालियां कितनी दूर तक जा सकती हैं। यदि तर्क निर्देशों के बजाय प्रोत्साहन से उभरता है, तो क्या रचनात्मकता या समझ के गहरे रूप उसी तरह से उभर सकते हैं?

समय बताएगा-जब तक कि डीपसेक-आर 1 ने इसे पहले नहीं बताया।

प्रकाशित – 17 सितंबर, 2025 08:30 PM IST

Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

विज्ञान

Budget may cut reliance on foreign telescopes; trips on space spending

Published

on

By

Budget may cut reliance on foreign telescopes; trips on space spending

यह बजट भारत के अनुसंधान समुदाय, विशेषकर खगोल विज्ञान और अंतरिक्ष अनुसंधान में शामिल लोगों के लिए कुछ ख़ुशी लेकर आया है। अंतरिक्ष विभाग के लिए ₹13,416.20 करोड़ निर्धारित 2026-27 के लिए.

आवंटन का एक बड़ा हिस्सा गहरे अंतरिक्ष अन्वेषण और खगोल भौतिकी के लिए अलग रखा गया है, जिसमें दो उन्नत दूरबीन सुविधाओं का निर्माण शामिल है: 30-मीटर नेशनल लार्ज ऑप्टिकल-इन्फ्रारेड टेलीस्कोप और लद्दाख में पैंगोंग झील के पास नेशनल लार्ज सोलर टेलीस्कोप।

फोकस में भी है COSMOS-2 तारामंडल अमरावती, आंध्र प्रदेश में, जल्द ही पूरा किया जाएगा, और हानले, लद्दाख में हिमालय चंद्र टेलीस्कोप की नियंत्रण प्रणालियों में सुधार किया जाएगा। वर्तमान में, केवल अमेरिका, चीन, जापान और यूरोपीय संघ ही उच्च स्तर पर खगोल विज्ञान अनुसंधान को प्राथमिकता देते हैं और अपने स्थलीय और अंतरिक्ष दूरबीनों को उन्नत करने के लिए लगातार बड़ी रकम का निवेश करते हैं। तो, खगोलविदों ने कहा है, दूरबीन आवंटन से भारत में अंतरिक्ष अनुसंधान क्षमता और विज्ञान की पहुंच में सुधार होगा।

सीमांत अनुसंधान

हालाँकि, विशेषज्ञों ने व्यय में उल्लेखनीय गिरावट के बारे में भी चिंता जताई, क्योंकि वास्तविक व्यय बजटीय अनुमान से कम है। इस कम उपयोग के कारण अतीत में प्रमुख परियोजनाओं की योजना बनाने और उन्हें क्रियान्वित करने में बाधाएँ पैदा हुई हैं।

टाटा इंस्टीट्यूट ऑफ फंडामेंटल रिसर्च, मुंबई में खगोल विज्ञान और खगोल भौतिकी विभाग की प्रोफेसर और अध्यक्ष भास्वती मुखर्जी ने कहा, “कई प्रस्तावित अंतरिक्ष मिशन थे जिन्हें अंततः समर्थन नहीं मिला।”

डॉ. मुखर्जी ने कहा कि हालांकि यह बजट “भारत में खगोल विज्ञान के लिए एक बेहद सकारात्मक कदम है,” इसके पालन के महत्व को कम करके आंका नहीं जा सकता है: “भारत में बड़ी परियोजनाओं के निष्पादन के लिए अभी भी नियंत्रण और संतुलन के साथ संसाधनों के कुछ सुव्यवस्थितकरण की आवश्यकता होगी।”

दुनिया भर में केवल कुछ बड़ी खगोलीय वेधशालाएँ ही अग्रणी अनुसंधान और अभूतपूर्व खोज करने में सक्षम हैं, जिसका अर्थ है कि शोधकर्ताओं को अवलोकन समय के लिए प्रतिस्पर्धा करनी पड़ती है। और जब फंडिंग एजेंसियां ​​अपने ही राष्ट्रीय शोधकर्ताओं का पक्ष लेती हैं, तो अंतरराष्ट्रीय वैज्ञानिकों की पहुंच तेजी से प्रतिबंधित हो जाती है, और भारतीय कोई अपवाद नहीं हैं।

विदेशी सुविधाओं पर निर्भर रहना

मामले को और भी बदतर बनाने के लिए, एक खगोल भौतिकीविद् (जो अपनी पहचान उजागर नहीं करना चाहते थे) ने इस संवाददाता को बताया कि भारत की समस्या नौकरशाहों और प्रशासकों के रवैये से जटिल है।

“वे बड़ी दूरबीनों या मिशनों पर आंशिक समय खरीदने जैसी अवधारणाओं के बारे में करीबी विचार रखते हैं – ऐसे उपाय जो न केवल मजबूत अंतरराष्ट्रीय सहयोग को बढ़ावा देने और हमें खगोल विज्ञान अनुसंधान में सबसे आगे रखने के लिए आवश्यक हैं, बल्कि जब तक हमारे पास अपनी बड़ी दूरबीनें नहीं हैं तब तक एक स्टॉप-गैप व्यवस्था के रूप में भी काम करते हैं,” खगोलभौतिकीविद् ने कहा।

बहुत लंबे समय से देश अंतरिक्ष विज्ञान के लिए उच्च-रिज़ॉल्यूशन डेटा और विशेष उपकरणों के लिए विदेशी सुविधाओं पर निर्भर रहा है, जिसमें रेडियो, ऑप्टिकल और अंतरिक्ष-आधारित अवलोकन जैसी सहयोगी परियोजनाएं शामिल हैं। यदि भारत को विदेशी वेधशालाओं पर अपनी निर्भरता कम करनी है तो अंतरिक्ष विज्ञान और खगोल भौतिकी में मजबूत घरेलू क्षमताएं हासिल करना अनिवार्य है।

लगातार मजबूत हुआ

हालाँकि, अत्याधुनिक अंतरिक्ष अनुसंधान के लिए बड़े पैमाने पर, अगली पीढ़ी की वेधशालाओं के निर्माण में भयानक वित्तीय और तकनीकी बाधाओं पर काबू पाना शामिल है। इन चुनौतियों के लिए अक्सर अंतरराष्ट्रीय टीमों के साथ सहयोगात्मक साझेदारी की आवश्यकता होती है और उनके साथ संसाधनों और विशेषज्ञता को एकत्रित करना अक्सर भारतीय वैज्ञानिकों के लिए महत्वाकांक्षी परियोजनाओं में भाग लेने का एकमात्र तरीका होता है। पर्याप्त फंडिंग, प्रभावी प्रशासन और घरेलू उद्योग के साथ साझेदारी विदेशी सुविधाओं और अनुसंधान डेटा पर इस निर्भरता को दूर करने के लिए एक यथार्थवादी समाधान प्रदान करती है।

सौभाग्य से, भारत का खगोल विज्ञान और अंतरिक्ष अनुसंधान पारिस्थितिकी तंत्र अत्याधुनिक प्रौद्योगिकी प्लेटफार्मों के साथ लगातार मजबूत हो रहा है। इनमें ऑप्टिकल और रेडियो टेलीस्कोप शामिल हैं, जैसे पुणे के पास विशाल मेट्रोवेव रेडियो टेलीस्कोप (जीएमआरटी), और एआई-संचालित डेटा विश्लेषण में सक्षम डेटा प्रोसेसिंग केंद्र। नए बजटीय प्रोत्साहन के साथ-साथ ये प्रयास, भारत की अनुसंधान क्षमताओं को बढ़ावा दे सकते हैं, साथ ही अंतरिक्ष अनुसंधान में सार्वजनिक-निजी भागीदारी की ओर बढ़ते बदलाव से आशावाद में वृद्धि हो सकती है।

डॉ. मुखर्जी ने कहा, “दुनिया भर में बुनियादी विज्ञान और बड़े बजट के प्रयोगों के लिए राज्य एजेंसियों से धन की आवश्यकता होती है।” “हालांकि अंतरिक्ष क्षेत्र में कई निजी उद्यम हैं, उनके प्रयासों के उचित संचालन और समग्र गुणवत्ता नियंत्रण और निगरानी के लिए सरकारी एजेंसियों को शामिल करते हुए वैधानिक निकायों की स्थापना की आवश्यकता होगी।”

भारतीय विज्ञान शिक्षा और अनुसंधान संस्थान, तिरुवनंतपुरम में भौतिकी के सहायक प्रोफेसर अभिमन्यु सुशोभनन ने कहा, “पिछले एक दशक में हमने अंतरिक्ष क्षेत्र में कई स्टार्टअप देखे हैं, जो अक्सर भारतीय अंतरिक्ष अनुसंधान संगठन (इसरो) के विशेषज्ञों के साथ मिलकर काम करते हैं।” “अंतरिक्ष विभाग ने ऐसी साझेदारियों को बढ़ावा देने के लिए 2020 में भारतीय राष्ट्रीय अंतरिक्ष संवर्धन और प्राधिकरण केंद्र की स्थापना की। यह एक सकारात्मक संकेत है क्योंकि ऐसी साझेदारियां नवाचार को बढ़ावा देंगी और अंतरिक्ष क्षेत्र में निजी निवेश को आकर्षित करेंगी।”

उप-मिलीमीटर आकाश

हालाँकि, ऐसा होने के लिए, नीति निर्माताओं को “देश की खगोलीय संपत्ति से वैज्ञानिक उत्पादन को अधिकतम करने के लिए रणनीतिक संसाधन आवंटन और सहयोगात्मक पहल की अनिवार्यता” को स्वीकार करना चाहिए। लेकिन, उन्होंने आगाह किया, “हमें यह भी ध्यान रखना होगा कि निजी हित हमेशा समग्र रूप से राष्ट्र के हितों के साथ मेल नहीं खा सकते हैं।”

अंतरिक्ष विज्ञान में घरेलू अत्याधुनिक संसाधनों को विकसित करने का एक महत्वपूर्ण लाभ यह है कि यह छात्रों को देश में उन्नत अनुसंधान में संलग्न होने के लिए प्रोत्साहित करेगा, जिससे विदेशों में संस्थानों की ओर लगातार प्रतिभा पलायन को रोका जा सकेगा। लेकिन यह कहना आसान है, वास्तविकता बनने से पहले अभी भी बहुत सारे होमवर्क की आवश्यकता है। उदाहरण के लिए, जीएमआरटी दुनिया की सबसे बड़ी रेडियो टेलीस्कोप श्रृंखला है जो कम आवृत्तियों पर काम करती है और दुनिया भर के खगोलविदों को आकर्षित करती है। लेकिन देश में तुलनीय ऑप्टिकल टेलीस्कोप की अनुपस्थिति में, भारतीय वैज्ञानिकों को विदेशी सुविधाओं पर टेलीस्कोप के समय के लिए कतार में खड़े होने के लिए मजबूर होना पड़ता है, जैसा कि वे उच्च आवृत्ति रेडियो खगोल विज्ञान में अनुसंधान करने के लिए करते हैं।

इसी तरह, भारत के पास कोई टेलीस्कोप नहीं है जो क्रिटिकल सब-मिलीमीटर तरंग दैर्ध्य में काम करता हो।

डॉ. मुखर्जी ने कहा, “उप-मिलीमीटर आकाश धूल भरी उप-मिलीमीटर आकाशगंगाओं से लेकर प्रोटो-स्टेलर डिस्क की चक्राकार प्रकृति तक, ब्रह्मांड की वास्तुकला और उसके भीतर संरचनाओं की जांच के लिए एक अनूठी खिड़की है।” “एक प्रस्ताव पाइपलाइन में है और यह खगोल विज्ञान और खगोल भौतिकी मेगा साइंस विजन 2035 का भी हिस्सा है।”

जब ऐसी परियोजनाएं साकार होंगी तभी अंतरिक्ष अन्वेषण में अग्रणी बनने की दिशा में भारत की प्रगति में तेजी आ सकती है।

प्रकाश चन्द्र एक विज्ञान लेखक हैं।

प्रकाशित – 09 फरवरी, 2026 05:30 पूर्वाह्न IST

Continue Reading

विज्ञान

Why does Thwaites glacier matter?

Published

on

By

Why does Thwaites glacier matter?

यह अदिनांकित तस्वीर पश्चिमी अंटार्कटिका में थ्वाइट्स ग्लेशियर को दिखाती है। | फोटो साभार: नासा

ए: थ्वाइट्स ग्लेशियर पश्चिम अंटार्कटिका में एक बड़ा ग्लेशियर है, जो लगभग एक बड़े देश के आकार का है। वैज्ञानिकों ने अक्सर मीडिया में इसे “प्रलय का दिन ग्लेशियर” कहा है। यह उन लोगों के लिए पृथ्वी पर सबसे महत्वपूर्ण स्थानों में से एक है जो यह समझने की कोशिश कर रहे हैं कि भविष्य में समुद्र का स्तर कैसे बढ़ेगा।

ग्लेशियर भूमि पर स्थित है जो समुद्र तल से नीचे की ओर ढलान लिए हुए है, जैसे-जैसे आप अंदर की ओर आगे बढ़ते हैं। यह महत्वपूर्ण है: यह ज्ञात है कि गर्म समुद्र का पानी ग्लेशियर के तैरते किनारे, यानी इसकी बर्फ की शेल्फ के नीचे बहता है, और इसे नीचे से पिघला देता है। परिणामस्वरूप, बर्फ की शेल्फ एक डोरस्टॉप की तरह एक ब्रेस की तरह काम करती है, जो ग्लेशियर के समुद्र में प्रवाह को धीमा कर देती है। जैसे-जैसे बर्फ की परत पतली होती जाती है या जगह-जगह से टूटती जाती है, ग्लेशियर की गति तेज हो जाती है और अधिक बर्फ नष्ट हो जाती है।

वैज्ञानिकों के अध्ययन से पता चला है कि ग्लेशियर पहले से ही बदल रहा है: यह पतला हो रहा है, पीछे हट रहा है और समुद्र के स्तर में वृद्धि में योगदान दे रहा है। यदि थ्वाइट्स लंबी अवधि में पूरी तरह से ढह जाता, तो इससे वैश्विक समुद्र का स्तर लगभग आधा मीटर तक बढ़ सकता था।

थ्वाइट्स पश्चिम अंटार्कटिक बर्फ की चादर में भी पास में बर्फ जमा कर रहा है। यदि यह एक बिंदु से आगे कमजोर हो जाता है, तो अन्य ग्लेशियर भी तेजी से बर्फ खो सकते हैं, जिससे समुद्र के स्तर में और वृद्धि होगी। समुद्र के ऊंचे स्तर के कारण तटों पर आसानी से बाढ़ आ जाएगी, कटाव बढ़ जाएगा, तूफानी लहरें बढ़ जाएंगी और शहरों, निचले द्वीपों और बंदरगाहों को खतरा हो जाएगा। हालाँकि थ्वाइट्स अधिकांश आबादी वाले क्षेत्रों से बहुत दूर है, लेकिन इसमें होने वाले बदलाव दुनिया भर के लोगों को कैसे प्रभावित करेंगे।

Continue Reading

विज्ञान

Why did Anthropic’s Claude Cowork plugins spook markets? | The Hindu Explains

Published

on

By

Why did Anthropic’s Claude Cowork  plugins spook markets? | The Hindu Explains

1. क्लाउड की नवीनतम रिलीज़ में ऐसा क्या है जिसने बाज़ारों को हिलाकर रख दिया है और भारतीय आईटी शेयरों को नुकसान पहुँचाया है?

30 जनवरी को, anthropic क्लाउड कोवर्क, इसके एआई वर्कप्लेस सुइट के लिए 11 ओपन-सोर्स प्लगइन्स जारी किए। पारंपरिक चैटबॉट्स के विपरीत, कोवर्क एक स्वायत्त डिजिटल सहयोगी के रूप में कार्य करता है: यह फाइलों को पढ़ता है, दस्तावेजों का मसौदा तैयार करता है, अनुबंधों की समीक्षा करता है, और न्यूनतम मानवीय निर्देश के साथ कानूनी, वित्त, बिक्री और विपणन में बहु-चरण वर्कफ़्लो निष्पादित करता है। कुछ दिनों बाद, एंथ्रोपिक ने क्लाउड ओपस 4.6 का अनुसरण किया, जो एक मॉडल था जो वित्तीय अनुसंधान और उचित परिश्रम के लिए एआई एजेंटों की टीमों को समन्वयित करने में सक्षम था।

बाज़ार की प्रतिक्रिया तेज़ और क्रूर थी। अमेरिकी सॉफ्टवेयर शेयरों की गोल्डमैन सैक्स बास्केट मंगलवार, 3 फरवरी को 6% गिर गई। थॉमसन रॉयटर्स 15.8% (एक रिकॉर्ड), लीगलज़ूम 19.7% डूब गया, और आरईएलएक्स 14% गिर गया। वैश्विक स्तर पर लगभग 285 बिलियन डॉलर का बाज़ार पूंजीकरण ख़त्म हो गया। भारत में, निफ्टी आईटी इंडेक्स 5.87% गिर गया – मार्च 2020 के बाद से यह सबसे बड़ी गिरावट है – जिससे लगभग ₹2 लाख करोड़ का नुकसान हुआ। उस दिन टीसीएस और इंफोसिस प्रत्येक में 7% से अधिक की गिरावट आई; टेक महिंद्रा को 5% से अधिक का नुकसान हुआ। सप्ताह के दौरान, सूचकांक में 6.4% की गिरावट आई, जिसमें इंफोसिस में 8.2% और टेक महिंद्रा में 7.1% की गिरावट आई। मुख्य डर: यदि एक एआई एजेंट टीमों का काम कर सकता है, तो भारत के हेडकाउंट-आधारित आउटसोर्सिंग मॉडल को अस्तित्व संबंधी पुनर्मूल्यांकन का सामना करना पड़ेगा।

2. ‘SaaSpocalypse’ क्या है और SaaS कंपनियों को धमकी क्यों दी जाती है?

जेफ़रीज़ द्वारा गढ़ा गया यह शब्द इस डर को दर्शाता है कि एआई सॉफ़्टवेयर की जगह ले रहा है, न कि केवल इसे बढ़ा रहा है। प्रति उपयोगकर्ता सीट पर पारंपरिक SaaS शुल्क; जब एआई एजेंट स्वायत्त रूप से वर्कफ़्लो निष्पादित करते हैं, तो कम मनुष्यों को सॉफ़्टवेयर की आवश्यकता होती है। जैसा कि सीएनएन ने बताया, “अगर आंतरिक विकास में डेवलपर्स को एआई के साथ कम समय लगता है तो मुझे सॉफ्टवेयर के लिए भुगतान करने की आवश्यकता क्यों है?” एलपीएल फाइनेंशियल के थॉमस शिप से पूछा। सेल्सफोर्स में अब तक 26% की गिरावट आई है; S&P 500 सॉफ़्टवेयर एवं सेवा सूचकांक लगभग 20% गिर गया है।

यह भी पढ़ें | SaaS प्लेटफ़ॉर्म कैरियर परामर्शदाताओं को छात्रों का मार्गदर्शन करने में कैसे मदद कर सकते हैं

बैंक ऑफ अमेरिका ने इसे जनवरी 2025 के डीपसीक क्षण से मिलता-जुलता “अंधाधुंध बिकवाली” कहा, जब चीन के डीपसीक ने इस धारणा को हिला दिया कि एआई को बड़े पैमाने पर पूंजी की आवश्यकता थी और एनवीडिया को एक दिन में 589 बिलियन डॉलर का नुकसान हुआ। वह घबराहट बहुत ज़्यादा साबित हुई। बोफा का तर्क है कि यह बिकवाली विरोधाभासी आधारों पर टिकी हुई है: एआई कैपेक्स ढह रहा है जबकि एआई को अपनाना इतना व्यापक हो गया है कि यह सॉफ्टवेयर को अप्रचलित बना देता है। फिर भी संरचनात्मक बदलाव वास्तविक है। सवाल यह है कि क्या बाजार एक दशक के व्यवधान को एक ही सप्ताह में मूल्यांकित कर रहा है।

3. कानूनी, वित्तीय और स्वास्थ्य सेवाओं में एआई व्यवधान के वास्तविक दुनिया के उदाहरण क्या हैं?

इसमें कोई भी आश्चर्य नहीं होना चाहिए था। प्रक्षेप पथ स्पष्ट रूप से दिखाई दे रहा था। मार्च 2023 में, ब्लूमबर्ग ने ब्लूमबर्गजीपीटी जारी किया, जो मालिकाना वित्तीय डेटा के 363 बिलियन टोकन पर प्रशिक्षित 50 बिलियन पैरामीटर एलएलएम है – जो अब तक इकट्ठा किया गया सबसे बड़ा डोमेन-विशिष्ट वित्तीय डेटासेट है। ब्लूमबर्ग के सीटीओ शॉन एडवर्ड्स ने कहा कि यह “आउट-ऑफ़-द-बॉक्स” बहुत अधिक प्रदर्शन के साथ “हमें कई नए प्रकार के अनुप्रयोगों से निपटने में सक्षम करेगा”। ब्लूमबर्गजीपीटी ने साबित किया कि डोमेन-विशिष्ट एआई वित्तीय कार्यों पर सामान्य मॉडल को महत्वपूर्ण मार्जिन से बेहतर प्रदर्शन कर सकता है: भावना विश्लेषण, इकाई मान्यता, समाचार वर्गीकरण और क्वेरी स्वचालन। यह अवधारणा का प्रमाण था. क्लाउड कोवर्क के वित्त और कानूनी प्लगइन्स तार्किक विस्तार हैं – ब्लूमबर्गजीपीटी ने एक मंच के भीतर जो प्रदर्शन किया है उसे लेते हुए और इसे किसी भी उद्यम में एक स्वायत्त एजेंट के रूप में उपलब्ध कराया गया है।

यह भी पढ़ें | क्या कोई AI बुलबुला है? वित्तीय संस्थान चेतावनी देते हैं

कानूनी: क्लाउड के कानूनी प्लगइन-एनडीए ट्राइएज, अनुबंध समीक्षा और अनुपालन ट्रैकिंग को स्वचालित करने से बाजार में सबसे तीखी प्रतिक्रिया हुई। थॉमसन रॉयटर्स ने अब तक की सबसे बड़ी एकल-दिवसीय गिरावट दर्ज की। लीगलज़ूम लगभग 20% गिर गया। आरईएलएक्स (लेक्सिसनेक्सिस के माता-पिता) और वॉल्टर्स क्लुवर प्रत्येक को 13% से अधिक का नुकसान हुआ।

वित्तीय: यदि ब्लूमबर्गजीपीटी अपने लिए एआई का निर्माण करने वाला उद्योग था, तो एंथ्रोपिक को एम्बेड करने वाला गोल्डमैन सैक्स एआई को बढ़ावा देने वाला उद्योग है दौड़ना स्वयं. गोल्डमैन ने व्यापार लेखांकन, अनुपालन और क्लाइंट ऑनबोर्डिंग के लिए स्वायत्त एजेंट बनाने के लिए एंथ्रोपिक के साथ छह महीने की साझेदारी का खुलासा किया। सीआईओ मार्को अर्जेंटी ने कहा कि बैंक कोडिंग से परे क्लाउड की क्षमता पर “आश्चर्यचकित” था – विशेष रूप से नियामक दस्तावेजों को पार्स करने और नियम-आधारित निर्णय लागू करने में। ब्लूमबर्गजीपीटी (विश्लेषकों की सहायता करने वाला एक डोमेन मॉडल) से गोल्डमैन-एंथ्रोपिक (बैक-ऑफ़िस प्रक्रियाओं की जगह लेने वाले स्वायत्त एजेंट) की ओर बदलाव वह छलांग है जिसने निवेशकों को डरा दिया है। फैक्टसेट 10% गिर गया; एसएंडपी ग्लोबल और मूडीज में भारी गिरावट आई।

स्वास्थ्य देखभाल: पलान्टिर के साथ कॉग्निजेंट की साझेदारी ने अपने ट्राइज़ेटो हेल्थकेयर प्लेटफॉर्म के भीतर एजेंटिक एआई को एम्बेड किया है – जो आधे से अधिक अमेरिकी चिकित्सा दावों को संसाधित करता है – अपवादों के लिए मानवीय निरीक्षण के साथ, रोगी रूटिंग, दावों के निर्णय और आपूर्ति श्रृंखला कार्यों को संभालता है।

एंथ्रोपिक सीईओ डेरियो अमोदेई ने चेतावनी दी है कि एआई 1-5 वर्षों के भीतर प्रवेश स्तर की आधी सफेदपोश नौकरियों को विस्थापित कर सकता है। सेल्सफोर्स के मार्क बेनिओफ ने कहा है कि कंपनी एआई के कारण अतिरिक्त इंजीनियरों या वकीलों को काम पर नहीं रखेगी।

4. भारतीय कंपनियां इस व्यवधान को कैसे संबोधित कर रही हैं, और उन्हें कैसे करना चाहिए?

भारतीय आईटी कंपनियां निवेश कर रही हैं, लेकिन धीरे-धीरे। टीसीएस-टीपीजी ने हाइपरवॉल्ट एआई डेटा केंद्रों के लिए 2 अरब डॉलर देने का वादा किया है; विप्रो ने AI360 के लिए $1 बिलियन निर्धारित किए; इंफोसिस ने NVIDIA और Intel के साथ साझेदारी की है। कॉग्निजेंट का पलान्टिर-ट्राइज़ेटो एकीकरण एक अग्रणी एजेंटिक प्लेटफॉर्म के साथ डोमेन विशेषज्ञता का सबसे दूरदर्शी संयोजन है।

चुनौती गति है. जैसा कि रेस्ट ऑफ वर्ल्ड ने उल्लेख किया है, कोवर्क के प्लगइन्स सटीक रूप से उच्च-मात्रा, दोहराव वाले काम को स्वचालित करते हैं जो भारतीय आईटी की रोजी-रोटी है। जब गोल्डमैन सैक्स स्वायत्त एजेंटों को सह-डिज़ाइन करने के लिए अपने बैक ऑफिस में एंथ्रोपिक इंजीनियरों को शामिल कर रहा है, और पेंटागन ने पलान्टिर के $ 10 बिलियन सेना अनुबंध के तहत 75 डेटा / एआई सिस्टम को समेकित किया है, तो “धीमी उद्यम अपनाने” की रक्षा खोखली लगती है। आवश्यक धुरी श्रम मध्यस्थता से लेकर एआई परिनियोजन भागीदारी तक है। भारतीय कंपनियों के पास बैंकिंग, बीमा और स्वास्थ्य सेवा में बेजोड़ डोमेन विशेषज्ञता है – कॉग्निजेंट-पैलेंटिर मॉडल, जहां डोमेन ज्ञान प्लेटफ़ॉर्म क्षमता से मिलता है, टेम्पलेट है।

5. क्या इससे भारतीय आईटी रोजगार पर असर पड़ता है या नए तरह के अवसर पैदा होते हैं?

तत्काल संकेत चिंताजनक है. टीसीएस ने हाल ही में कर्मचारियों की संख्या लगभग 11,000 कम कर दी है; कई सीटीओ ने नए लोगों को भर्ती करना पूरी तरह से बंद कर दिया है। प्रवेश स्तर के परीक्षण, रखरखाव और अनुपालन भूमिकाएँ सबसे अधिक जोखिम में हैं। एक फिनटेक फर्म ने केन को बताया कि कुछ टीमों में फ्रेशर की नियुक्ति 80% से शून्य हो गई है।

फिर भी नई मांग उभर रही है. प्रत्येक एआई एजेंट जो एक विनियमित वातावरण में स्वायत्त कार्य करता है – स्वास्थ्य देखभाल दावे, वित्तीय ऑडिट, रक्षा रसद – को उद्योग द्वारा एचआईटीएल (ह्यूमन-इन-द-लूप) प्रक्रियाओं को कॉल करने की आवश्यकता होती है: निरीक्षण, सत्यापन, अपवाद हैंडलिंग, शासन और नैतिक समीक्षा। ये भूमिकाएँ केवल कोडिंग क्षमता ही नहीं, बल्कि डोमेन ज्ञान और निर्णय की भी मांग करती हैं। अपनी स्वायत्त क्षमताओं के बावजूद, पलान्टिर स्वयं इस बात पर जोर देता है कि इसके ऑन्कोलॉजी-संचालित दृष्टिकोण के लिए मनुष्यों को व्यावसायिक तर्क को परिभाषित करने और शासन ढांचे को बनाए रखने की आवश्यकता होती है।

गोल्डमैन के अर्जेंटीना के तनावग्रस्त एजेंट “डिजिटल सहकर्मी” होंगे, प्रतिस्थापन नहीं, क्योंकि अनुपालन के लिए किनारे के मामलों में मानवीय निर्णय की आवश्यकता होती है। तीन अवसर मौजूद हैं: तैनाती साझेदारी जो उद्यमों के अंदर एजेंटिक प्लेटफार्मों को एम्बेड और नियंत्रित करती है; विनियमित उद्योगों के लिए एचआईटीएल संचालन केंद्र; और इंजीनियरों को बॉयलरप्लेट कोड लिखने के बजाय एआई सिस्टम को आर्किटेक्ट और पर्यवेक्षण करने के लिए प्रशिक्षित करने के लिए बड़े पैमाने पर रीस्किलिंग।

6. क्या यह एक और डीपसीक क्षण है—या कुछ अधिक स्थायी?

तुलना शिक्षाप्रद है. जनवरी 2025 में, डीपसीक ने इस धारणा को हिला दिया कि एआई को बड़े पैमाने पर पूंजी की आवश्यकता है; एनवीडिया को एक दिन में $589 बिलियन का नुकसान हुआ, फिर अगले वर्ष में 58% की वृद्धि हुई। बोफा के ब्रैड सिल्स ने स्पष्ट रूप से इस सप्ताह की बिकवाली को “अतिशयोक्तिपूर्ण” कहा। गार्टनर ने लिखा है कि कोवर्क प्लगइन्स “कार्य-स्तरीय ज्ञान कार्य के लिए संभावित व्यवधान हैं, लेकिन महत्वपूर्ण व्यावसायिक संचालन का प्रबंधन करने वाले SaaS अनुप्रयोगों के लिए प्रतिस्थापन नहीं हैं।” वेसबश ने कहा कि उद्यम “पूर्व सॉफ्टवेयर बुनियादी ढांचे के अरबों डॉलर के दसियों को पूरी तरह से ओवरहाल नहीं करेंगे।”

यह भी पढ़ें | डीपसीक क्या है और यह एआई क्षेत्र को क्यों बाधित कर रहा है?

पैटर्न संभवतः डीपसीक के साथ तालमेल बिठाएगा: तेज बिकवाली, आंशिक रिकवरी, फिर धीमी गति से एहसास कि अंतर्निहित बदलाव वास्तविक है। डीपसीक ने चुनौती दी लागत अनुमान एआई के निर्माण के बारे में। क्लाउड कोवर्क चुनौतियाँ राजस्व धारणाएँ उस कार्य के बारे में जिसे AI प्रतिस्थापित कर सकता है। एक धमकी भरा इनपुट; दूसरा आउटपुट को धमकाता है। लेकिन दोनों एक ही दिशा में चलते हैं – घबराहट, सुधार, क्रमिक संरचनात्मक पुनर्मूल्यांकन। ब्लूमबर्गजीपीटी-टू-कोवर्क विकास से पता चलता है कि यह नीले रंग का बोल्ट नहीं है; यह तीन वर्षों तक दिखाई देने वाला प्रक्षेप पथ है। भारतीय आईटी के लिए, श्रम मध्यस्थता से एआई परिनियोजन की ओर बढ़ने की खिड़की बाजार की अपेक्षा कम है।

प्रकाशित – 08 फरवरी, 2026 11:19 पूर्वाह्न IST

Continue Reading

Trending