लार्ज लैंग्वेज मॉडल (LLM) क्या है?
आईआईटी बॉम्बे के नेतृत्व में भारतजीपीटी समूह ने घोषणा की कि वह अपनी पहली चैटजीपीटी जैसी सेवा शुरू करेगा। समूह को रिलायंस इंडस्ट्रीज लिमिटेड और विज्ञान और प्रौद्योगिकी विभाग का समर्थन प्राप्त है। समूह ने सीता महालक्ष्मी हेल्थकेयर (SML) के सहयोग से इंडिक लैंग्वेज मॉडल की ‘हनुमान’ सीरीज या कड़ी बनाई।
दरअसल, हनुमान लार्ज लैंग्वेज मॉडल (large language models: LLMs) की एक कड़ी या सीरीज है जो हिंदी, तमिल और मराठी जैसी 11 भारतीय भाषाओं में रिस्पांस दे सकती है, जिसे 20 से अधिक भाषाओं में विस्तारित करने की योजना है।
लार्ज लैंग्वेज मॉडल (LLM)
लैंग्वेज मॉडलिंग एक ऐसी तकनीक है जो एक वाक्य में शब्दों के क्रम की भविष्यवाणी करती है।
इस तरह, लार्ज लैंग्वेज मॉडल या LLM लार्ज सामान्य प्रयोजन वाले लैंग्वेज मॉडल हैं जिन्हें पहले से प्रशिक्षित किया जा सकता है और फिर विशेष उद्देश्यों के लिए ठीक किया जा सकता है।
इसका मतलब है, इन मॉडल्स को भाषा संबंधी आम समस्याओं जैसे टेक्स्ट वर्गीकरण, प्रश्न-उत्तर, सभी उद्योगों में टेक्स्ट जनरेशन, डॉक्यूमेंट सारांश आदि को हल करने के लिए प्रशिक्षित किया जाता है।
LLM बड़ी मात्रा में टेक्स्ट को प्रोसेस करने के लिए डीप लर्निंग तकनीकों का उपयोग करते हैं। वे बड़ी मात्रा में टेक्स्ट को प्रोसेस करके, वाक्य संरचना और अर्थ को समझकर और उससे सीखकर काम करते हैं।
LLM को शब्दों के बीच अर्थ और संबंधों की पहचान करने के लिए ‘प्रशिक्षित’ किया जाता है। किसी मॉडल को जितनी अधिक मात्रा में प्रशिक्षण डेटा उपलब्ध कराया जाता है, वह टेक्स्ट को समझने और तैयार करने में उतना ही अधिक कुशल हो जाता है।
संभवतः अपेक्षाकृत छोटे आकार के फ़ील्ड डेटासेट का उपयोग करके, LLM को वित्त, रिटेल, मनोरंजन जैसे अलग-अलग डोमेन में विशेष समस्याओं को हल करने के लिए भी तैयार किया जा सकता है।
इसके मूल में एक तकनीक है जिसे “डीप लर्निंग” के नाम से जाना जाता है। इसमें आर्टिफिशियल न्यूरल नेटवर्क का प्रशिक्षण शामिल है, जो मैथमेटिकल मॉडल हैं जो मानव मस्तिष्क की संरचना और फंक्शनिंग से प्रेरित माने जाते हैं।
LLM यह लंबे आर्टिकल्स, समाचार कहानियों, शोध रिपोर्टों का सारांश प्रस्तुत कर सकता है; ये प्रश्नों को समझकर उनका उत्तर दे सकते हैं, सुझाव दे सकते हैं और नेचुरल लैंग्वेज यानी आम भाषा में आपसे बातचीत कर सकते हैं।
यह डेवलपर्स को एप्लिकेशन बनाने और त्रुटियों और सुरक्षा-संबंधी गलतियों को ढूंढने में सहायता कर सकता है।