काठमाडौँ
००:००:००
१६ असार २०८३, मंगलवार

आवरण

प्रविधिलाई नेपाली भाषा सिकाउने संस्थागत प्रयास र पूर्वाधारको कमीले भाषिक प्रयोग खुम्चिने जोखिम

१६ असार २०८३
अ+
अ-

संवैधानिक परिषद्ले वरिष्ठता मिचेर मनोजकुमार शर्मालाई प्रधानन्यायाधीशमा सिफारिस गरेको बचाउमा २६ वैशाखमा प्रतिनिधिसभाकी उपसभामुख रुबीकुमारी ठाकुरले फेसबुकमा स्टेटस लेखेकी थिइन्। मैथिली भाषामा लेखिएको स्टेटसमा आफ्नो तर्कलाई बलियो बनाउन उनले च्याटजीपीटीबाट प्राप्त जवाफको स्क्रिनसट राखेकी थिइन्। नेपाली भाषामा लेखिएको स्क्रिनसटमा न्याय परिषद्ले प्रधानन्यायाधीशका लागि सिफारिस गरेका वरिष्ठ न्यायाधीशहरू नेपाली कांग्रेस, नेकपा (एमाले) सँग निकट रहेको उल्लेख थियो। शर्मा भने कुनै पनि दलसँग नजोडिएको लेखिएको थियो।

च्याटजीपीटीको स्क्रिनसटमा न्यायाधीशहरूको दलीय निकटता देखाइएको स्रोत आधिकारिक थिएनन्। बरु सामाजिक सञ्जाल रेडिट र विकिपिडियालाई स्रोत बनाइएको थियो। स्टेटस विवादित भएपछि ठाकुरले हटाइन्।

उपसभामुख रुवीकुमारी ठाकुरले सामाजिक सञ्जालमा लेखेको स्टेटस।

सत्तारूढ राष्ट्रिय स्वतन्त्र पार्टी (रास्वपा)का सांसदहरूले संसद् बैठकमा बोल्ने विषयवस्तु जुटाउन च्याटजीपीटीजस्ता एआई (कृत्रिम बुद्धिमत्ता) टुलको प्रयोग गर्ने गरेको भन्दै प्रश्न उठेपछि उक्त पार्टीले आफ्ना विधायकलाई सचेत गरायो। ६ जेठमा रास्वपाका सांसदहरूको ह्वाट्सएप ग्रुपमा सचेतक क्रान्तिशिखा धितालले विषयवस्तु नभए नबोल्दै ठीक हुने तर एआईको प्रयोग अबदेखि नगर्न सजग गराएकी थिइन्। च्याटजीपीटीमा पूर्ण रूपमा भर पर्दा गलत वा अपूरा कुरा आउन सक्ने भन्दै उनले संसद्‌मा प्रस्तुत हुँदा आफैँले अध्ययन गरेर मौलिक र तथ्यपूर्ण धारणा राख्न सुझाव दिएकी थिइन्।

५ असारमा पूर्वप्रधानमन्त्री तथा नेपाली कम्युनिष्ट पार्टी (नेकपा)का सह-संयोजक माधवकुमार नेपालले पनि एआईको प्रयोगबारे आफ्नो रोचक अनुभव सुनाए। उक्त दिन कोटेश्वरको पेरिसडाँडास्थित नेकपा मुख्यालयमा आयोजित कार्यक्रममा उनले आफूबारे च्याटजीपीटीलाई सोध्दा गलत जानकारी पाएको बताए। उनले भने, “च्याटजीपीटी चलाएको, सोधेँ म को हुँ, थाहा छ? फ्याटफ्याट बताउन थाल्यो। बताएको त गल्ती बताएको छ। ‘यो गल्ती बताउने हो?’ भनेँ। ‘के गल्ती भयो’ भनेर उसले नै सोध्यो। ‘तिमीले मेरा दुई वटा छोरा छ भन्यौ। एउटा छोरा, एउटा छोरी भएकोमा दुइटै छोरा हो?’ अनि गल्ती भयो, म करेक्सन गर्छु भन्यो।” नेता नेपालका एक छोरा र एक छोरी छन्।

नेता र सांसदका फेसबुक स्टेटसदेखि संसद्का भाषणसम्ममा एआई टुलहरू प्रयोगको अनुभवले यी प्लेटफर्म नेपाली भाषा र स्थानीय सन्दर्भमा तथ्यपरक सूचना र विवरणमा भरपर्दो बनिनसकेको देखाउँछ। पछिल्लो समय एआई प्लेटफर्ममा मानिसहरूको निर्भरता बढिरहेको छ। सामान्य सूचना, जानकारी र विषयको जोरजाम गर्ने, दिनचर्यामा आइपर्ने कठिनाइको निकास खोज्नेदेखि जीवनकै जटिलताका उपाय सोध्नेसम्ममा यस्ता प्लेटफर्मको प्रयोग बढेको छ।

सांसद र नेताहरूले सामाजिक सञ्जालका स्टेटस र भाषण लेख्नदेखि विभिन्न विषयमा आफ्नो तर्क प्रभावकारी बनाउन एआई टुलहरूको प्रयोग गर्न थालेका छन्। एआई टुलको प्रयोग गरेर तयार पारिएका सामग्री छरितो र प्रभावकारी जस्तो देखिए पनि तथ्यगत रूपमा गलत, अपूरो र भ्रामक हुने विषयलाई अधिकांशले ख्याल गरेको देखिँदैन। अध्ययन-अनुसन्धानमा सहयोगीका रूपमा प्रयोग गर्नुपर्ने यस्ता टुलहरूले गल्ती पनि गर्न सक्छन् भन्ने थाहा नपाएर सर्वोपरि ठान्दा जनप्रतिनिधिदेखि ठूला नेताहरूसमेत तथ्यमा चुक्ने र विवादमा पर्ने गरेका छन्।

एआई टुलबाट नेपाली भाषामा आउने जवाफ गल्ती हुने सम्भावना अधिक हुनुको कारण एलएलएमको डेटा तालिम हुन नसक्नु मात्र होइन, नेपाली भाषाको डिजिटल रूप तयार पार्न पर्याप्त प्रयास नहुनु पनि हो।

च्याटजीपीटी जस्ता प्लेटफर्महरूले दिने जानकारी र विवरण अन्य भाषाको तुलनामा अंग्रेजीमा राम्रो मानिन्छ। तर, नेपाली भाषा र सन्दर्भमा अभ्यस्त नभइसकेका कारण त्रुटि र गडबडीको मात्रा ज्यादा हुन्छ। प्रविधिलाई नेपाली भाषा सिकाउन पर्याप्त तालिमका काम नहुँदा तिनबाट नेपालीमा प्राप्त हुने नतिजा गलत, भ्रामक, आधाअधुरा र कहिलेकाहीँ त अनर्थ लाग्ने किसिमका हुने गरेका छन्।

एआई क्षेत्रका विज्ञहरूका अनुसार नेपाली भाषामा एआईको प्रयोग लेखनमा सहयोगी, सारांश तयार पार्न, भाषा सुधार्न र कुनै विषयको छलफललाई कसिलो बनाउनमा गर्न सकिन्छ। तर, तथ्य समेट्न, कानुनी सल्लाह लिन, राजनीतिक विश्लेषण तयार पार्न पूर्ण रूपमा भर पर्दा त्यस्तो विषय गलत हुने सम्भावना उच्च हुन्छ। कुनै विषयमा प्रारम्भिक खाका तयार पार्न उपयुक्त भए पनि तथ्य, स्रोत, उद्धरण, तिथिमिति, ठाउँ र त्यसमा भनिएको सन्दर्भहरूको तथ्य जाँच गर्नु अनिवार्य हुन्छ।

काठमाडौँ विश्वविद्यालयको कम्प्युटर साइन्स तथा इन्जिनियरिङ विभागका प्राध्यापक बालकृष्ण बल अहिले प्रचलित च्याटजीपीटी, जेमिनाई, क्लडसहितका एलएलएम (लार्ज ल्याङ्ग्वेज मोडल)का प्लेटफर्महरू नेपालको स्थानीय सन्दर्भअनुसार नभएकाले त्यस्तो समस्या आउने गरेको बताउँछन्। “च्याटजीपीटी जस्ता प्लेटफर्महरूले अन्य भाषाको तुलनामा अंग्रेजीमा राम्रै काम गरे पनि त्यसको पनि तथ्य जाँच गर्नुपर्ने हुन्छ। तर, नेपाली भाषामा अविकसित अवस्थामै रहेकाले खोजी नतिजामा जे आउँछ त्यसलाई हुबहु ग्रहण गर्न थालियो भने दुर्घटना निम्तिन्छ,” उनी भन्छन्।

गत २३ जेठमा नेपाल र भारतबीच भाषा एआई र डिजिटल पूर्वाधार विकासका लागि भएको सम्झौता। तस्बिर स्रोत : पीआईवी डट जीओभो डट इन

एलएलएमलाई स्थानीय संस्कृति, सभ्यता, रहनसहन, बोलीचालीसँग मेल खाने गरी तालिम दिए मात्रै त्यसले खोजेको कुरा बढी मिल्ने बल बताउँछन्। भन्छन्, “हामीलाई हाम्रो माटोसुहाउँदो जानकारी चाहिने हो, त्यसका लागि स्थानीय सन्दर्भका डेटामा एलएलएमलाई अभ्यस्त बनाउनुपर्ने हुन्छ।”

बलका अनुसार हामीले कुनै विषय सोध्दा वा खोज्दा एलएलएमले त्यससम्बन्धी आधिकारिक स्रोतबाट तथ्य र जानकारी सर्लक्क ल्याएर पस्किदिने होइन। त्यसलाई तालिम दिएको डेटालाई आधार मानेर सम्भावित उत्तर दिन्छ। स्थानीय सन्दर्भ र परिस्थितिको बारेमा पर्याप्त जानकारी रहेको नेपाली भाषाको डेटा भण्डार नहुँदा एआई टुलले दिने उत्तरमा धेरै गल्ती हुन्छन्। जसले नेपाली भाषामा एआई टुल चलाउने कुरा संकुचित गरेको छ। बल भन्छन्, “बाहिरकै बृहत् प्रकारको बहुभाषी मोडललाई हामीले हाम्रो सन्दर्भका डेटाहरू दिएर ट्रेनिङ गराउने हो भने राम्रो परिणाम दिन्छ।”

विज्ञहरू नेपाली भाषासम्बन्धी डेटा संकलनको काम मध्यम स्तरमा रहेको बताउँछन्। मेसिन लर्निङ तथा अल्गोरिदम प्रोग्रामर सन्त बस्नेत अहिले प्रि-ट्रेनिङ मोडल (कुनै विशेष कामका लागि तयार पार्नुअघि ठूलो परिमाणको डेटामा तालिम दिइएको मोडल) प्रयोग गरेर त्यसलाई हाम्रो डेटाअनुसार ‘रि-ट्रेनिङ’ र ‘फाइन ट्युन’ गरिएको बताउँछन्। “हाम्रोमा काम नभएको होइन, तर संगठित प्रयास हुनुपर्नेमा फरक फरक समूहबाट काम भएको छ,” उनी भन्छन्।

साना-खुद्रा प्रयास

एआई टुलबाट नेपाली भाषामा आउने जवाफ गल्ती हुने सम्भावना अधिक हुनुको कारण एलएलएमको डेटा तालिम हुन नसक्नु मात्र होइन, नेपाली भाषाको डिजिटल रूप तयार पार्न पर्याप्त प्रयास नहुनु पनि हो। नेपालमा एआई कसरी प्रयोग गर्ने भन्नेबारे सरकारले नीति ल्याएको एक वर्ष हुन लाग्यो। साउन २०८२ मा मन्त्रिपरिषद्ले स्वीकृत गरेको राष्ट्रिय आर्टिफिसियल इन्टेलिजेन्स नीति, २०८२ मा एआई नियमन परिषद्, राष्ट्रिय एआई केन्द्र, एआई एक्सिलेन्ट सेन्टर स्थापना गर्ने उल्लेख छ। तर, त्यससम्बन्धी काम भएको छैन। सरकारले आगामी आर्थिक वर्ष २०८३/८४ को बजेटमा काठमाडौँको स्युचाटारमा डेटा र कम्प्युटिङ सेन्टर स्थापना गर्ने विषय उल्लेख छ। यस्तै, अनुसन्धान गर्ने संस्थाहरूलाई हजारौँको संख्यामा एआई प्रोसेसर युनिट उपलब्ध गराउने जनाइएको छ।

नेपाल एआई पूर्वाधार र नीतिगत तयारीको हिसाबले कमजोर देशमा पर्छ। अक्सफोर्ड इन्साइट्सले तयार पारेको ‘गभर्मेन्ट एआई रेडिनेस इन्डेक्स २०२५’ मा १९५ देशमध्ये नेपाल १०६औँ स्थानमा छ। अघिल्लो वर्षको तुलनामा नेपालले ४६औँ स्थानमा फड्को मारे पनि भुटान र बाङ्लादेशभन्दा पनि कमजोर अवस्थामा छ। सूचीमा भुटान १०२औँ, बाङ्लादेश ७५औँ, भारत २७औँ र चीन आठौँ स्थानमा छन्। यसले नेपाल एआईको तयारीको हिसाबले अझै पछाडि रहेको देखाउँछ।

सरकारी तयारीको हिसाबले कमजोर देखिए पनि प्रविधिलाई नेपाली भाषा बुझाउने काम भने दुई दशकदेखि सुरू भएको प्राध्यापक बल बताउँछन्। उनका अनुसार यस्ता प्रयासमा अनुसन्धान संस्था, विश्वविद्यालय र निजी क्षेत्रका कम्पनीहरूको भूमिका छ। सुरुमा हिज्जे र त्यसपछि इमेज ढाँचामा रहेको शब्दलाई सम्पादनयोग्य ढाँचामा लैजाने ओसीआर (अप्टिकल क्यारेक्टर रिकग्निसन)मा काम भयो। नेपाली भाषा ‘टेक्स्ट टु स्पिच’ (दिएको पाठ सस्वर पढिदिने), ‘अटोमेटिक स्पिच रिकग्निसन’ (बोलेको कुरा लेखिदिने), मेसिन ट्रान्सलेसन (अनुवाद) जस्ता विषयमा काम भएका छन्। बलकै नेतृत्वमा अंग्रेजी, नेपाली र तामाङ भाषामा अनुवादको काम भएको थियो। नेपालमा भएका यस्ता प्रयासहरू परियोजनामा आधारित छन्।

भाषा आयोगका अध्यक्ष कृष्णप्रसाद न्यौपाने बजेट अभावका कारण एआईसम्बन्धी काम गर्न सक्ने अवस्था नै नरहेको बताउँछन्।

त्रिभुवन विश्वविद्यालयका भाषाविज्ञानका उपप्राध्यापक भिम नारायण रेग्मी राज्य वा विश्वविद्यालयले यस विषयमा योजनाबद्ध रूपमा काम नगरेको बताउँछन्। “केही मानिस विगत आठ-दस वर्षदेखि पत्रिका र अनलाइनमा प्रकाशित सामग्रीलाई व्यवस्थित गर्ने र डाउनलोड गर्ने काममा लागेको देखिन्छ। व्यक्तिगत रूपमा, सानो समूह र निजी कम्पनीबाट यस्ता काम भएका छन्,” उनी भन्छन्, “राज्य र विश्वविद्यालयको तहबाट लागेको देख्दिनँ। केही काम परियोजनामा आधारित छन्। भएका कामलाई कसरी जोगाइराख्ने भन्नेमा कामै भएको छैन।” परियोजना सकिएपछि त्यसमा काम गरेका जनशक्तिलाई अड्याउने उपाय पनि नभएको उनको भनाइ छ।

एआईसम्बन्धी काम गर्ने नेपाली कम्पनी वाइज-याकमा कार्यरत मेसिन लर्निङ तथा अल्गोरिदम प्रोग्रामर बस्नेतका अनुसार नेपालमा मेसिनलाई नेपाली भाषा सिकाउने काममा फरक फरक समूहले काम गरिरहेका छन्। “अहिलेसम्म ससानो रूपमा मात्र काम भएका छन्, सरकारी निकायहरूले पनि आफ्नो आवश्यकताअनुसार सानो आकारमा काम गरेर आफैँले प्रयोग गर्ने गरेका छन्। सबैलाई लागु हुने र एकीकृत ढाँचाको काम भएकै छैन,” बस्नेत भन्छन्।

नेपाली भाषाको हिज्जेलाई एकरूपता कायम गर्न प्रोग्राम लेखेका बस्नेत मानक हिज्जे लागु गराउन सरकारका कुनै पनि निकायले स्वामित्व नलिएको गुनासो गर्छन्। जसका कारण प्रकाशन गृह र सञ्चारमाध्यमपिच्छे फरक हिज्जेको अभ्यास चलिरहेको उनी बताउँछन्। भन्छन्, “कान्तिपुर पत्रिकाले एक प्रकारको हिज्जे लेख्छ, अन्य सञ्चारमाध्यमले अर्कै चलाउँछन्। नेपाली हिज्जे लेखनमा कसरी एकरूपता कायम गर्ने भनेर सरकारलाई चासै छैन।”

काठमाडौँ विश्वविद्यालयका प्राध्यापक बल प्रविधिमा नेपाली भाषाको मानक स्थापित गर्न नेपाल प्रज्ञा-प्रतिष्ठान, भाषा आयोग जस्ता सरकारी संस्थाहरूले पहल गर्नुपर्ने बताउँछन्। “अहिलेसम्म हामीले जेजस्ता काम गर्‍यौँ, कुनै अनुसन्धान संस्था, कुनै कम्पनी वा विश्वविद्यालयबाट छुट्टाछुट्टै रूपमा भएका छन्। यसलाई संगठित र एकीकृत हिसाबले काम गर्नुपर्छ भनेर आवाज उठाएको धेरै वर्ष भइसक्यो, तर अहिलेसम्म हुन सकेको छैन,” उनी भन्छन्।

नेपाली भाषाको साझा ‘कर्पस’ (पाठ संग्रह) तयार नहुँदा एआईले नेपाली भाषा र सन्दर्भमा दिने उत्तर कमजोर हुने गरेको विज्ञहरू बताउँछन्।

भाषा आयोगका अध्यक्ष कृष्णप्रसाद न्यौपाने बजेट अभावका कारण एआईसम्बन्धी काम गर्न सक्ने अवस्था नै नरहेको बताउँछन्। भन्छन्, “यो वर्ष कार्यक्रमका लागि भनेर सरकारले १८ लाख रुपैयाँ मात्रै विनियोजन गरेको छ। यति बजेटबाट सात वटै प्रदेशमा कार्यक्रम गर्नुपर्नेछ, यसले के नै गर्न सकिन्छ र?”

बजेट अभावका साथै आयोगसँग एआईसम्बन्धी काम गर्ने जनशक्ति पनि नभएको न्यौपाने बताउँछन्। “हाम्रो दरबन्दी कम्प्युटर अपरेटरको मात्रै हो, उनीहरूबाट एआईको काम हुन सक्दैन,” उनी भन्छन्। आयोगमा ३५ जना कर्मचारीको दरबन्दी भएको र त्यसमा पनि पूरै जनशक्ति नभएको उनको भनाइ छ।

नेपाली भाषाको साझा ‘कर्पस’ (पाठ संग्रह) तयार नहुँदा एआईले नेपाली भाषा र सन्दर्भमा दिने उत्तर कमजोर हुने गरेको विज्ञहरू बताउँछन्। कर्पस भनेको एआईलाई कुनै पनि भाषा सिकाउन, जाँच्न वा सुधार्न प्रयोग गरिने टेक्स्ट/अडियो डेटाको ठूलो र व्यवस्थित संग्रह हो। यसमा समाचार, पुस्तक, सरकारी कागजात, सार्वजनिक अभिलेख, भाषण, सामाजिक सञ्जालका पोस्ट, शब्दकोश, अनुवाद, अडियो ट्रान्सक्राइब हुन्छन्। एआई मोडललाई तालिम दिन, परीक्षण गर्न वा मूल्यांकन गर्न कर्पसको प्रयोग गरिन्छ। तर, कर्पसमा एकरूपता छैन।

मानकको अभाव

विज्ञहरूका अनुसार नेपाली भाषामा रहेको गुणस्तरीय डेटाबाट तालिम दिएमा एआईले राम्रो नतिजा दिन्छ। त्यस्तो तालिमका लागि भाषाको मानक तयार पार्नुपर्ने उनीहरू बताउँछन्। अर्थात्, कम्प्युटिङ सिस्टममा भाषिक एकरूपता कायम भएका गुणस्तरीय सामग्रीहरू बढीभन्दा बढी राखिनुपर्छ।

नेपाली भाषाका लेखन सामग्रीलाई विभिन्न संस्थाले डिजिटाइजेसन गर्दै आएका छन्। जसमध्ये एक हो, मदन पुरस्कार पुस्तकालय। पुस्तकालयका अनुसन्धान निर्देशक दीपक अर्याल नेपाली भाषाका गुणस्तरीय सामग्री कम्प्युटिङ प्रणालीमा राख्दै जानु राम्रो हुने भनिए पनि त्यो प्रणालीमा कहाँको डेटा हाबी हुन्छ भन्ने संवेदनशील प्रश्न भएको बताउँछन्। खासगरी, नेपाली भाषा नेपालसँगै भारतका दार्जिलिङ, सिक्किम र आसामसहितका उत्तरपूर्वी राज्यहरूमा बोलिने भएकाले भारतले कर्पस अभिलेखनमा गर्ने कामले हामीलाई प्रभावित बनाउन सक्ने उनको चिन्ता छ।

एआईले नेपाली भाषामा राम्रो नतिजा दिने हो भने भाषाको प्रयोग बढ्थ्यो र फस्टाउँदै जान्छ, त्यसो नहुँदा प्रयोग खुम्चिँदै गएर अन्तत: लोप हुने जोखिम हुन्छ।

नेपाल र भारतका राज्यमा प्रयोग हुने भाषा कथ्यसँगै लेख्य पनि फरक छ। यस स्थितिमा नेपालभन्दा भारततर्फको नेपाली भाषाको डेटा कम्प्युटिङ प्रणालीमा बढी आएमा हामीले बोल्दै आएको भाषाको अवस्था के हुने भन्ने प्रश्न छ। “भारतले नेपाली भाषामा काम गर्दा उतै बोलिने र लेखिने भाषामा काम गर्ने हो। भारतीय नेपालीहरूको नेपाली भाषासम्बन्धी डेटा बढी भयो भने प्रविधिमा त्यही हाबी हुन्छ र उनीहरूकै डेटाको आधारमा एआईले नतिजा दिन्छ,” अर्याल भन्छन्।

देवनागरी लिपिमा धेरै भाषा लेखिने भएकाले अन्य भाषामा भएका शब्दलाई पनि एआईले नेपाली भनेर बुझ्न सक्ने हुँदा गल्ती हुने जोखिम रहेको उनी बताउँछन्। “यस्तो हुँदा देवनागरी लिपिमा लेखिएका शब्दहरू कुन भाषाको हो भनेर कसरी छुट्याउने,” अर्याल भन्छन्, “एउटै शब्दले फरक फरक भाषामा फरक फरक अर्थ दिन्छ। यसैले अन्य भाषामा रहेका शब्दहरूसँग नेपाली भाषा छुट्याउने संयन्त्र आवश्यक छ।”

भारत सरकारले प्रयोगकर्तामा भाषिक अवरोध हटाउन र गुणस्तर सुधार्न जुलाई २०२२ देखि एआईमा आधारित प्लेटफर्म ‘भाषिणी’ प्रयोगमा ल्याएको छ। जसले भारतका क्षेत्रीय भाषाबीच अनुवाद, बोलीलाई अक्षर र अक्षरलाई बोली बनाउने र भाषा सेवा पहुँचलाई विस्तार गर्ने गर्छ।

भारतका साथै दक्षिण कोरिया, जापान, सिंगापुरलगायत देशहरूले स्थानीय भाषाका लागि कर्पस, बोलिने भाषाको डेटा, अनुवाद मोडल र प्लेटफर्ममा ठूलो लगानी गरेका छन्। दक्षिण कोरिया र जापानले आफ्नो भाषाका लागि ठूला मोडल र कर्पस विकास गरेका छन्।

महँगो प्रविधि

नेपाली भाषामा एआईलाई सुधार्न दुई स्तरमा काम गर्न सहज हुन्छ। पहिलो, नेपाली कर्पसको मानक बनाएर एआईले उत्तर दिँदा आधिकारिक स्रोतबाट खोजेर दिने प्रणाली विकास गर्ने। दोस्रो, कर्पस, अनुवाद गरिएका शब्द, बोलीचालीको अडियो र मानिसले प्रमाणीकरण गरेको डेटा प्रयोग गरेर नेपाली सन्दर्भअनुसार फाइन ट्युन गर्ने।

यसबाहेक देशको आफ्नै एलएलएम अर्थात् एआई मोडल बनाउने विकल्प पनि हुन्छ। तर यो असाध्यै महँगो र दीर्घकालीन परियोजना हो। यसका लागि जीपीयू (ग्राफिक प्रोसेसिङ युनिट)को पूर्वाधार, डेटा लाइसेन्सिङ, भाषाविद्, इन्जिनियर र निरन्तर प्रमाणीकरण चाहिन्छ। भारतले भाषिणी प्लेटफर्मका लागि चार अर्ब ५० करोड भारतीय रुपैयाँ खर्च गरेको थियो।

केही समययता हार्डवेयरको मूल्य अचाक्ली बढेका कारण अब बनाइने एआई परियोजना झनै महँगो हुने दक्षिण कोरियाको योहान्से विश्वविद्यालयमा एआई अध्यापन गर्ने सञ्जय पौडेल बताउँछन्। “पछिल्लो दुई वर्षमा हार्डवेयरको मूल्य बढेर दोब्बर जस्तै भएको छ। अब त नेपाल जस्तो देशले एआई पूर्वाधार बनाउने खर्च धान्न नसक्ने अवस्था छ।”

मेसिन लर्निङ तथा अल्गोरिदम प्रोग्रामर बस्नेत नेपालीहरूले आफ्नै प्रयासमा बनाएका एआई प्रणालीहरूलाई लोकल होस्टमै प्रयोग गर्ने क्षमता पनि नभएको बताउँछन्। “डेमोका लागि एकदुई वटामा हेर्न त राम्रै देखिन्छ, तर व्यावसायिक रूपमा धेरैलाई सेवा दिने खालको पूर्वाधार नेपालका कुनै पनि डेटा सेन्टरसँग छैन,” उनी भन्छन्।

होस्टिङमा कति पैसा लाग्ने र त्यो धान्न सक्ने या नसक्ने भन्नेबारे छलफल नै सुरु नभएको उनी बताउँछन्। प्रविधि महँगो हुँदै जाँदा स्थानीय आवश्यकताअनुसार प्रविधिलाई ढाल्ने काम हुन नसकेर नेपाली भाषाको प्रयोग संकुचित हुने सम्भावना बढेको उनको भनाइ छ। कम्प्युटिङ सिस्टमका लागि आवश्यक पर्ने ऊर्जासहितका पूर्वाधारमा पनि नेपाल कमजोर रहेका कारण चुनौती रहेको उनी बताउँछन्।

त्रिभुवन विश्वविद्यालयको भाषाविज्ञान विभागका उपप्राध्यापक रेग्मी कम्प्युटिङ प्रणालीमा आवश्यक काम नगरिँदा नेपाली भाषाको प्रयोग खुम्चिन सक्ने बताउँछन्। “एआईले नेपाली भाषामा राम्रो नतिजा दिने हो भने भाषाको प्रयोग बढ्थ्यो र फस्टाउँदै जान्छ, त्यसो नहुँदा प्रयोग खुम्चिँदै गएर अन्तत: लोप हुने जोखिम हुन्छ,” उनी भन्छन्।