भारतीय भाषांसाठी तंत्रज्ञान | Technology for Indian languages

 भारतीय भाषांसाठी तंत्रज्ञान

भारतीय भाषांसाठी तंत्रज्ञान विकास –

माणसा माणसांत अनेक पद्धतीने संपर्क साधला जातो त्यामधे द्क् आणि श्वाव्य पद्धती सर्वोच्च स्थानावर आहे. सध्या माणूस व मशीन यांच्या दरम्यानचा संपर्क माणसाच्या सोयीपेक्षा मशीनच्या सोयीवर अधिक अवलंबून आहे. माऊस तसेच कीबोर्ड मुख्य इनपुट सांकेतिक भाषा आहे तसेच व्हिज्युअल प्रदर्शन युनिट मुख्य आऊटपुट सांकेतिक भाषा आहे. अशा प्रकारच्या इंटरफेसच्या वापरासाठी खास कौशल्याची तसेच मानसिक अभिवृत्तीची आवश्यकता असते, जे अनेकांकडे नसते. म्हणून परस्पर्रांमध्ये संपर्क प्रस्थापित करणाऱ्या या मशीन केंद्रीत मोडचे मानव-केंद्रित इंटरफेसमध्ये रूपांतर करणे आवश्यक आहे, ज्यामुळे कॉम्प्युटर सामर्थ्याचा सगळयांनाच लाभ मिळेल. खरं म्हणजे माहिती कळण्यासाठी ती डोळयासमीर प्रत्यक्ष दिसल्यास त्याचा सर्वाधिक परिणाम दिसून येतो, परंतू माहिती प्रत्यक्ष वाणीवाटे सांगण्याला सर्वाधिक प्राधन्य दिलं जातं आणि ते सोपही असतं. कॉम्प्युटर आणि दूरसंदेश दळणवळण प्रणाली एकत्रित येण्यामुळे शाब्दिक दळणवळण आज अधिक प्रभावी ठरलं आहे, ज्यामुळे लोकांना, दूरवर असलेल्या कॉम्प्युटर वरून माहिती सहजपणे मिळविता येते. 

शाब्दिक दळणवळणात नैसर्गिक भाषांचा सहभाग असल्यामुळे, माहिती तंत्रज्ञानात भाषा शास्त्राला विशेष स्थान प्राप्त झालं आहे. म्हणुनच कॉम्प्युटरसाठी मानव केंद्रित इंटरफेस ही आजच्या काळाची गरज आहे मानवाला भाषेची अनोखी देणगी मिळाली आहे ज्यामुळे तो माहिती, विचार आणि कल्पनांची आपापसात सहजगत्या देवाणघेवाण करतो. नैसर्गिक भाषांचा वापर करून माणूस आणि मशीन यांच्यामध्ये परस्पर संपर्क प्रस्थापित करण्यात, मानवी भाषा तंत्रज्ञानाच्या विविध पैलूंचा समावेश वाणी संकलन, मान्यता, आणि वाणी समजणे स्क्रिप्ट, मशीन भाषांतर आहे,: पाठ सृजन, वाणी आणि कर्सिव्ह स्क्रिप्टचे संस्लेषण, मशीन बरोबर संपर्क स्थापित करण्यासाठी लिखित आणि बोली अशी दोन्ही रूपे उपयुक्त आहेत.

कॉम्प्युटरवर भारतीय भाषांमधे काम करण्याची सोय गेल्या दोन दशकांपासून असून त्यामध्ये, डेटा प्रक्रिया, शब्द प्रक्रिया, डेस्कटॉप पब्लिशिंग इ. गाष्टींचा समावेश आहे.

माहिती तंत्रज्ञान विभागाने, कोणत्याही भाषेच्या अडथळ्याशिवाय बहुभाषिय ज्ञानाच्या स्त्रोताची निर्मिती करून ते उपलब्ध होण्यासाठी तसच त्यांचे संकलन करून, वापरकर्त्यांसाठी नाविन्यपूर्ण उप्तादन विकसित करण्यासाठी आणि त्याची सेवा उपलब्ध करून देण्याकरता माहिती प्रक्रिया साधने आणि तंत्रज्ञान विकसित करण्याच्या उद्देशाने भारतीय भाषांसाठी तंत्रज्ञान विकास म्हणजेच टी डी आय एल ने कार्यक्रमाची सुरवात केली आहे, कॉर्पोरा आणि डिक्शनरी यासारखे भाषा शास्त्र स्रोत विकसित करणाऱ्या प्रकल्पांना निधीही पुरवण्यात आला आहे, तसेच फॉन्ट, टेक्स्ट एडिटर, स्पेल चेकर, ओ सी आर आणि टेक्स्ट टू स्पीच यासारखी मूलभूत माहिती प्रक्रिया साधनेही विकसित करण्यात आली आहेत. 

भारतीय देशात भाषा तंत्रज्ञान उप्तादने आणि सेवा विकसित करण्यासाठी खाजगी, सार्वजनिक तसेच सरकारी अशा विविध पातळयांवर प्रयत्न केले गेले आहेत. स्रोत तसच कॉईलनेट केंद्रांतर्फे विकसित करण्यात आलेली भाषा तंत्रज्ञाने आणि साधने लौकरात लौकर वापरात आणली गेली पाहीजे ज्यामुळे त्यावरील प्रतिक्रिया उपलब्ध होतील आणि उप्तादनासाठी ती उपलब्ध करून देता येतील संशोधन आणि विकासासाठी करण्यात आलेल्या प्रयत्नांचा संपूर्ण समाजावर परिणाम दिसून येणं आवश्यक आहे, कारण हे विकासात्मक प्रयत्न प्रयोग शाळापुरतेच मर्यादीत न रहाता ते अधिकाधिक लोकांपर्यत पोहचले पाहीजेत, ज्यामुळे लोकांच्या (वापरकर्त्यांच्या) प्रतिक्रिया आणि अनुभव मिळून त्यात पुढे आणखी सुधारणा घडवून आणता येतील.

सरकारने पुढील उप्तादन आणि त्यावरील उपाय आगामी एक वर्षात सार्वजनिक ठिकाणी उपलब्ध करूण देण्यासाठीची सर्व तयारी पूर्ण केली आहे:

सर्व भारतीय भाषांमध्येमोफत फॉन्टस् (TTF आणि OFT) वर्ड प्रोसेसर यासाठी उचलण्यात आलेले पहिले पाऊल म्हणजे प्रकाशन उद्योगाशी संपर्क साधून तमिळ आणि हिंदी भाषेतील ट्र. टाईप फॉन्ट (TTF) सार्वजनिक ठिकाणी मोफत उपलब्ध करून देण्यासाठी निवडण्यात आले आहेत. TTF फॉन्टस् विंडोज 95/ विंडोज 98/ विंडोज NT प्लॅटफॉर्म या प्रणालींमध्ये मोठया प्रमाणात वापरले जात आहेत. विंडोज 2000/XP/2003 आणि लिनक्स प्लॅटफॉर्म यासारख्या प्रणालींसाठी ओ टी एफ ( ओपन टाईप फॉन्ट) सादर करण्यात येत आहेत. ड्रा आशातरहेचा पहिलाच प्रयत्न असून, बहुतेक वर्ड प्रोसेसर (अस्तित्वात असलेले व नवीन) या फॉन्टसचा वापर करू शकतील यामुळे तमिळ नेट/तमिळ 99 आणि टाईपरायटर कीबोर्डस् वापरकर्त्यांना डेटा एन्ट्रीसाठी फॉन्ट उपलब्ध होतील.

माहिती गोळा करणे, पुन्हा प्राप्त करणे, आणि अंकियकरणासाठी सर्व भारतीय भाषांमध्ये प्रकाशिक अक्षर ओळख (ORC) ओ आर सी मुळे स्कॅन करण्यात आलेली प्रतिकृतीचे (स्कँनरचा वापर करून छापलेल्या पानाचे स्कँनिंग) संपादित आवृत्तीत रुपांतर करण्यात येते. त्यामुळे त्याचा आवश्यक त्या सुधारणा आणि वापर करता येतो. याचा प्रकाशन व्यवसायाला सर्वाधिक लाभ मिळणार आहे कारण या साफ्टवेअरचा वापर करून, ते पुनर्मुद्रण करून नवीन प्रती छापू शकतील.

रेल्वे माहिती, आरोग्य सेवा, कृषि आपदा व्यवस्थापन आणि इतर सार्वजनिक सोयींसाठी वाणी इंटरफेस प्रणाली यामुळे बहुसंख्य लोक भारतीय भाषांमध्ये अद्ययावत प्रणालीचा लाभ घेउ शाकतील.मानवी आवाज ओळखून त्याचे, माहिती समजून घेण्यासाठी लिखित रुपात रुपांतर करण्यासाठी बोलणे ओळखणाऱ्या इंजिनाचा वापर करण्यासाठी इंटरफेस प्रणाली उपयोगात आणली जाऊ शकते. टेक्स टू स्पीचचा उपयोग दृष्टीहीन लोकांसाठी माहिती मिळविण्यासाठी टेक्स्ट वापरण्यासाठी केला जाऊ शकतो.

ब्राउजर, सर्च इंजिन, तसेच ई-मेल यासारखी इंटरनेट एक्सेस उपकरणे भारतीय भाषांसाठी वापरून भारतीय भाषेत ई-मेल पाठवणे शक्य होईल. तसेच सर्च इंजिन भारतीय भाषात माहिती शोधण्यास मदत करेल त्याच बरोबर कोणत्याही एखाद्या भारतीय भाषेत चौकशी माहिती देखील उपलब्ध करून देईल.

इंग्रजी तसेच इतर भारतीय भाषांमधे ऑनलाईन भाषांतर सेवा उपकरण. यामुळे इंग्रजी भाषेत तसच आपल्या लक्षित भारतीय भाषेत उपलब्ध माहितीचे भाषांतर करून घेण्यास मदत मिळेल.

उप्तादन/सेवा ऑनलईन हेल्प डेस्कसह टी डी आय एल डेटा सेंटरच्या माध्यमातून उपलब्ध करून देण्यात येतील. 

पुढील माध्यमांतून संशोधन, उप्तादन, नियोजन यांना चालना देण्यासाठी सरकारपुढे टी डी आय एल-डी सी करता (भाषा तंत्रज्ञान उपयोगिता चॅनल) कालबद्ध मोहीम ओह.

१. विकसित तंत्रज्ञानाला बाजारात उपलब्ध करणे

२. उत्पादन तयार करण्यासाठी तंत्रज्ञानाचा दर्जा वाढविणे किंवा त्यावर संशोधन करणे

३. आवश्यकतेनुसार नविन तंत्रज्ञानाचा विकास करणे

वरील गोष्टी प्राप्त करण्यासाठी पुठील उपाययोजना करण्यात येत आहेत:

टी डी आय एल डेटा केंद्रांच्या माध्यमातून भाषा तंत्रज्ञान/साधनांचे नियोजन बद्ध वितरण

विकसित साधने, तंत्रज्ञान, उप्तादन आणि सेवांचे अधिगृहण

उपलब्ध साधने आणि तंत्रज्ञानाच्या माध्यमातून भारतीय भाषेत सरकारने केलेल्या प्रयत्नांविषयी जागरूकता निर्माण करणे, प्रसार करणे

वापरकर्त्याला साधने, उपयोगिता, उप्तादने निःशुल्क स्वरुपात

भाषा तंत्रज्ञानात खाजगी-सार्वजनिक भागिदारीला चालना देणे.

खास वापरात येणाऱ्या क्षेत्रांमधे मोहीमेची सुरवात करणे.

Technology for Indian languages

Technology Development for Indian Languages ​​-

The DK and Shvavya methods are at the forefront of human communication. Currently the interaction between man and machine depends more on the convenience of the machine than the convenience of man. The mouse as well as the keyboard is the main input sign language as well as the visual output unit is the main output sign language. Using such an interface requires special skills as well as mental attitudes, which many do not have. So it is necessary to transform this machine-centric mode into a human-centered interface, which will benefit everyone with the power of computers. The fact is that if you look at it with the naked eye to get the information, it will have the greatest effect, but giving information verbally is the highest priority and it is also easy. The combination of computers and telecommunications systems has made word-of-mouth communication more effective today, making it easier for people to access information from remote computers.

Due to the involvement of natural languages ​​in verbal communication, linguistics has gained a special place in information technology. That is why the human-centered interface for the computer is the need of the hour. Man has got the unique gift of language that allows him to exchange information, thoughts and ideas easily. In order to establish human-machine interaction using natural languages, various aspects of human language technology include voice collection, recognition, and speech comprehension script, machine translation: text creation, synthesis of speech and cursive script, written to establish contact with machine and Both forms of dialect are useful.

The facility to work on computers in Indian languages ​​has been around for the last two decades, including data processing, word processing, desktop publishing, etc. Includes patrols.

TDIL, a technology development program for Indian languages, aims to develop information processing tools and technologies to enable the multilingual knowledge source to be available as well as compile it, to develop innovative products and services for the users, without any language barrier. Has also funded projects that develop linguistic resources such as corpora and dictionaries, as well as basic information processing tools such as fonts, text editors, spell checkers, OCRs and text to speech.

Efforts have been made at various levels, private, public as well as government, to develop language technology products and services in India. Resources as well as language technologies and tools developed by Coylenet centers should be put to use as soon as possible so that feedback is available and available for production. Research and development efforts must have an impact on society as a whole, as these developmental efforts are limited to schools. Instead, they need to reach out to more and more people, so that the feedback and experiences of the people (users) can be further improved.

The government has made all preparations to make the following products and solutions available to the public in the next one year:

The first step taken for free fonts (TTF and OFT) word processors in all Indian languages ​​is to contact the publishing industry in Tamil and Hindi. Type fonts (TTFs) have been selected for free in public places. TTF fonts are widely used in Windows 95 / Windows 98 / Windows NT platforms. OTF (open type fonts) are being introduced for systems such as Windows 2000 / XP / 2003 and Linux platforms. Draw is the first attempt of hope, as most word processors (existing and new) will be able to use these fonts, which will make Tamil Net / Tamil 99 and typewriter keyboards available to users for data entry.

In order to collect, retrieve, and digitize information, all Indian languages ​​are converted to an edited version of the scanned replica (scanning of a printed page using a scanner) by ORC. So it can be improved and used as needed. The publishing business will benefit the most as they will be able to reprint and print new copies using this software.

Voice interface systems for railway information, health services, agricultural disaster management and other public amenities will enable the majority of people to take advantage of the updated system in Indian languages. . Text to speech can be used to use text to get information for blind people.

It will be possible to send e-mails in Indian language using internet access tools like browsers, search engines, as well as e-mails for Indian languages. It will also help search engines find information in Indian languages ​​as well as query information in any Indian language.

Online translation service tool in English as well as other Indian languages. This will help you to translate the information available in English as well as your target Indian language.

The products / services will be made available through the TDIL Data Center along with the online help desk.

TDIL-DC (Language Technology Utility Channel) periodical campaign before the government to promote research, production, planning through the following mediums.

1. Making available technology available in the market

2. Enhancing or researching technology to create a product

3. To develop new technology as required

The following measures are being taken to achieve the above:

Planned distribution of language technology / tools through TDIL data centers

Acquisition of advanced tools, technologies, products and services

To create awareness and disseminate awareness about the efforts made by the government in Indian language through available tools and technology

Free tools, utilities, products for the user

Promoting private-public partnerships in language technology.

Launching a campaign in areas of special use.

Leave a Comment