2013 ഒക്‌ടോബർ 13, ഞായറാഴ്‌ച

ശില്പ - ഇന്ത്യന്‍ ഭാഷാകമ്പ്യൂട്ടിങിലെ സമഗ്രസംരംഭം




ശില്പ - ഇന്ത്യന്‍ ഭാഷാകമ്പ്യൂട്ടിങിലെ സമഗ്രസംരംഭം
**************************
*****


ഭാഷാകമ്പ്യൂട്ടിങ് രംഗത്ത് ഇന്ത്യയില്‍ നടക്കുന്ന സ്വതന്ത്ര സോഫ്റ്റ്‌വേര്‍ സംരംഭങ്ങളെ ഒരു കുടക്കീഴില്‍ കൊണ്ടുവരാന്‍ നടക്കുന്ന ശ്രമം ശ്രദ്ധേയമാകുന്നു. അതിനായി നാലുവര്‍ഷം മുമ്പാരംഭിച്ച 'ശില്പ സംരംഭ' ( silpa project )ത്തിന് കീഴില്‍ നിലവില്‍ പതിനഞ്ചോളം ഭാഷാകമ്പ്യൂട്ടിങ് സോഫ്റ്റ്‌വേറുകള്‍ ലഭ്യമാണ്.

ഇപ്പോള്‍ പന്ത്രണ്ടാം വാര്‍ഷികം ആഘോഷിക്കുന്ന 'സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങി'ലെ സന്നദ്ധപ്രവര്‍ത്തകരാണ് 'ശില്പ'യ്ക്ക് ചുക്കാന്‍ പിടിക്കുന്നത്. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങിന്റെ ഒരുവര്‍ഷം നീളുന്ന വാര്‍ഷികാഘോഷ പരിപാടികള്‍ ഒക്ടോബര്‍ 14, 15 തീയതികളില്‍ തൃശ്ശൂര്‍ സാഹിത്യ അക്കാദമി ഹാളില്‍ ആരംഭിക്കുകയാണ്.

'രാജ്യത്ത് ഭാഷാകമ്പ്യൂട്ടിങ് രംഗത്ത് സര്‍ക്കാര്‍തലത്തില്‍ ഒട്ടേറെ ഗവേഷണങ്ങള്‍ നടക്കുന്നുണ്ട്. പക്ഷേ, അത്തരം ഗവേഷണപദ്ധതികളുടെ ഫണ്ടെത്തുന്നത് പലപ്പോഴും ബഹുരാഷ്ട്ര കുത്തക കമ്പനികളില്‍ നിന്നാകയാല്‍ , അവയൊന്നും രാജ്യത്തെ സാധാരണക്കാര്‍ക്ക് വേണ്ടി പുറത്തിറക്കാന്‍ കഴിയാറില്ല' -സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ് കൂട്ടായ്മയുടെ സെക്രട്ടറി അനിവര്‍ അരവിന്ദ് അറിയിക്കുന്നു.

ഭാഷാകമ്പ്യൂട്ടിങ് ഗവേഷണം സുതാര്യമായി നടക്കേണ്ട പ്രവര്‍ത്തനമാണ്. എന്നാല്‍ സര്‍ക്കാര്‍ തലത്തില്‍ അത്തരം ഗവേഷണങ്ങള്‍ക്ക് രഹസ്യസ്വഭാവമുള്ളതുകൊണ്ട് അവ പലപ്പോഴും പരാജയപ്പെടുകയാണ് ചെയ്യാറ്. അതില്‍നിന്ന് ഭിന്നമാണ്, പൊതുജനങ്ങളെ ലക്ഷ്യമാക്കി സ്വതന്ത്ര സോഫ്റ്റ്‌വേര്‍ പ്രവര്‍ത്തകര്‍ നടത്തുന്ന ഭാഷാകമ്പ്യൂട്ടിങ് പ്രവര്‍ത്തനമെന്ന് അനിവര്‍ ചൂണ്ടിക്കാട്ടുന്നു.

സ്വതന്ത്ര സോഫ്റ്റ്‌വേര്‍ അധിഷ്ഠിതമായ ഭാഷാകമ്പ്യൂട്ടിങ് സാങ്കേതികവിദ്യകള്‍ ഏവര്‍ക്കും ലഭ്യമാക്കുകയെന്ന ലക്ഷ്യത്തെടെയാണ് 2009 ഏപ്രിലില്‍ 'ശില്പ സംരംഭം' ആരംഭിച്ചത്. http://silpa.org.in/ എന്ന വിലാസത്തില്‍ ലഭ്യമായ 'ശില്പ'യില്‍ പതിനഞ്ചോളം ഇന്ത്യന്‍ ഭാഷാകമ്പ്യൂട്ടിങ് സോഫ്റ്റ്‌വേറുകള്‍ ലഭ്യമാണ്.

'ഉപയോക്താവ് ഏത് ഭാരതീയഭാഷയിലെഴുതിയാലും, ഭാഷയേതെന്ന് സോഫ്റ്റ്‌വേര്‍ തന്നെ കണ്ടുപിടിക്കുമെന്നതാണ് ഇവയുടെ പൊതുസവിശേഷത'-അനിവര്‍ അറിയിക്കുന്നു.

ശില്പയില്‍ ലഭ്യമായ സോഫ്റ്റ്‌വേറുകള്‍ ഏതെന്ന് നോക്കാം -

1. നിഘണ്ടുക്കള്‍ : ഇംഗ്ലീഷ്-മലയാളം, ഇംഗ്ലീഷ്-ഹിന്ദി എന്നിവ.

2. ഏകദേശം എല്ലാ ഭാഷകള്‍ക്കും വേണ്ടിയുള്ള സ്‌പെല്‍ ചെക്കര്‍

3. ഏതൊരു ഭാരതീയ ഭാഷയില്‍ നിന്നും മറ്റൊരു ഭാരതീയ ഭാഷയിലേക്ക് ലിപിമാറ്റം ( Transliteration ) നടത്താനുള്ള സംവിധാനം

4. ഭാഷാ നിയമങ്ങള്‍ അനുസരിച്ചുള്ള വാക്കുകളുടെ അകാരാദിക്രമം ( Sorting ) ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റങ്ങളിലൊക്കെ ഈ ഫീച്ചര്‍ വന്നു കൊണ്ടിരിക്കുന്നതേ ഉള്ളൂ.

5. ഇന്‍ഡിക് സൗണ്ടെക്‌സ് സംവിധാനം. അമേരിക്കയിലും മറ്റും സന്‍സസിന് ഇംഗ്ലീഷ് സൗണ്ടെക്‌സ് ധാരാളമായി ഉപയോഗിച്ചു വരുന്നുണ്ട്.. ഒരേ പോലെ ഉച്ചരിക്കുന്ന വാക്കുകള്‍/പേരുകള്‍ ഏതു ഭാരതീയ ഭാഷയിലെഴുതിയാലും ഇതുവെച്ച് ഒരു ഡാറ്റാശേഖരത്തില്‍ നിന്നും കണ്ടെത്തുക അനായാസമാകും.

6. നേരത്തേ പറഞ്ഞ ഉച്ചാരണം കൂടാതെ എഴുത്തിലെ വ്യതിയാനങ്ങളും കണക്കിലെടുത്തുകൊണ്ട് 'ഏകദേശ തെരയല്‍' ( Inexact search system ). ഇതിലും വേറൊരു ഭാഷയിലെഴുതിയ ഡാറ്റയില്‍ നിന്നും മറ്റൊരു ഭാഷ ഉപയോഗിച്ച് തെരയാം.

7. ഗ്രിഗോറിയന്‍ കലണ്ടറും, ശകവര്‍ഷവും തമ്മിലുള്ള പരസ്പര തിയ്യതികള്‍ കണ്ടുപിടിക്കല്‍

8. ആര്യഭടന്‍ പ്രാബല്യത്തില്‍ കൊണ്ടുവന്നു എന്ന് പറയപ്പെടുന്ന പരല്‍പേര് അല്ലെങ്കില്‍ കടപയാദി എന്ന ഇന്ത്യന്‍ സംഖ്യാസമ്പ്രദായം ഉപയോഗിച്ച് വാക്കുകളില്‍ നിന്നും അവ പ്രതിനിധാനം ചെയ്യുന്ന സംഖ്യ കണ്ടുപിടിക്കല്‍. ഉദാഹരണത്തിന് ചണ്ഡാംശുചന്ദ്രാധമകുംഭിപാല' എന്ന വാക്കു് 31415926536 എന്ന pi യുടെ മൂല്യത്തെ പ്രതിനിധീകരിക്കുന്നു,

9. മേല്‍പ്പറഞ്ഞ സംഖ്യാ സമ്പ്രദായമാണ് മേളകര്‍ത്താ രാഗങ്ങളിലെ 72 രാഗങ്ങളുടെയും പേരിനാധാരം. കൂടാതെ രാഗങ്ങളുടെ പേരുകള്‍ പ്രതിനിധാനം ചെയ്യുന്ന സംഖ്യകളില്‍നിന്നും ആ രാഗത്തിന്റെ ആരോഹണാവരോഹണങ്ങളിലെ സ്വരസ്ഥാനങ്ങളും ഗണിതശാസ്ത്രപരമായി നിര്‍ണയിക്കാം. ഇവയ്ക്കുള്ള സംവിധാനം

10. ഭാരതീയ ഭാഷകളെ 'justify aligned' ആയി എഴുതുമ്പോള്‍ ചെയ്യേണ്ട ഹൈഫണേഷന്‍ (വാക്കുകളെ മുറിച്ച് അടുത്ത വരിയിലേക്കാക്കല്‍)

11. വാക്കുകളെ ഉച്ചാരണഘടകങ്ങളായി ( Syllable ) പിരിക്കല്‍

13. ആസ്‌കി എന്‍കോഡിങ്ങ് മലയാളം ഡാറ്റ യൂണിക്കോഡിലേക്കും തിരിച്ചും മാറ്റാനുള്ള സംവിധാനം

14. ഡെവലപ്പര്‍മാര്‍ക്കാവശ്യമായ ചില സോഫ്റ്റ്‌വേറുകള്‍

ഇന്ത്യയിലെ ഏറ്റവും വലിയ ഭാഷാകമ്പ്യൂട്ടിങ്ങ് സംരംഭമാണ് ശില്പ. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിലെ സന്തോഷ് തോട്ടിങ്ങല്‍ ആരംഭമിച്ച ഈ പദ്ധതിയില്‍ വസുദേവ് കമ്മത്ത് , ജിഷ്ണു, ഋഷികേശ് തുടങ്ങി നിരവധി ഡെവലപ്പര്‍മാര്‍ ഇപ്പോള്‍ പ്രവര്‍ത്തിക്കുന്നു. കഴിഞ്ഞ 'ഗൂഗിള്‍ സമ്മര്‍ ഓഫ് കോഡി'ന്റെ ഭാഗമായി BITS പിലാനിയില്‍ പഠിക്കുന്ന നിതിന്‍ ഷാജി ഈ സംരംഭത്തിന്റെ വെബ് പുനക്രമീകരണം നടത്തുകയുണ്ടായി

അഭിപ്രായങ്ങളൊന്നുമില്ല:

ഒരു അഭിപ്രായം പോസ്റ്റ് ചെയ്യൂ